OpenAI の COO が ChatGPT のリリース、開発者デー、そして Altman の考えについて語る

OpenAI の COO が ChatGPT のリリース、開発者デー、そして Altman の考えについて語る

「アルトマン氏をご存知なら、彼は話題を素早く切り替えるのが好きなので、私たちが一つの話題に多くの時間を費やしているという事実は、それが重要であることを意味します」と、OpenAIの最高執行責任者であるブラッド・ライトキャップ氏はCNNビジネスに語った。「これは議論の余地があります。人々はこれが正しいことなのか、時間を費やす価値があるのか​​、100%確信していません。」

ライトキャップによると、当時、OpenAI は GPU と容量が限られており、主に開発者や企業向けのツールを構築する会社であると自認していたという。 CEO のアルトマン氏は、モデルとのテキストベースのやり取りには重要で個人的な何かがあると主張し、「試してみる」ことを強く主張していたことを彼は思い出す。

その行動は功を奏した。 OpenAIによると、ChatGPTは史上最も急成長している消費者向けアプリの記録を更新し、現在、毎週約1億人のアクティブユーザーを抱え、Fortune 500企業の92%以上がプラットフォームを使用している。 PitchBookによると、マイクロソフトは今年初めに同社にさらに100億ドルを投資し、今年最大のAI投資となった。 OpenAIは、評価額860億ドルとなる取引に向けて交渉中であると報じられている。

しかし最近、これらのマイルストーンは、同社にとってジェットコースターのような数週間の出来事によって影を潜めてしまった。先月、OpenAIの取締役会はアルトマン氏を解任し、複数の辞任、あるいは辞任の脅迫を引き起こした。その中には、OpenAIの従業員のほぼ全員が署名した公開書簡が含まれ、マイクロソフトを含む投資家の間で騒動を引き起こした。一週間も経たないうちに、アルトマンは会社に復帰した。 OpenAIは水曜日、セールスフォースの元共同CEOブレット・テイラー、元財務長官ラリー・サマーズ、QuoraのCEOアダム・ダンジェロを含む新しい取締役会を発表した。マイクロソフトは取締役会において投票権のないオブザーバーの地位を与えられた。

私は先月、LightCap の初の対面イベントである Dev Day の後に同社に連絡を取り、リーダーシップの交代後の先週、再び簡単に話をしました。

会話の編集された記録は以下の通りです。

ChatGPT 記念日が近づいてきました。昨年の今頃、Dall-E がデビューする数週間前、Dall-E は研究プレビューの段階にあり、Steady Diffusion は大きな注目を集めていましたが、チャットボットはまだ存在していませんでした。それはどんな感じでしたか?

現時点では、私たちは開発者向けのツールを構築する会社であると強く認識しています。そのため、私たちにとってこれは考えなければならない新しいものであり、一般の人々が学んで使用できるものでした。

Dall-E については、春にリリースして、基本的には人々が使用していて、大きな反響と興奮が見られましたが、Dall-E は視覚的なメディアであるため、これらのツールに対する消費者の関心がピークに達するだろうと常に考えていました。そのため、ChatGPT を検討していたとき、Dall-E を成功の基準として、どれだけの人が使用するか、誰が興味を持つか、短期間使用するかどうか、そして、これは本当のツールではなく、おもちゃのようなものだと判断するかどうかという点で使用していたと思います。

ChatGPT がどれだけ大きくなるか賭けていたことを覚えています。使用量のピーク時には、いつでも 100 万人の同時ユーザーが存在するだろうという、もっと積極的な賭けをしていたと思います。私たちはそれを想定し、財務担当者として、すべてのモデルをそれに基づいて実行しようとしました。これが私たちが置かれている状況であり、これほど間違っていることはない。

これまでのビジネスチャンスの予測はどのようなものですか? 展開と採用は予想とどのように異なっていましたか?

当時は、それが何に役立つかをすべて知る方法はありませんでした。それがこのテクノロジーの素晴らしいところだと思います。非常に幅広く役立ち、ツールが必要だと知らなかった世界のあらゆる場面や生活のあらゆる場面にツールのように浸透します。

そのため、事前にビジネス分析を行い、「さて、人々はこれを何に使うのか?人々がこれを継続的に消費する動機は何なのか?」と考え、それに有用性を割り当てようとします。 「人々はこれを使って何かを作るかもしれない、これやあれをするかもしれない」と考えてみましょう。ある意味、振り返ってみると、人々がこれを使って何をするかがわかっていても、当時は思いもよらなかったことがたくさんあるのです。それが、これがなぜこれほど大きなものになるのかを正当化するのです。

おそらく、これには興味深い教訓があります。それは、ビジネス分析が必ずしもすべてを語ってくれるわけではないが、何かがどこで幅広い有用性と幅広い価値を持ち、どこで新しいものとして人々の共感を得るのかを特定し、本当に理解できることが、時にはビジネス分析よりも重要になるということです。

8 月には、フォーチュン 500 企業の 80% が ChatGPT を導入しました。11 月現在、その数は 92% です。ツールを導入していない残りの 8% については、何か傾向に気づきましたか?

私の推測では、情報ビジネスやサービスビジネスよりも、商品の生産が中心という意味で、重工業、石油やガスなどの大規模な資本集約型産業、または重機を多く使用する産業になると思います。

あなたの意見では、現在 AI で最も注目されている点と、最も注目されていない点は何ですか?

過大評価されている点は、一挙に大きなビジネスの変化をもたらす可能性があるということだと思います。私たちは、私たちに頼りたい多くの企業と話をしますが、彼らは「収益を前年比で 15% 増やしたい」とか「このコスト ラインから X 百万ドルのコストを削減したい」など、これは長い間やりたかったことだと言います。そして、特効薬はほとんどなく、AI でこの問題を完全に解決できる方法は決してありません。これは、世界が本当に大きくて複雑であり、これらのシステムはまだ進化しており、まだ初期段階にあることを証明しているだけだと思います。

私たちが実際に目にしているのは、そして過小評価されていると思うのは、これらのシステムがエンドユーザーにもたらす個人のエンパワーメントと実現可能性のレベルです。その話は語られておらず、ユーザーや顧客から聞くのは、ツールによって以前はできなかったことができるようになったことで、今ではスーパーパワーを手にした人々についてです。

GenAI のビジネスについてお話ししましょう。批評家は消費者向けアプリケーションは豊富にあると言いますが、飽和するリスクはあるのでしょうか? このテクノロジーは企業にとって具体的に何を意味するのでしょうか?

私たちはまだ非常に初期の段階にあり、非常に高い頻度で実験と試行錯誤を続けることが非常に重要だと考えています。過去のテクノロジーの変化の歴史的傾向を見ると、初日からテクノロジーを正しく行うことが非常に難しい、実験という非常に重要な期間が常に存在します。そして、最終的にそこに到達します。テクノロジーの最終状態、つまりこの点に最終的に収束するのは、本当に多くのことを試して、何が機能し、何が機能しないかを確認した後です。その後、人々は機能するものを基にして、次に最高のものを作り出すことができます。

これについての私の考えは、このテクノロジーの上に構築する最も重要なものは、実際にはまだ作成されていないものであるということです。なぜなら、これらのツールを使用してその機能を実際に理解し、それらのツールをテクノロジーの他の側面と組み合わせて、部分の合計よりも優れたものを作成するには、いくつかのサイクルが必要であり、これは予想されることであり、非常に健全なことだと思います。

数年前、トラック輸送における AI の利用レベルに人々は驚きました。トラック輸送は伝統的すぎる業界だと考える人もいましたが、現在では AI はほぼすべての業界に浸透しています。近年の導入傾向に関して、一貫した傾向はありますか。つまり、業界が AI を新しい方法や異なる方法で使用していて、特に驚いたことはありますか。

テクノロジー業界では間違いなく高いレベルの魅力があり、私たちが見ているものの 1 つは、それが優れた技術アシスタントであるということです。ソフトウェア エンジニア、機械エンジニア、化学者、生物学者など、どの分野の反対側にも膨大な知識ベースがあり、それを習得しているかどうかが、ある程度、あなたの有効性を決定します。

キャリアを積む人たちは、その分野についてできる限り多くの知識を吸収することで、ただその分野をマスターしようとしているだけだと思います。特に生物学、化学、AIなど一部の分野では、その分野の文献は常に進化し、拡大しています。新しい発見があり、新しい研究が行われています。それ自体が最も驚くべきことかどうかはわかりませんが、私たちが目にした最もクールなことの1つは、ChatGPTがアシスタントのように、この点ではほとんど研究アシスタントのように動作することです。2022年11月には予想していなかった方法で、これらの業界から引き寄せられていると感じました。

ChatGPT Enterprise Editionのリリースから数か月が経ちましたが、開発期間1年未満でBlockやCanvaを含む20社以上の企業と提携してアプリをリリースしたと記憶しています。具体的には、利用はどのように増加しましたか? 発売以来の最大の顧客は誰ですか? また、それが OpenAI の収益にどの程度貢献しましたか?

熱意は信じられないほどで、私たちはまだ小さなチームなので、現在は製品のセルフサービスを提供していませんが、すぐに提供する予定です。ただし、できるだけ多くの関心のある関係者を通じて提供するよう努めてきました。

過去 2 か月間、私たちが実装してオンボーディングした最初の数名のお客様に製品の価値を理解していただくことに重点を置きました。現在も数万人の順番待ちリストの処理に取り組んでおり、2024 年の目標として、すべての人に製品を提供できるようにしたいと考えています。

ChatGPT Enterprise が登場しましたが、現在 OpenAI の最大の収益源は何でしょうか? 今後どのように進化していくと思いますか?

私たちは、何を構築し、どのように製品をリリースするかについて、収益中心のアプローチを取ることはほとんどなく、ほとんどの場合、使用法中心のアプローチを取ります。つまり、構築するものが 2 つの要件のいずれかを満たす必要があるかどうかに非常に重点を置きます。つまり、開発者が構築するための非常に便利なツールである必要があるか、ユーザーが製品にさらなる価値を見いだせる非常に便利な抽象化である必要があるかです。これが、私たちが製品の発売について基本的に考えている方法です。

たとえば、GPT を見ると、実際にはかなり完璧なマッピングです。これはチェックボックスのようなものです。パート 2 で、「これは ChatGPT のインテリジェンスのパワーを抽象化し、非常に具体的なものに向け、適切なコンテキスト、適切なツール、適切な接続を提供して、特定の問題を本当にうまく解決できるようにする方法ですか?」と尋ねます。これは、仕事に役立つものかもしれませんし、生活に役立つものかもしれませんし、単に楽しいものかもしれません。つまり、楽しい GPT を作成して、それを持っているとクールなものになるだけかもしれません。

ChatGPT がマルチモーダル化 (画像生成とその他のツールを同じサービスで提供) を進めることは、Dev Day で説明したように、同社にとって大きな優先事項でした。なぜそれが重要なのか、少し教えていただけますか?

世界はマルチモーダルです。人間が世界を処理し、世界と関わる方法、つまり私たちが見るもの、聞くもの、話すものについて考えてみると、世界は言葉よりもはるかに大きいのです。そのため、私たちにとって、テキストとコードは単一のモダリティ、単一のインターフェースであり、それらのモデルがいかに強力で、何ができるかは、私たちにとって常に不完全なものでした。

そこで、コンピューターが世界で何が起こっているかを見て、それを説明したり、関わったり、推論したりできる視覚機能の開発に取り組み始めました。これはおそらく、私が OpenAI で 5 年間働いてきた中で見た中で最も驚くべきことでした。私はまだ、それが何を意味するのかを完全に理解できていませんが、目を細めて見れば、以前は不可能だったことが可能になり始めていることがわかってきます。

たとえば、低遅延かつ高品質で視覚障害者が周囲の世界をよりよく理解できるようにするといった単純なことを考えてみましょう。また、企業がデバイスをよりよく理解し、消費者が目の前にあるものにカメラを向けるだけでそれをわかりやすく説明できるような体験を生み出す方法についても考えてみましょう。人々が物事をよりよく理解し、分析するのに役立つ教育機能について考えてみましょう。多くの人は実際には視覚的に学習します。物事を見て、学習方法に適した方法でグラフィックと対話できる機能は、私たちが実現したまったく異なる機能です。

それが私を興奮させるのです。人間が世界と関わる方法にもっと合ったテクノロジーを使う方法が得られるのです。そして最終的にはテクノロジーをより人間らしくするのです。

OpenAI の GPT-4 大規模言語モデルは GPT-3.5 よりも信頼性が高い可能性が高いですが、潜在的な脱獄やバイアスの影響を受けやすいこともわかっています。Dev Day で発表された新しい Turbo バージョンの違いと、その解決策について教えてください。

AI モデルの透明性ツールである Turbo Model Cards をリリースする予定なので、技術的なベンチマークを参照するにはそこの方が適しているかもしれません。

これからの 1 年で一番期待していることは何ですか? 現在のバージョンではできないことが、GPT の将来のバージョンではできるようになると思いますか?

ここでの進歩の方向性は推論能力の質に沿っていると私は考えています。そして、人間が根本的に得意としていることについて考えてみると、それは、私たちがやりたいことや求められていることに特化した、さまざまな概念をまとめて、その要求に特化した創造的な方法で結果を生み出すことができることです。私たちは仕事で毎日それを行っており、アーティストとして毎日それを行っており、それが世界を創造する方法の基本となっています。

それが、私たちがテクノロジーに期待する方向性だと思います。テクノロジーは、はるかに高い推論力を備え、ますます複雑なタスクに対応し、高度な熟練度で実行するために必要な部分にそれらを分解する方法を見つけ出し、研究の観点からテクノロジーを安全にすることに重点を置きながら、実際に安全に実行できるようにすべてに取り組みます。システムの能力が向上するにつれて、安全バーも並行して動かし続ける必要があります。なぜなら、時間の経過とともにこれらのシステムはますます自律的になるため、安全面で適切な対応をしなければ機能しないからです。

過去 1 年間で、会社で特に印象に残った 1 日は何ですか?

GPT-4 をリリースした日は本当に特別な日でした。 GPT-4 をリリースする前に、私たちがどれだけ長い間この作業に取り組んでいたかを人々は知らないと思います。そのため、これがこれらのモデルの機能と、人々が本当に高品質の言語モデルと見なすものにおける真の変革となるだろうという、本質的なレベルの興奮と本質的な感覚がありました。それは、手に入れたらすぐに世界と共有したくなるようなものであり、チームとして、これらのものに対する世界の反応や、顧客、開発者、ユーザーがそれらに関与したときに見られる興奮から、私たちは多くのエネルギーを得ていると思います。この瞬間が近づいていることを知って、7、8か月間にわたって蓄積された興奮がありました。

私たちは Dev Day のような大規模なローンチイベントは行いませんが、私はむしろそちらの方が好きです。大規模なローンチの瞬間は楽しいですが、サンフランシスコのチームと一緒に 1 日を過ごすことができるからです。ローンチした瞬間、私たちはカフェにいて、みんながただ辺りを見回していました。興奮と安堵と疲労が入り混じった感じでしたが、みんな笑顔で、とても特別なことで、そんな瞬間はそうそうありません。

お祝いに帰省した時、個人的には何をしましたか?

夜遅くまで働いたと思います。

OpenAI は設立から 10 年足らずで、非営利企業から「研究と展開」を行う企業へと変貌を遂げました。その意味や組織構造、Microsoft の所有割合などについてよく質問されます。その経緯について、もう少し詳しく教えていただけますか?

大まかに言えば、私たちは常に、その中核において元々の OpenAI、つまり非営利団体 OpenAI を維持する構造を望んでいることを認識していました。私たちが会社を設立したとき、問題はそれをどうやって実現するかでした。そして、それが私が OpenAI に初めて入社したときに基本的にやったことです。つまり、OpenAI の使命、そしてその使命を体現する非営利団体を、真に新しい組織の中心に据える方法はあるかを考えることでした。

これが OpenAI に関する第一の特徴だと思います。OpenAI は通常の意味での企業ではなく、表面的にも構造的にも本質的にも非営利組織の使命の延長として設計された企業であり、安全で人類に広く利益をもたらす汎用人工知能を構築するという使命を持っています。これはおかしいように聞こえるかもしれませんし、確かに、より安価で少額の法定費用で会社を設立するより簡単な構造的、技術的な方法もありますが、私たちにとってこれを正しく行うことは本当に重要でした。私たちがそれを実現できたかどうかはわかりません。時間が経てばわかるでしょうが、良い点の 1 つは、この構造が非常に適応性が高いことです。私たちは時間の経過とともにより多くのことを学び、世界に適応する必要がありますが、この構造が成功するように確実に構築できますが、その中核となるのは、OpenAI の核となる使命を会社の存在理由として維持したいということだと思います。

Microsoft の所有権はどうなりますか?

組織構造の詳細についてはコメントしませんが、これは世界と連携して機能するように設計された組織構造であり、マイクロソフトは素晴らしいパートナーですが、私たちは、この組織構造を世界に広げ、非営利組織の使命に合うように世界と関わる方法について非常に慎重に考えています。ですから、それが利益上限モデルの基礎の一部でもあると私は思います。

あなたは OpenAI の設立以来、アルトマン氏と一緒に働いています。あなたの仕事の主な違いは何ですか? あなたの長所と短所は何ですか?

サムと一緒に仕事をするのは楽しいです。仕事は驚くほど速く進みます。そして、彼と私に共通していることは、どちらもすべてを迅速に進めるのが好きなことです。

私たちがお互いにバランスをとっているのは、サムが間違いなく未来志向であることだと思っています。彼は数年先の未来を生きようとしていると思いますし、数年先の未来を生きるべきだとも思っていますし、彼はその点でかなり優れています。私の仕事は、会社を構築する方法、ビジネスを構築する方法、顧客やパートナーとのエンゲージメント モデルを構築する方法が、今後 5 年以上の世界の姿を反映するだけでなく、今日達成したいことを実現するようにすることです。

私たちが直面している課題は、テクノロジーが急速に変化していることです。そのため、私たちは、このテクノロジーの使い方、セキュリティから機能まで私たちが行っている仕事の種類、製品についての考え方、そして製品の変化について、世界に啓蒙することに力を入れています。足元の地面が急速に変化しているときに、これを高速で正しく行うには、ある種の振り付けを本当に上手に行う必要があります。ですから、私が価値を付加できるのは、それをうまく行うことに集中すること、つまり、それをうまく行うために役立つ素晴らしいチームを構築することだと私は考えています。それができれば、一歩一歩進んでいけば、5年以内に正しい道を歩めると思います。

約 1 週間の間に、OpenAI では多くの変化が見られました。サムが会社に戻り、新しい取締役会の構成が発表されましたが、これが会社の日常業務にどのような影響を与えるかについて、どのようにお考えですか? 今後数か月以内に、さらなる構造的変化があると予想していますか?

日々の変化は予想していません。私たちの使命は同じであり、優れた研究、構築、そして顧客、ユーザー、パートナーへのサービス提供に引き続き注力していきます。当社は、現在、最初の取締役会を組織しており、今後、取締役会メンバーをさらに追加する予定であることをお知らせしました。

現在の会社全体の状況はどうですか?

この数週間、当社は言葉では言い表せないほど団結してきました。私はチームに深く感謝しており、このプロセスを通じて非常に協力的だったお客様やパートナーにも深く感謝しています。そのサポートは、私たちがミッションにさらに熱心に取り組み続けるための大きな刺激となり、個人的にも非常に力を入れています。

<<: 

>>:  「とんでもないAI画像拡大」が流行ってる!張張、それは驚きだ

ブログ    
ブログ    

推薦する

...

...

すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10

競争で優位に立つために、このブログでは、TensorFlow、PyTorch、sci-kit-lea...

EleutherAIが200億パラメータのGPT風モデルを発表: GPT-3とは異なり、無料でオープン

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Google ドキュメントでテキスト要約を自動的に生成できるようになりました。

私たちの多くは、毎日たくさんのファイルを処理する必要があります。新しい文書を受け取ったとき、通常は、...

MIT、指の爪ほどの大きさのドローンを作れるマイクロチップを設計

MITの研究者らが、指の爪ほどの小さなドローン用コンピューターチップを設計6月21日、Venture...

人工知能が高等教育を支援する:変化と持続

[[434825]]人工知能が教育に浸透する中で、我々は「静をもって動を制御する」という決意を持ち、...

Facebook は顔認識を中止することで本当にリスクを回避しているのでしょうか?人種差別は致命的である

名前にちなんでFacebookとしても知られるMateは、顔認識システムを無効化し、10億人以上の個...

AI を活用した検索と推奨はどれほど強力でしょうか?

著者 | ユン・チャオユーザーと情報の間には、検索か推奨のいずれかが存在します。百度の執行副社長であ...

中国における医療用人工知能の現状分析:製品検証から市場検証まで

2016年以降、人工知能と医療の融合があらゆる面で火花を散らし始めています。医療AIは数年にわたる開...

マッキンゼー:人工知能の最大の課題と機会

最近、多くの専門家とコミュニケーションをとる中で、人工知能の3つの重要なビジネス面が徐々に明らかにな...

...

2019 年に知っておくべき機械学習向け Python ライブラリ トップ 10

この記事では、開発者がデータを解析、クリーンアップ、表現し、既存のアプリケーションに機械学習を実装す...

王小川の大型模型製作の秘密のレシピが初めて公開されました。5つのステップ、完成まで2か月

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

比較ベースのアルゴリズムでは、5 つの要素をソートするのに 7 回のパスが必要だと言われるのはなぜですか?

結果のソートアルゴリズムの唯一の要件は、オペランドが全順序関係を満たすことです。 a≤b かつ b≤...