おそらく、これを敢えて実行できるのはマスク氏だけだろう。 Microsoft の論文を証拠として使って OpenAI を訴える。 マイクロソフトリサーチが1年前に発表した論文「AGIの火花:GPT-4の初期実験」が、現在マスク氏の訴訟で重要な役割を果たしている。 この論文では、初期の GPT-4 の機能を分析し、GPT-4 は初期の AGIとみなすことができると主張しています。 この論文は昨年発表された際に大きな注目を集め、1年間で1,500回引用された。 マスク氏の訴訟では、マイクロソフトの科学者自身がそれを認めたとされている。 この観点から見ると、OpenAI の最新の対応は自らを侮辱するものではなかろうか? 必ずしもそうではありません。 この記事「Sparks of AGI」が当時非常に人気を博したのは事実ですが、その人気の大部分は論争によるものでした。 多くの人は、この論文は厳密さが足りず、単なる誇大宣伝だと考えています。さらに、この論文は査読を受けておらず、arxiv にアップロードされただけであり、結果を再現することはできません。 それで、この論文には何が書いてあるのでしょうか?なぜマスク氏はあえて大騒ぎするのでしょうか? その紙には何と書いてあるのですか?この論文では、主に2022年秋にGPT-4の初期バージョンをテストしました。 この研究は、GPT-4 が言語スキルを持っているだけでなく、複雑で新しい問題も解決できることを示唆しています。そのタスクは、数学、コーディング、医学、法律、視覚などに及びます。 これらのタスクでは、GPT-4 のパフォーマンスは人間のレベルに近く、ChatGPT などの以前の LLM パフォーマンスをはるかに上回っています。 したがって、この研究は重要な結論を示しています。
これを踏まえて、研究チームは、真の意味でAGIが備えるべき要素についてさらに探求しました。 論文全体は 150 ページを超えており、GPT-4 のマルチモーダル、コーディング、数学、常識などの機能をテストし、多数の例を通じて結論を導き出しています。 コーディング能力のテストを例にとると、GPT-4とChatGPTは同じプロンプトワードを受け取り、研究者は回答結果を分析します。 GPT-4 のいくつかのデータ結果は注目に値します。 たとえば、サンプルがゼロの場合、HumanEval での GPT-4 コーディング能力の精度は 82% に達します。 たとえば、実際の質問応答では、GPT-4 は ChatGPT よりもはるかに優れたパフォーマンスを発揮します。 この研究では、自己回帰アーキテクチャに基づく GPT-4 の限界についても議論されました。 たとえば、モデル自体は対応する知識と能力を持っていますが、次のトークンを予測するメカニズムがモデルの「内部対話」を妨げるため、間違った質問に答えてしまいます。 最後に、論文の著者らは AGI に関する一連のアイデアも提案しました。 この論文はGPT-4がリリースされてから1週間後に発表され、当時業界から大きな注目を集めました。 「AGI の閃光」により、すべてが終わったと多くの人がため息をついた。 しかし、疑問点もたくさんあります。この結論は少し誇張されていると思う人も多いのではないでしょうか? さらに、研究チームは、使用されたテスト方法の一部は科学的に十分に厳密ではなかったことを認めており、主にGPT-4の優れた機能を実証したいと考えていました。 しかし、確かなのは、この論文が GPT-4 と AGI を強力に結び付け、GPT-4 に関する議論をさらに盛り上げ、AGI 議論ブームの重要な原動力となったことです。 しかし、それがマスク氏によるOpenAIに対する訴訟の鍵になるとは誰が想像しただろうか。 マスク氏は一体何をしたいのでしょうか?マスク氏が問題を起こすときは、必ず何か隠された動機がある。 昨年、彼と他の何千人もの有力者たちは共同で AI 開発の 6 か月間の一時停止を要求しました。しかし、彼は方針を転換してカードを備蓄し、大規模なモデルの開発を開始し、すぐに AI スタートアップ企業 xAI を設立しました。 今年 OpenAI を訴える主な目的は、同社にオープンソース化を促すことです。 GPT-4 が AGI であると主張することは、OpenAI に道徳的なプレッシャーをかけることにもなります。彼らは一方ではオープンソース化を求め、他方では「AGI アルゴリズムはマイクロソフトにライセンス供与されるべきではない」と提案した。 そのため、この訴訟が「すべてを遅らせる」ことになると当然ながら疑う人もいる。 同時に、マスク氏のGrokも着実に進歩しており、Grok-2がリリースされました。 昨年の OpenAI 宮殿の戦いの前後、マスク氏がインタビューでAGI が今から 3 年以内に実現すると発言したことは特筆に値します (12 月 23 日)。
当時、彼はサム・アルトマンについて複雑な気持ちだったとも語っていた。 現時点では、OpenAI は GPT-4 が AGI であることを否定する以外、それ以上の反応を示していない。 一部の法律専門家は、マスク氏が挙げた一連の見解を明確な条件として執行するのは難しいと考えている。 「訴訟は無理があるかもしれない」が、「強力な政策的主張」をしている。 業界の大物の中には、マスク氏の行動はすっぱいブドウのようなものだと考える人もいる。 マーカス氏は、マスク氏の行動により、OpenAIはAGIに到達していないことを認めざるを得なくなったが、それを認める第三者を見つけることができるだろうと冗談を言った。
|
<<: 清華大学とハルビン工業大学は大規模なモデルを 1 ビットに圧縮し、携帯電話で大規模なモデルを実行するという夢が実現しつつあります。
>>: Llama3は7月にリリースされます!現在微調整中です!
今日、AI クラウド サービスは、データ サイエンティストや開発者を惹きつけ、自社のプラットフォーム...
1. NeMoフレームワークの紹介NVIDIA NeMo は、PyTorch と PyTorch L...
[[349063]] [51CTO.com 速訳] 機械学習技術を使って仮想通貨を追跡できるのか?...
人工知能 (AI) とディープラーニングはあらゆるところに存在し、今や都市の景観を一変させる可能性を...
10月12日、全米レコード協会(RIAA)は、人工知能(AI)による音声複製が著作権侵害の潜在的な脅...
3月6日、南京大学は人工知能学院の正式な設立を発表した。一流の人工知能基礎研究拠点と人材育成拠点の構...
LLM について議論するときは、必ず「人間のフィードバックによる強化学習 (RLHF)」と呼ばれるプ...
人間の知能は「マルチモーダル学習」の総体であり、分類の境界を越えてさまざまな情報源や形式からの情報と...
[[192284]]回帰は幅広い概念です。その基本的な概念は、変数のグループを使用して別の変数を予測...
AMD のソフトウェアおよびハードウェア システムは、GPT-3.5 レベルで大規模なモデルをトレ...
サーバー負荷分散を行う際には、ラウンドロビン、HASH、最小接続、応答時間、加重など、さまざまな負荷...
著者 | 魏耀成魏ナレッジ グラフの視覚化により、ナレッジ グラフ データをより直感的に表示および分...
近年、世界的な技術開発の加速化が進み、新世代の情報通信技術が次々と導入され、数多くの新たなビジネスモ...