今月初め、OpenAIは初の開発者会議「OpenAI DevDay」を2か月後に開催することを公式発表し、白熱した議論を巻き起こした。多くのネットユーザーは、OpenAIがカンファレンスでGPT-4-Visionなどの大規模なマルチモーダルモデルをリリースするだろうと推測した。 今日、OpenAI のマルチモーダル大規模モデルに関する新しいニュースがあります。 マルチモーダル大型モデル「ゴビ」は実現できるか?海外メディアThe Informationによると、OpenAIとGoogleは次世代のマルチモーダルビッグモデルを目指し、長期にわたるビッグモデル競争を行っている。このようなモデルは、テキストからグラフを作成するタスクを処理したり、コードを生成したり、視覚的なチャートを出力したりできます。 OpenAIの共同創設者兼社長グレッグ・ブロックマン氏(左)とGoogle DeepMindの共同創設者兼CEOデミス・ハサビス氏(右) このコンペティションでは、Googleが数日前にマルチモーダルMLツールGeminiの小規模なテストを開始したとの噂がありました。GPT-4のトレーニングよりも5倍の計算能力があり、マルチモーダル機能が大幅に向上しています。 Google は、大規模モデルの分野で OpenAI に対する不利を覆したいと考えている。しかし明らかに、OpenAI は将来このようなことが起こることを望んでいません。 事情に詳しい人物によると、OpenAIはGPT-4をジェミニが提供するものと同様のマルチモーダル機能と組み合わせることに懸命に取り組んでいるという。 OpenAIは3月にGPT-4をリリースした際に、関連するマルチモーダル機能をプレビューしたものの、それを宣伝することはなかった。数か月後、OpenAI は GPT-Vision 機能をより大規模にリリースする準備をしていましたが、正式にはリリースされませんでした。 なぜまだローンチされていないのかについて、OpenAIは主に、顔認識による人物追跡や人間になりすまして認証コードを自動的に解読するなど、視覚機能が不適切に使用されることを懸念している。しかし、時間が経つにつれて、OpenAI はようやくこれらの問題によって生じた技術的な懸念に対処できるようになったようです。 そのため、GPT-Visionの後、OpenAIはGobiというより強力なマルチモーダル大規模モデルを立ち上げると報告されています。 GPT-4 とは異なり、Gobi は最初からマルチモーダルになるように設計されました。しかし、OpenAIはまだモデルのトレーニングを開始していないため、Gobiが最終的にGPT-5になるかどうかを判断するのは時期尚早です。 さらに、OpenAIはGoogleがGeminiをリリースする前にGobiを打ち上げることも望んでいる。 画像出典: Twitter @amir このマルチモーダルなビッグモデル競争で誰が勝利するかについては、今後見守るしかない。 OpenAIも新しいモデルをリリースした同時に、OpenAIはマルチモーダル大規模モデルの公開に加えて、新しいモデルも「ひっそりと」リリースしました。 多くのネットユーザーがOpenAIチームからこの手紙を受け取っています。 OpenAI は、text-davinci-003 などの以前のモデルの一部を置き換えるために GPT-3.5-Turbo-Instruct をリリースしました。 このモデルは InstructGPT 3.5 クラスのモデルであり、ターボ モデルと同じ速度を維持しながら、text-davinci シリーズなどの以前の Instruct モデルと同様にトレーニングされます。このモデルの価格はGPT-3.5-turbo 4Kと同じです。 Twitter ユーザー @hwchase17 は、このバージョンのモデルは古い完了エンドポイントで使用できると述べ、このバージョンは「おしゃべり」だがエージェントとしては理想的ではないと述べました。 一部のネットユーザーは、使用中に、このモデルは場合によってはより良い仕事をすることができると述べた。たとえば、ユーザーがより大きなコード ブロックを生成したい場合、例が示されるだけでなく、非常に長いコードが直接生成されます。 |
>>: ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される
消費者の実際の購買行動や実際のユーザーレビューのビッグデータ分析に基づいた中国初の「2015年中国電...
人工知能の分野で画期的な進歩が起こったばかりであり、サイバーセキュリティに携わっている人であれば、そ...
New Atlas によると、ETH チューリッヒの ANYmal ロボットは、4 本足で歩くだけ...
メタバースにおける 3D クリエイティブ ツールの需要の高まりに対応するため、3 次元コンテンツ生成...
テンセントは11月20日、移動ロボット研究における新たな進展を発表し、四足移動ロボット「ジャモカ」と...
[[393110]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
Googleの検索事業責任者アミット・シンガル氏は最近、Google+に記事を掲載し、過去1年だけで...
マウスクリックプログラミングは、プログラミングの世界では常に新しいトレンドとなっています。簡単に言え...
人工知能が高校の教室に導入されつつあります。最近、我が国初の中学生向けAI教科書『人工知能の基礎(高...
トム・ミッチェル教授は、スクワレルAIラーニングからの最高AI責任者としての招待を受け入れたことを正...
[[202148]]レベル2初心者になる仕事で機械学習の実際の応用に遭遇したのはこれが初めてでした。...