メールを受け取りましたか？ GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

今月初め、OpenAIは初の開発者会議「OpenAI DevDay」を2か月後に開催することを公式発表し、白熱した議論を巻き起こした。多くのネットユーザーは、OpenAIがカンファレンスでGPT-4-Visionなどの大規模なマルチモーダルモデルをリリースするだろうと推測した。

今日、OpenAI のマルチモーダル大規模モデルに関する新しいニュースがあります。

マルチモーダル大型モデル「ゴビ」は実現できるか？

海外メディアThe Informationによると、OpenAIとGoogleは次世代のマルチモーダルビッグモデルを目指し、長期にわたるビッグモデル競争を行っている。このようなモデルは、テキストからグラフを作成するタスクを処理したり、コードを生成したり、視覚的なチャートを出力したりできます。

OpenAIの共同創設者兼社長グレッグ・ブロックマン氏（左）とGoogle DeepMindの共同創設者兼CEOデミス・ハサビス氏（右）

このコンペティションでは、Googleが数日前にマルチモーダルMLツールGeminiの小規模なテストを開始したとの噂がありました。GPT-4のトレーニングよりも5倍の計算能力があり、マルチモーダル機能が大幅に向上しています。 Google は、大規模モデルの分野で OpenAI に対する不利を覆したいと考えている。しかし明らかに、OpenAI は将来このようなことが起こることを望んでいません。

事情に詳しい人物によると、OpenAIはGPT-4をジェミニが提供するものと同様のマルチモーダル機能と組み合わせることに懸命に取り組んでいるという。 OpenAIは3月にGPT-4をリリースした際に、関連するマルチモーダル機能をプレビューしたものの、それを宣伝することはなかった。数か月後、OpenAI は GPT-Vision 機能をより大規模にリリースする準備をしていましたが、正式にはリリースされませんでした。

なぜまだローンチされていないのかについて、OpenAIは主に、顔認識による人物追跡や人間になりすまして認証コードを自動的に解読するなど、視覚機能が不適切に使用されることを懸念している。しかし、時間が経つにつれて、OpenAI はようやくこれらの問題によって生じた技術的な懸念に対処できるようになったようです。

そのため、GPT-Visionの後、OpenAIはGobiというより強力なマルチモーダル大規模モデルを立ち上げると報告されています。 GPT-4 とは異なり、Gobi は最初からマルチモーダルになるように設計されました。しかし、OpenAIはまだモデルのトレーニングを開始していないため、Gobiが最終的にGPT-5になるかどうかを判断するのは時期尚早です。

さらに、OpenAIはGoogleがGeminiをリリースする前にGobiを打ち上げることも望んでいる。

画像出典: Twitter @amir

このマルチモーダルなビッグモデル競争で誰が勝利するかについては、今後見守るしかない。

OpenAIも新しいモデルをリリースした

同時に、OpenAIはマルチモーダル大規模モデルの公開に加えて、新しいモデルも「ひっそりと」リリースしました。

多くのネットユーザーがOpenAIチームからこの手紙を受け取っています。 OpenAI は、text-davinci-003 などの以前のモデルの一部を置き換えるために GPT-3.5-Turbo-Instruct をリリースしました。

このモデルは InstructGPT 3.5 クラスのモデルであり、ターボモデルと同じ速度を維持しながら、text-davinci シリーズなどの以前の Instruct モデルと同様にトレーニングされます。このモデルの価格はGPT-3.5-turbo 4Kと同じです。

Twitter ユーザー @hwchase17 は、このバージョンのモデルは古い完了エンドポイントで使用できると述べ、このバージョンは「おしゃべり」だがエージェントとしては理想的ではないと述べました。

一部のネットユーザーは、使用中に、このモデルは場合によってはより良い仕事をすることができると述べた。たとえば、ユーザーがより大きなコードブロックを生成したい場合、例が示されるだけでなく、非常に長いコードが直接生成されます。

<<:

>>: ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

メールを受け取りましたか？ GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

マルチモーダル大型モデル「ゴビ」は実現できるか？

OpenAIも新しいモデルをリリースした

調査：CIOはAIの実験や投資に依然として慎重

目から鱗！ヘルスケアと自動車業界における AI の興味深い応用例 11 選

AIは大学入試のエッセイを次のように書きました。「ネイティブの手、素晴らしい手、普通の手はすべて手であり、コピーの手もまた手です...」

本物と見間違えるほどリアルなAI変顔技術は本当に完璧なのか？

AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

RNN と LSTM は弱いです!注目モデルは王様！

AI による IoT センサー電力の管理

LLM評価レビュー論文が出版され、3つの側面から包括的にまとめられ、データベースも掲載されている

推薦する

今後の国内人工知能産業の発展における5つの大きなトレンド

幾何学を利用してディープラーニングモデルのパフォーマンスを向上させることは、コンピュータービジョン研究の未来です。

金融AIが外灘サミットでデビュー: 完全な金融知識を備え、同時に数百万人と会話し、金融アドバイスを提供可能

2021年に注目すべき5つのAIトレンド

650 億のパラメータを持つ大規模モデルの事前トレーニングソリューションは、オープンソースであり、市販されています。スターオープンソースプロジェクトによる LLaMA トレーニング速度が 38% 向上

Dialogflow、Lex、Watson、Wit、Azure Robots の比較

Google Gemini の大きな転換？ Stanford Meta Chinese は推論性能が GPT-3.5 よりも優れていることを証明

AI実践者の意見：ディープラーニングは強力だが、過大評価してはいけない

人工知能と仮想現実のつながり

医療用ロボットの具体的な用途は2つありますか?

幼稚園のAI教材を公開！プログラミング学習は幼稚園から始まる