OpenAI が ChatGPT にマルチモーダル入力機能を追加しました。ご存知ですか?

OpenAI が ChatGPT にマルチモーダル入力機能を追加しました。ご存知ですか?

OpenAIのCEO、サム・アルトマン氏は昨夜Twitterで、ChatGPTに音声と画像の機能が追加されたと発表した。つまり、ChatGPT は、見る、聞く、話すことをサポートします。

今回ChatGPTが発表した音声・画像機能は、より直感的な新しいタイプのインターフェースを提供し、ユーザーは音声会話をしたり、自分の言っていることをChatGPTに伝えたりできるようになると報告されています。

アップデートされた ChatGPT は音声入力と画像入力をサポートするため、ユーザーはロボットと簡単にコミュニケーションできるようになります。音声入力機能は iOS および Android プラットフォームでのみ利用可能で、画像入力機能はすべてのプラットフォームで利用可能になります。

使用例

新しい機能は今後 2 週間以内に Plus ユーザーに提供される予定です。

<<: 

>>:  ハーバード大学の研究によると、GPT-4は一部の企業従業員のパフォーマンスを40%向上させることができるという。

ブログ    

推薦する

今回はホーキングの言うことを聞かなかった!人工知能が人間に取って代わる、これが科学が進む道だ

科学の分野では、人類の科学技術の発展のスピードは実に速く、人工知能と比較すると、すでに基本的に活用で...

...

...

初級レベルの仕事に加えて、機械は「上級ホワイトカラー労働者」として人間に取って代わることもできる。

編集者注: 人工知能技術によって引き起こされる失業危機は、業界ではよく話題になります。人々がもっと議...

ソフトウェアの欠陥予測のためのソフトウェア可視化と転移学習の活用

論文のデータセットとコードはオープンソース化されています: https://zenodo.org/r...

AIが材料科学に革命を起こす! Google DeepMindの新しい研究がNatureに掲載され、一度に220万の新素材を予測した。

たった 1 つの AI を使って、人類が生み出すのに 800 年近くかかった知識を獲得しました。これ...

Transformer モデルを使用した時系列予測の Pytorch コード例

時系列予測は永続的なトピックです。自然言語処理の分野での成功に触発されて、トランスフォーマー モデル...

AIに単純なことを教える: ゼロから最初のニューラルネットワークを構築する

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

ゲスト:石淑明執筆者: Mo Qi校正:趙雲「ほとんどの研究は一つの点を中心に展開する傾向があるが、...

AIとIoTが建設業界に価値をもたらす方法

モノのインターネット (IoT) センサーは主に運用スタックの可視性を提供し、リアルタイムで正確な運...

...

...

...

OpenAIのSora、中国は追いつけないのか?

春節の時期にOpenAIのSoraが大人気でした。私も見てみましたが、正直GPT4が出た時ほどの衝撃...

...