ChatGPTが話せるようになりました! Siriなどのスマートアシスタントへの直接的な脅威

ChatGPTが話せるようになりました! Siriなどのスマートアシスタントへの直接的な脅威

OpenAIは米国時間9月26日月曜日、チャットボット「ChatGPT」に音声会話機能を追加したと発表した。これにより、OpenAI はインテリジェント音声アシスタントの分野で Google、Apple、Amazon などのテクノロジー大手と直接競合することになります。

ChatGPT は 5 つの「ペルソナ」を使用してユーザーの質問に答えることができ、その声のトーンは Alexa や Siri などの音声アシスタントよりも実際の人間に近いように聞こえます。 OpenAIは、音声機能の追加は、より多くのユーザーを引き付けてChatGPTを使用し、対話してもらうための重要な方法であると述べた。

「それが我々が直面している課題だ」と、OpenAIの消費者向け製品担当副社長ピーター・デン氏はインタビューで語った。「最も難しいことの一つは、この素晴らしい技術を簡素化することだ」

OpenAIがChatGPTの音声機能のリリースを発表した同じ日に、Amazonは人工知能のスタートアップ企業Anthropicに最大40億ドルを投資する契約を発表した。これは今年初めのマイクロソフトによるOpenAIへの投資以来、人工知能分野で最大の取引であり、テクノロジー大手が注目の人工知能スタートアップ企業に賭けていることを示している。

Google、Amazon、OpenAIは、競争に勝つために先週いくつかのAI製品をリリースした企業である。既存のスピーカーへの統合は、企業がユーザーにチャットボットの使用と料金の支払いを促すための重要な方法の 1 つです。

アマゾンは、すでにアメリカの何百万もの家庭に導入されているAlexaホームスピーカーにチャットボットの「会話」機能を追加すると発表した。グーグルは、チャットボット「バード」の技術を自社の音声アシスタントに適用することを検討していると述べた。

現在、ChatGPT のモバイル アプリでは音声で質問できますが、チャットボットはテキストで回答します。冷蔵庫の中の材料の写真を見せたり、チャットボットにレシピの提案を依頼したりするなど、質問の一部としてチャットボットに画像をアップロードすることもできるようになりました。

音声と画像の機能が追加されたことで、ChatGPT は世界を「見て」「聞いて」、音声と画像の両方で応答できる真の「マルチモーダル」モデルになりました。マルチモーダル モデルは業界の競争の次の段階であり、多くの企業がより強力なモデルの開発を競っています。

音声アシスタントは長年にわたり、自動車、スマートフォン、テレビ、スマートスピーカーに搭載されており、毎日数え切れないほどの人々に使用されています。しかし、ほとんどの場合、音声アシスタントは、照明を点灯したり天気を報告したりするような単純な操作に限定されています。チャットボットの背後にある「ビッグ言語モデル」テクノロジーにより、音声アシスタントがより長く、より自然な会話をし、より複雑な質問に答えられるようになる可能性が開かれます。

投資家やアナリストは、チャットボットや画像生成器などの生成型人工知能の分野での競争への対応が遅いとしてアマゾンを非難している。アンスロピックの投資により、アマゾンは同スタートアップの研究者や技術にアクセスできるようになる。 Anthropicは元OpenAIの従業員によって設立され、以前はGoogleから投資を受けていた。

市場調査会社ガートナーのジム・ヘア副社長は、アマゾンは上記の措置を通じて、生成型人工知能の分野で積極的なプレーヤーであることを市場に示したとし、遅れをとっているという人々の印象を変えようとしていると述べた。

OpenAIは昨年11月にChatGPTをリリースし、チャットボットブームを巻き起こした。マイクロソフトはOpenAIと提携して同社の技術を活用し、グーグルは独自のチャットボット「Bard」を立ち上げた。

人工知能の研究者は、チャットボットの応答が実際の人間の応答と似ていることが多いため、人々がチャットボットを過度に擬人化する可能性があると警告している。これにより、ユーザーはロボットの知能や能力を誤って信頼する可能性があります。しかし、チャットボットは今でもメッセージをでっち上げて、それを本当の回答として伝えることが多く、AI 研究者はこれを「幻覚」と呼んでいます。

ChatGPT の新しいキャラクターの名前は Sky、Ember、Breeze、Juniper、Cove で、それぞれ口調やアクセントが異なります。スカイの声は、映画「her/世界でひとつの彼女」で主人公が恋に落ちる人工知能の声を担当したスカーレット・ヨハンソンに少し似ている。 。 OpenAIの幹部ピーター・デング氏は、音声キャラクターは特定の人物のように聞こえるように設計されていないと述べた。

デモンストレーションでは、ピーター・デン氏はロボットがまとまりのない自由回答形式の質問を理解できることを示した。彼は、新機能によって、質問の言い回しを正確に考えなくても、より簡単に、より自由に会話ができるようになったと語った。 「この機能を使えば、ChatGPTと会話することができます」とDeng氏は語った。 「今では子供たちは ChatGPT で寝る前にお話を聞いてほしいと頼んでいます。」

OpenAIの政策研究者サンディニ・アガルワル氏はインタビューで、音声と画像の機能をテストし、ロボットがデリケートな話題に適切に反応するように安全策を追加したと語った。たとえば、ユーザーがメンタルヘルス関連の問題について質問した場合、ChatGPT は専門家に相談することを提案します。しかし、アガルワル氏は、やるべきことはまだ多く、仕事は完了には程遠いと述べた。

<<:  AIのエネルギー消費は高すぎるため、マイクロソフトはデータセンターの電力供給に原子力発電の利用を検討している

>>:  画像ベースの AI プロジェクト用のデータセットを準備する 7 つのステップ

ブログ    

推薦する

「顔をスキャン」すると、実はリスクが伴う。顔認識、個人情報保護の観点から

[[417904]]例:2020年6月、杭州市阜陽区人民法院は、郭兵と杭州野生動物公園との間のサービ...

Red Hat は Ansible の自動化に IBM Watsonx コード生成を採用

Red Hat Inc. は本日、情報技術自動化のための生成 AI サービスである IBM Wats...

MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

データベース市場でMySQLの地位を揺るがすようなデータベースが登場したのは久しぶりのようです。主要...

...

Salesforceは、20のコードタスクSOTAをリフレッシュするために、新しい基本的なLLMシリーズのエンコーダー/デコーダーコードT5 +を提案しています。

大規模言語モデル (LLM) は最近、コード レベルでのさまざまなダウンストリーム タスクで優れたパ...

世界初の「サイボーグ」が死んだ!さようなら、ピーター 2.0

2020年、ピーター・スコット・モーガン博士はインターネットで話題になりました。人気の検索タイトル...

経済不況が来ていますが、AIを拒否しないでください!

この不況は、私たちがこれまで経験したどの不況よりも深刻で、突然のものである。私たちは皆、嵐がすぐに過...

イェール大学教授を征服したアルゴリズムプログラマーを見て、「人間本位」を実践してスマートコミュニティの脳を開発するにはどうすればよいのでしょうか?

自宅の高齢者が階段を降りる途中で誤って転倒したり、地域でいたずらっ子が走り回ってトラブルを起こしたり...

自動運転車の意思決定制御システム技術を分析した記事

自動運転システムは、環境認識、意思決定制御、行動実行を統合した総合的なシステムであり、車両と交通環境...

2021年11月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

2024年の8つの主要テクノロジートレンド

1. AIと機械学習を採用する人が増える人工知能 (AI) と機械学習 (ML) は単なる流行語では...

ソフトウェアエンジニアの年収は930万ドル! Googleの給与が明らかに:15億6千万ドルは史上最高額

シリコンバレーの大企業の中でも、グーグルの従業員はテクノロジー業界で最も高給を得ている社員の一部であ...

機械学習を簡単にする 5 つのオープンソース Python ライブラリ

機械学習は興味深いものですが、実際に実行するのは難しく複雑です。ワークフローとパイプラインの組み立て...

データサイエンスにおける強力な思考

統計学の入門コースを受講したことがあるなら、データ ポイントは理論を刺激したりテストしたりするために...