OpenAIは米国時間9月26日月曜日、チャットボット「ChatGPT」に音声会話機能を追加したと発表した。これにより、OpenAI はインテリジェント音声アシスタントの分野で Google、Apple、Amazon などのテクノロジー大手と直接競合することになります。 ChatGPT は 5 つの「ペルソナ」を使用してユーザーの質問に答えることができ、その声のトーンは Alexa や Siri などの音声アシスタントよりも実際の人間に近いように聞こえます。 OpenAIは、音声機能の追加は、より多くのユーザーを引き付けてChatGPTを使用し、対話してもらうための重要な方法であると述べた。 「それが我々が直面している課題だ」と、OpenAIの消費者向け製品担当副社長ピーター・デン氏はインタビューで語った。「最も難しいことの一つは、この素晴らしい技術を簡素化することだ」 OpenAIがChatGPTの音声機能のリリースを発表した同じ日に、Amazonは人工知能のスタートアップ企業Anthropicに最大40億ドルを投資する契約を発表した。これは今年初めのマイクロソフトによるOpenAIへの投資以来、人工知能分野で最大の取引であり、テクノロジー大手が注目の人工知能スタートアップ企業に賭けていることを示している。 Google、Amazon、OpenAIは、競争に勝つために先週いくつかのAI製品をリリースした企業である。既存のスピーカーへの統合は、企業がユーザーにチャットボットの使用と料金の支払いを促すための重要な方法の 1 つです。 アマゾンは、すでにアメリカの何百万もの家庭に導入されているAlexaホームスピーカーにチャットボットの「会話」機能を追加すると発表した。グーグルは、チャットボット「バード」の技術を自社の音声アシスタントに適用することを検討していると述べた。 現在、ChatGPT のモバイル アプリでは音声で質問できますが、チャットボットはテキストで回答します。冷蔵庫の中の材料の写真を見せたり、チャットボットにレシピの提案を依頼したりするなど、質問の一部としてチャットボットに画像をアップロードすることもできるようになりました。 音声と画像の機能が追加されたことで、ChatGPT は世界を「見て」「聞いて」、音声と画像の両方で応答できる真の「マルチモーダル」モデルになりました。マルチモーダル モデルは業界の競争の次の段階であり、多くの企業がより強力なモデルの開発を競っています。 音声アシスタントは長年にわたり、自動車、スマートフォン、テレビ、スマートスピーカーに搭載されており、毎日数え切れないほどの人々に使用されています。しかし、ほとんどの場合、音声アシスタントは、照明を点灯したり天気を報告したりするような単純な操作に限定されています。チャットボットの背後にある「ビッグ言語モデル」テクノロジーにより、音声アシスタントがより長く、より自然な会話をし、より複雑な質問に答えられるようになる可能性が開かれます。 投資家やアナリストは、チャットボットや画像生成器などの生成型人工知能の分野での競争への対応が遅いとしてアマゾンを非難している。アンスロピックの投資により、アマゾンは同スタートアップの研究者や技術にアクセスできるようになる。 Anthropicは元OpenAIの従業員によって設立され、以前はGoogleから投資を受けていた。 市場調査会社ガートナーのジム・ヘア副社長は、アマゾンは上記の措置を通じて、生成型人工知能の分野で積極的なプレーヤーであることを市場に示したとし、遅れをとっているという人々の印象を変えようとしていると述べた。 OpenAIは昨年11月にChatGPTをリリースし、チャットボットブームを巻き起こした。マイクロソフトはOpenAIと提携して同社の技術を活用し、グーグルは独自のチャットボット「Bard」を立ち上げた。 人工知能の研究者は、チャットボットの応答が実際の人間の応答と似ていることが多いため、人々がチャットボットを過度に擬人化する可能性があると警告している。これにより、ユーザーはロボットの知能や能力を誤って信頼する可能性があります。しかし、チャットボットは今でもメッセージをでっち上げて、それを本当の回答として伝えることが多く、AI 研究者はこれを「幻覚」と呼んでいます。 ChatGPT の新しいキャラクターの名前は Sky、Ember、Breeze、Juniper、Cove で、それぞれ口調やアクセントが異なります。スカイの声は、映画「her/世界でひとつの彼女」で主人公が恋に落ちる人工知能の声を担当したスカーレット・ヨハンソンに少し似ている。 。 OpenAIの幹部ピーター・デング氏は、音声キャラクターは特定の人物のように聞こえるように設計されていないと述べた。 デモンストレーションでは、ピーター・デン氏はロボットがまとまりのない自由回答形式の質問を理解できることを示した。彼は、新機能によって、質問の言い回しを正確に考えなくても、より簡単に、より自由に会話ができるようになったと語った。 「この機能を使えば、ChatGPTと会話することができます」とDeng氏は語った。 「今では子供たちは ChatGPT で寝る前にお話を聞いてほしいと頼んでいます。」 OpenAIの政策研究者サンディニ・アガルワル氏はインタビューで、音声と画像の機能をテストし、ロボットがデリケートな話題に適切に反応するように安全策を追加したと語った。たとえば、ユーザーがメンタルヘルス関連の問題について質問した場合、ChatGPT は専門家に相談することを提案します。しかし、アガルワル氏は、やるべきことはまだ多く、仕事は完了には程遠いと述べた。 |
<<: AIのエネルギー消費は高すぎるため、マイクロソフトはデータセンターの電力供給に原子力発電の利用を検討している
>>: 画像ベースの AI プロジェクト用のデータセットを準備する 7 つのステップ
人工知能は急速に企業間の差別化要因になりつつあります。ここでは、AI エリートとしてすぐに必要となる...
企業がビッグデータを活用するには、データ サイエンティストと開発者がデータを準備して整理し、アナリス...
ヘルスケア業界は常にイノベーションの先駆者であり続けています。しかし、病気やウイルスが変異し続ける中...
[[442361]]都市化の継続的な進展と自動車保有数の急速な増加により、我が国の交通発展は困難な...
IDC グローバル人工知能支出ガイドによると、世界の人工知能 (AI) 関連の支出は、今後 4 年間...
[[441681]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[226485]]マイクロソフト アジア社長のラルフ ハウプター氏によると、AI が概念から現実の...
1. 自然言語生成自然言語生成は、データをテキストに変換し、コンピューターがこれまでにない精度でア...
インテリジェントシステムは独自の初期目標を決定することはできませんが、経験に基づいて独自の派生目標を...
マシンビジョンは急速に発展している人工知能の分野です。簡単に言えば、マシンビジョンとは、測定と判断の...
デジタル化と AI の導入が加速する中、企業では人工知能 (AI) と機械学習 (ML) の開発者が...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...