[51CTO.comよりオリジナル記事] 8月15日、マイクロソフト(アジア)インターネットエンジニアリングアカデミーは北京で「第7世代マイクロソフトXiaoIce」の年次記者会見を開催した。会議で、マイクロソフトはXiaoIceのコア技術の一部をアップグレードし、Avatar Frameworkの最初のツールキットバージョンを発表し、いくつかの企業との協力を発表しました。 [[273873]] コア機能のアップグレードにより、XiaoIceは将来に注力できる 第 7 世代の Microsoft Xiaoice は過去に基づいているだけでなく、未来も見据えていることがわかっています。つまり、Xiaoice は将来の会話全体のさまざまな可能性のある方向性を事前に計画し始めています。これは主に、コアダイアログエンジン、全二重音声、マルチモーダルインタラクティブセンサー機能など、今回アップグレードされたいくつかのコアテクノロジーに依存しています。 a. まったく新しい対話エンジン:検索モデル、生成モデル、共感モデルの技術的な反復を経て、アップグレードされた対話エンジンは「平等な対話」から「支配的な対話」への飛躍を達成しました。オープンドメインの会話のパフォーマンスが向上するだけでなく、垂直分野でのコンバージョン率も高まる効果があります。米国で実施された「オンライン小売業垂直分野」のテストを例にとると、新しい会話エンジンの商品ページへのコンバージョン率は68%で、以前のバージョンより21%高くなっています。 b. 全二重音声インタラクション: Microsoft XiaoIceは、2017年と2018年にそれぞれ従来の電話とスマートスピーカーデバイスで全二重音声インタラクションを開始しました。新たに追加された車載シナリオにより、AIアシスタントとドライバーおよび乗客とのインタラクションエクスペリエンスが大幅に向上し、AIをスマート中央制御から「仮想乗客」エクスペリエンス標準へと変革することが促進されます。 c. 未来志向のマルチモーダルインタラクティブセンス:全二重音声インタラクション、リアルタイムビジョン、コア対話エンジンを統合した新しいインタラクティブセンス。ユーザーは、聞くこと、話すこと、見ることを同時にしながら人工知能と対話することができます。昨年、マルチモーダルセンシングの研究開発をリードしていくと発表し、今年2月にはマイクロソフトジャパンのXiaoIceチームが地元メディアを招いて公開テストを実施した。この感覚は5G時代の新たなインタラクションの形となることが期待されます。 さまざまなAI生物を作成するためのアバターフレームワークの立ち上げ 第 7 世代 XiaoIce の大きな進歩は、Microsoft の Avatar Framework の導入です。報道によると、Avatar Frameworka ツールキットは Microsoft XiaoIce フレームワークと同じ起源を持ち、完全な感情コンピューティング機能を備えた人工知能アシスタント、ソーシャル対話ロボット、人工知能コンテンツ作成、IP キャラクターを簡単に構築できます。これにより、より多くの AI 存在が同様の汎用的で完全なフレームワーク機能を持つようになり、聞く、話す、見る、作成することができ、XiaoIce のように遍在することができます。 Avatar Framework は、パーソナリティの構築から始めて AI アシスタント仮想キャラクターをゼロから作成し、そのライフサイクル全体を通じてこの AI を継続的に管理およびアップグレードする完全なツールキットです。ツールキットには、ダイアログ、サウンド、ビジョン、意見、スキル、知識、創造性などの豊富なツールが含まれており、互換性のある 3D キャラクター モデルを駆動してリアルタイムのインタラクションを実現できます。 完全なフレームワークは主に 4 つの部分で構成されていることがわかっています。1 つ目は、IQ と EQ の 2 つの側面から AI 存在の個性を定義するプロファイル ツールです。2 つ目は、この AI 存在のコア ダイアログ エンジン、コンピューター音声、コンピューター ビジョンなどの機能を調整するための一連のツールです。次に、この AI 存在が 3 つの視点、知識、スキルなどを持ち、人間の特性により近づくようにするための別の一連のツールがあります。最後に、アバター フレームワークで 3D モデルを駆動すると、仮想 AI が鮮明に表示されます。 4 つの部分全体が完全なフレームワークを構成します。 Microsoft XiaoIce のコンセプトは人工知能です。彼女は IQ と EQ の両方を備えた完全な人間です。したがって、Microsoft のフレームワークでは、プロファイル ツールがすべての基礎となります。これは、AI が「私は誰であるか」という概念を確立するのに役立つためです。現在、プロファイル ツールは 76 の基本情報と 27 の性格特性指標をサポートしています。これらのパラメータを調整することで、社会恐怖症を含むさまざまな性格を作成できます。 マイクロソフトのエグゼクティブバイスプレジデントであり、同社人工知能部門およびマイクロソフトグローバルリサーチの責任者であるハリー・シャム氏は、人工知能が前進するためにはこのような枠組みが必要だと語った。この枠組みは、たくさんの大きな木を植えることができる広大な土地のようなものです。小氷は広大な森全体に大きな木を植えているだけですが、私たちは小氷になってそのような大きな木を植えなければなりません。なぜなら、このフレームワークが実現可能かどうかを学び、検証するための機会が必要だからです。 このリリースに先立ち、Microsoft は、Avatar Framework を通じて、SoftBank Pepper や Microsoft XiaoIce 自体など、数十のサードパーティの顧客 AI を有効にしてきました。この記者会見では、マイクロソフトと中国文学グループが小説の主人公100人の知的財産権に関して協力することが発表された。このリリースはすべてのパートナーと顧客を対象としていることが理解されています。コンシューマー版は2020年春に発売される予定です。 デュアルAI戦略を深め、複数の関係者と協力 沈向陽氏は、XiaoIce の開発プロセスにおける 3 つのステップを紹介しました。1 つ目は、XiaoIce のような人工知能がさまざまな環境にすばやく統合され、すべての人に受け入れられるかどうかです。2 つ目は、ユーザーの支持をすばやく獲得し、ユーザーとより多くのコミュニケーションをとることができるかどうかです。3 つ目は、継続的に発展できるかどうか、そして XiaoIce を継続的な反復と進化に導く強力な技術革新力があるかどうかです。そこで、マイクロソフトは昨年、デュアル AI 戦略を提案しました。 Dual AI のようなエコシステムは、半オープンなエコシステムのアイデアです。Microsoft フレームワークの汎用性と豊富さのおかげで、XiaoIce は製品形態において大きな柔軟性を実現できます。一方では、さまざまな種類の新しいプラットフォームに参入する際に、さまざまな適切な形式に変形し、スマートフォン、スマートスピーカーデバイス、もちろんソーシャルネットワーク、コンテンツ、情報プラットフォームに接続できます。一方で、何百万通りもの形に変化しながらも、ある程度は比較的統一された独自性を保つことができる。こうしたスケールコントロールこそが、私たちが最も嬉しく思うことです。 現在、Xiaoice は Xiaomi と Huawei (Honor 携帯電話、Xiaomi と Huawei のスマート スピーカー デバイスを含む) にすでに存在しています。統一コマンド「Summon Xiaoice」を使用して、彼女と対話することができます。さらに、XiaoIce は QQ、WeChat AI、Toutiao など多くのモバイル アプリケーションとも連携しています。 XiaoIce はモバイル アプリケーションに携わるだけでなく、従来のラジオやテレビとも協力し、コンテンツ プロデューサーおよびテクノロジー プロバイダーとしての役割を担っています。実際、先月末の時点で、Xiaoiceは中国と日本の50のラジオ局とテレビ局、69の番組に人工知能コンテンツ制作機能を提供してきました。Xiaoiceは30の毎日と毎週の番組を立ち上げており、制作できるコンテンツの種類は増え続けています。これまでに制作されたテレビ・ラジオ番組の総時間は6,908時間に達し、このうち今年制作された番組時間は昨年の2.05倍となっている。 ToB 分野での豊富な経験と技術製品の豊富な蓄積により、Microsoft XiaoIce の商用化は急速に進みました。獲得した商業顧客は金融、小売、自動車、不動産、繊維など10分野に及び、顧客には万科、風情、万世利、中国聯通などが含まれる。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: 詐欺が暴露されました!かつて資金調達記録を樹立したテクノロジー企業が、インド人プログラマーを使ってAIを偽装していたことが発覚
[[441326]]リンクリストの交差LeetCode の問題へのリンク: https://leet...
人類史上のスーパープロジェクトとは何でしょうか?ピラミッド、万里の長城、ドバイワールドアイランド、三...
前回の記事「エントリーレベルのデータベースのアルゴリズム [I]」では、いくつかのデータ アルゴリズ...
[[243888]]現在、「人工知能」という言葉は主要メディアプラットフォームで頻繁に登場し、注目を...
背景マルチデバイス、マルチパーソン、マルチノイズなどのさまざまな複雑なオーディオおよびビデオ通信シナ...
近年、サイバーセキュリティ業界では人工知能技術が話題になっています。セキュリティ オーケストレーショ...
当然のことながら、AI と自動化は、テクノロジーの混乱や社会経済の不確実性に対処するために不可欠であ...
[[388616]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
「教育は死んだが、学習は不滅である。」半世紀前、アメリカの教育思想家イリイチは著書『脱学校社会』の...
海外メディアの報道によると、人工知能(AI)と自動運転の企業TuSimpleが株式コード「TSP」で...
一日中懸命に働いた労働者たちは、疲れた体を引きずりながら家に戻り、ついに「解放された農奴が歌う」生活...