Microsoft XiaoIceが第7世代にアップグレードされ、ユーザーの権限を強化するアバターフレームワークがリリースされました

Microsoft XiaoIceが第7世代にアップグレードされ、ユーザーの権限を強化するアバターフレームワークがリリースされました

[51CTO.comよりオリジナル記事] 8月15日、マイクロソフト(アジア)インターネットエンジニアリングアカデミーは北京で「第7世代マイクロソフトXiaoIce」の年次記者会見を開催した。会議で、マイクロソフトはXiaoIceのコア技術の一部をアップグレードし、Avatar Frameworkの最初のツールキットバージョンを発表し、いくつかの企業との協力を発表しました。

[[273873]]

コア機能のアップグレードにより、XiaoIceは将来に注力できる

第 7 世代の Microsoft Xiaoice は過去に基づいているだけでなく、未来も見据えていることがわかっています。つまり、Xiaoice は将来の会話全体のさまざまな可能性のある方向性を事前に計画し始めています。これは主に、コアダイアログエンジン、全二重音声、マルチモーダルインタラクティブセンサー機能など、今回アップグレードされたいくつかのコアテクノロジーに依存しています。

a. まったく新しい対話エンジン:検索モデル、生成モデル、共感モデルの技術的な反復を経て、アップグレードされた対話エンジンは「平等な対話」から「支配的な対話」への飛躍を達成しました。オープンドメインの会話のパフォーマンスが向上するだけでなく、垂直分野でのコンバージョン率も高まる効果があります。米国で実施された「オンライン小売業垂直分野」のテストを例にとると、新しい会話エンジンの商品ページへのコンバージョン率は68%で、以前のバージョンより21%高くなっています。

b. 全二重音声インタラクション: Microsoft XiaoIceは、2017年と2018年にそれぞれ従来の電話とスマートスピーカーデバイスで全二重音声インタラクションを開始しました。新たに追加された車載シナリオにより、AIアシスタントとドライバーおよび乗客とのインタラクションエクスペリエンスが大幅に向上し、AIをスマート中央制御から「仮想乗客」エクスペリエンス標準へと変革することが促進されます。

c. 未来志向のマルチモーダルインタラクティブセンス:全二重音声インタラクション、リアルタイムビジョン、コア対話エンジンを統合した新しいインタラクティブセンス。ユーザーは、聞くこと、話すこと、見ることを同時にしながら人工知能と対話することができます。昨年、マルチモーダルセンシングの研究開発をリードしていくと発表し、今年2月にはマイクロソフトジャパンのXiaoIceチームが地元メディアを招いて公開テストを実施した。この感覚は5G時代の新たなインタラクションの形となることが期待されます。

さまざまなAI生物を作成するためのアバターフレームワークの立ち上げ

第 7 世代 XiaoIce の大きな進歩は、Microsoft の Avatar Framework の導入です。報道によると、Avatar Frameworka ツールキットは Microsoft XiaoIce フレームワークと同じ起源を持ち、完全な感情コンピューティング機能を備えた人工知能アシスタント、ソーシャル対話ロボット、人工知能コンテンツ作成、IP キャラクターを簡単に構築できます。これにより、より多くの AI 存在が同様の汎用的で完全なフレームワーク機能を持つようになり、聞く、話す、見る、作成することができ、XiaoIce のように遍在することができます。



Avatar Framework は、パーソナリティの構築から始めて AI アシスタント仮想キャラクターをゼロから作成し、そのライフサイクル全体を通じてこの AI を継続的に管理およびアップグレードする完全なツールキットです。ツールキットには、ダイアログ、サウンド、ビジョン、意見、スキル、知識、創造性などの豊富なツールが含まれており、互換性のある 3D キャラクター モデルを駆動してリアルタイムのインタラクションを実現できます。

完全なフレームワークは主に 4 つの部分で構成されていることがわかっています。1 つ目は、IQ と EQ の 2 つの側面から AI 存在の個性を定義するプロファイル ツールです。2 つ目は、この AI 存在のコア ダイアログ エンジン、コンピューター音声、コンピューター ビジョンなどの機能を調整するための一連のツールです。次に、この AI 存在が 3 つの視点、知識、スキルなどを持ち、人間の特性により近づくようにするための別の一連のツールがあります。最後に、アバター フレームワークで 3D モデルを駆動すると、仮想 AI が鮮明に表示されます。 4 つの部分全体が完全なフレームワークを構成します。



Microsoft XiaoIce のコンセプトは人工知能です。彼女は IQ と EQ の両方を備えた完全な人間です。したがって、Microsoft のフレームワークでは、プロファイル ツールがすべての基礎となります。これは、AI が「私は誰であるか」という概念を確立するのに役立つためです。現在、プロファイル ツールは 76 の基本情報と 27 の性格特性指標をサポートしています。これらのパラメータを調整することで、社会恐怖症を含むさまざまな性格を作成できます。

マイクロソフトのエグゼクティブバイスプレジデントであり、同社人工知能部門およびマイクロソフトグローバルリサーチの責任者であるハリー・シャム氏は、人工知能が前進するためにはこのような枠組みが必要だと語った。この枠組みは、たくさんの大きな木を植えることができる広大な土地のようなものです。小氷は広大な森全体に大きな木を植えているだけですが、私たちは小氷になってそのような大きな木を植えなければなりません。なぜなら、このフレームワークが実現可能かどうかを学び、検証するための機会が必要だからです。

このリリースに先立ち、Microsoft は、Avatar Framework を通じて、SoftBank Pepper や Microsoft XiaoIce 自体など、数十のサードパーティの顧客 AI を有効にしてきました。この記者会見では、マイクロソフトと中国文学グループが小説の主人公100人の知的財産権に関して協力することが発表された。このリリースはすべてのパートナーと顧客を対象としていることが理解されています。コンシューマー版は2020年春に発売される予定です。

デュアルAI戦略を深め、複数の関係者と協力

沈向陽氏は、XiaoIce の開発プロセスにおける 3 つのステップを紹介しました。1 つ目は、XiaoIce のような人工知能がさまざまな環境にすばやく統合され、すべての人に受け入れられるかどうかです。2 つ目は、ユーザーの支持をすばやく獲得し、ユーザーとより多くのコミュニケーションをとることができるかどうかです。3 つ目は、継続的に発展できるかどうか、そして XiaoIce を継続的な反復と進化に導く強力な技術革新力があるかどうかです。そこで、マイクロソフトは昨年、デュアル AI 戦略を提案しました。



Dual AI のようなエコシステムは、半オープンなエコシステムのアイデアです。Microsoft フレームワークの汎用性と豊富さのおかげで、XiaoIce は製品形態において大きな柔軟性を実現できます。一方では、さまざまな種類の新しいプラットフォームに参入する際に、さまざまな適切な形式に変形し、スマートフォン、スマートスピーカーデバイス、もちろんソーシャルネットワーク、コンテンツ、情報プラットフォームに接続できます。一方で、何百万通りもの形に変化しながらも、ある程度は比較的統一された独自性を保つことができる。こうしたスケールコントロールこそが、私たちが最も嬉しく思うことです。

現在、Xiaoice は Xiaomi と Huawei (Honor 携帯電話、Xiaomi と Huawei のスマート スピーカー デバイスを含む) にすでに存在しています。統一コマンド「Summon Xiaoice」を使用して、彼女と対話することができます。さらに、XiaoIce は QQ、WeChat AI、Toutiao など多くのモバイル アプリケーションとも連携しています。 XiaoIce はモバイル アプリケーションに携わるだけでなく、従来のラジオやテレビとも協力し、コンテンツ プロデューサーおよびテクノロジー プロバイダーとしての役割を担っています。実際、先月末の時点で、Xiaoiceは中国と日本の50のラジオ局とテレビ局、69の番組に人工知能コンテンツ制作機能を提供してきました。Xiaoiceは30の毎日と毎週の番組を立ち上げており、制作できるコンテンツの種類は増え続けています。これまでに制作されたテレビ・ラジオ番組の総時間は6,908時間に達し、このうち今年制作された番組時間は昨年の2.05倍となっている。



ToB 分野での豊富な経験と技術製品の豊富な蓄積により、Microsoft XiaoIce の商用化は急速に進みました。獲得した商業顧客は金融、小売、自動車、不動産、繊維など10分野に及び、顧客には万科、風情、万世利、中国聯通などが含まれる。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  詐欺が暴露されました!かつて資金調達記録を樹立したテクノロジー企業が、インド人プログラマーを使ってAIを偽装していたことが発覚

>>:  機械学習が製造業に革命を起こす10の方法

ブログ    

推薦する

[強く推奨] 史上最も包括的な IT アーキテクト技術知識マップ 34 選

この記事は、著者が長年にわたり蓄積し収集してきた知識とスキルのマップです。編集者は、これを周囲の技術...

...

ソフトウェアとハ​​ードウェアを組み合わせたCDS Shouyun AIクラウドサービスの技術実践

人工知能は新たな変化を先導しています。近年、人工知能はテクノロジー業界から始まり、急速に生活の各分野...

アルゴリズムのインテリジェントなアップグレードにより、将来のデジタルライフはより明るくなります

[[120716]]研究者たちは現在、検索結果の改善、自動運転車、スマート携帯電話のアップグレード、...

IDC: 人工知能への世界的支出は4年で倍増すると予想

IDC グローバル人工知能支出ガイドによると、世界の人工知能 (AI) 関連の支出は、今後 4 年間...

国内メディアが大々的に報じた「世界初のAI地震監視システム」は的外れ

[[387555]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

テスラAIディレクター:33年前にルカンのニューラルネットワークを再現したが、今とあまり変わらない

最近、Tesla AI のシニアディレクターである Andrej Karpathy 氏が、非常に興味...

人工知能に関する6つの大きな懸念

2017年、人工知能は最高熱に達し、最高情報責任者、コンサルタント、学者らは、この技術によってビジネ...

ロボットが製造業にもたらした変化は実に目覚ましいものがあります。

知能ロボットの誕生は、国内の多くの産業に新たな力をもたらしました。ロボットの導入により、サービス業は...

モデルのトレーニングをアウトソーシングするのは本当に安全ですか?新しい研究:アウトソーサーが銀行融資を制御するためにバックドアを挿入する可能性がある

ディープラーニングにはビッグデータと大規模な計算能力に対する厳しい要件があるため、モデルトレーニング...

PyTorch 生成的敵対ネットワーク (GAN) を簡単に構築

あなたの目の前に表示されている画像の人物は現実には存在しません。実は、機械学習モデルによって作成され...

RWKV の紹介: リニア トランスフォーマーの台頭と代替案の検討

RWKV ポッドキャストからの私の考えの一部を要約すると次のようになります: https://www...