人工知能とVRを融合し、多様な体験を実現

人工知能とVRを融合し、多様な体験を実現

人工知能サービス - Microsoft Cognitive Services には当初、視覚、音声、言語、知識、検索の 5 つのカテゴリに 21 個の API が含まれていました。これらの API を使用するシステムは、自然なコミュニケーションを通じて、私たちのニーズを見て、聞いて、話し、理解し、解釈することができます。現在、Microsoft 認知サービス全体のうち 8 つが一般に公開されており、17 つが指定された開発者向けにプレビューとして公開されています。 Microsoft は、オリジナルの API をベースに、新しい API を追加し、既存の API を更新し続けます。

[[183508]]

最近、Microsoft は Microsoft Cognitive Services に Custom Speech Service を追加することを発表しました。 Custom Speech Service は、Custom Intelligent Speech Recognition Service (CRIS) と Language Understanding Intelligent Service (LUIS) という 2 つの最先端テクノロジを組み合わせた、柔軟性の高い音声テキスト変換プログラムです。

CRIS は、騒がしい公共の場などの複雑な環境にも適用でき、音声認識をより便利にカスタマイズするのに役立ちます。また、アプリケーションが非ネイティブスピーカーや障害のある人などをよりよく理解できるようにするためにも使用できます。

LUIS は、コンピュータが私たちの言葉の背後にある真意を理解するのに役立ちます。現在の音声コマンドでは、システムが応答する前に、開発者が 1 つ以上の特定の単語またはフレーズを設定する必要があることがよくあります。実際の例を挙げると、システムがマップ アプリケーションを開いて近くのコーヒー ショップを検索する指示を受け取る前に、ユーザーは「コーヒーを探して」または「コーヒーを探しに連れて行って」と言う必要があります。しかし、LUIS を使用すると、ユーザーは「眠くて目を開けられない。リフレッシュしたい」と言うだけで、システムがユーザーの真のニーズを理解します。

現在、バーチャルリアリティコンテンツスタジオのHuman Interactは、Microsoftのカスタム音声サービスとVRを組み合わせようと試みている。

Starship Commander は音声対話型 VR 体験です。プレイヤーは宇宙船のパイロットの役割を担い、スーパーコンピューターやホログラフィック司令官と協力してミッションを完了します。ゲーム中、プレイヤーは音声通信を通じて仮想世界を探索します。 CRIS と LUIS のおかげで、両方のゲーム キャラクターは宇宙船やエイリアンに関する言葉を正しく理解し、応答できるようになりました。通常の VR ゲームと比較すると、Starship Commander はインタラクティブな映画のようなものです。

人工知能と VR 技術の発展により、将来的にはプレイヤーと NPC 間のやりとりがより自然で没入感のあるものになるでしょう。

[[183509]]

<<:  Googleの人工知能学習により低ピクセル画像も鮮明に

>>:  マシンビジョンについて知っておくべきこと

ブログ    
ブログ    

推薦する

実践 | 人工知能が小売体験を向上させる 20 の例

小売体験は長年にわたってあまり変わっていません。つまり、店に入って、適切な製品を見つけて、それを購入...

効率的なトランスフォーマーが次々と登場、Googleチームが1つの記事ですべてをレビュー

Transformerモデルは2017年の誕生以来、自然言語処理やコンピュータービジョンなど多くの分...

女性の労働はAIに置き換えられやすいのか?

最近の多くの研究では、主に人工知能や自動化における技術の進歩が、男性よりも女性の雇用に大きな影響を与...

...

人工知能によるテキスト検出の実践的有効性に関する議論

AI 支援による記事執筆は今やどこにでもあります。ChatGPT は多くの言語ベースの AI アプリ...

人工知能はサイバーセキュリティにどのような影響を与えるのでしょうか?

人工知能の出現はITの将来の発展の傾向を変え、今後もさらに多くの産業に利益をもたらし続けるでしょう。...

NeRFは過去のものになるのか?立体復元は3D GSの新時代へ! (復旦大学からの最新レビュー)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

コンテキストウィンドウ 16,000 トークン、30 億パラメータ、安定性 AI コード大規模モデルがここにあります

最近、Vincent Diffusion アーティファクトをオープンソース化した Stability...

情報セキュリティにおける機械学習の 5 つの主な使用例

簡単に言えば、機械学習とは「明示的にプログラムされなくても学習する(コンピュータの)能力」です。機械...

...

Java ソートアルゴリズムの概要 (II): 選択ソート

選択ソートの基本的な操作は、ソートするデータ要素から毎回最小(または最大)の要素を選択し、ソートする...

人工知能はクラウド セキュリティ サービスをどのように変えるのでしょうか?

この記事では、AI がクラウド セキュリティ サービスをどのように変えているのか、そしてそれが企業に...

純粋な乾物 | ディープラーニング研究の概要

[[195952]] 1. ディープラーニングディープラーニングといえば、一度でも触れたことがある人...

...

ディープラーニングを使用した音声分類のエンドツーエンドの例と説明

サウンド分類は、オーディオのディープラーニングで最も広く使用されている方法の 1 つです。音を分類し...