人工知能とVRを融合し、多様な体験を実現

人工知能サービス - Microsoft Cognitive Services には当初、視覚、音声、言語、知識、検索の 5 つのカテゴリに 21 個の API が含まれていました。これらの API を使用するシステムは、自然なコミュニケーションを通じて、私たちのニーズを見て、聞いて、話し、理解し、解釈することができます。現在、Microsoft 認知サービス全体のうち 8 つが一般に公開されており、17 つが指定された開発者向けにプレビューとして公開されています。 Microsoft は、オリジナルの API をベースに、新しい API を追加し、既存の API を更新し続けます。

[[183508]]

最近、Microsoft は Microsoft Cognitive Services に Custom Speech Service を追加することを発表しました。 Custom Speech Service は、Custom Intelligent Speech Recognition Service (CRIS) と Language Understanding Intelligent Service (LUIS) という 2 つの最先端テクノロジを組み合わせた、柔軟性の高い音声テキスト変換プログラムです。

CRIS は、騒がしい公共の場などの複雑な環境にも適用でき、音声認識をより便利にカスタマイズするのに役立ちます。また、アプリケーションが非ネイティブスピーカーや障害のある人などをよりよく理解できるようにするためにも使用できます。

LUIS は、コンピュータが私たちの言葉の背後にある真意を理解するのに役立ちます。現在の音声コマンドでは、システムが応答する前に、開発者が 1 つ以上の特定の単語またはフレーズを設定する必要があることがよくあります。実際の例を挙げると、システムがマップアプリケーションを開いて近くのコーヒーショップを検索する指示を受け取る前に、ユーザーは「コーヒーを探して」または「コーヒーを探しに連れて行って」と言う必要があります。しかし、LUIS を使用すると、ユーザーは「眠くて目を開けられない。リフレッシュしたい」と言うだけで、システムがユーザーの真のニーズを理解します。

現在、バーチャルリアリティコンテンツスタジオのHuman Interactは、Microsoftのカスタム音声サービスとVRを組み合わせようと試みている。

Starship Commander は音声対話型 VR 体験です。プレイヤーは宇宙船のパイロットの役割を担い、スーパーコンピューターやホログラフィック司令官と協力してミッションを完了します。ゲーム中、プレイヤーは音声通信を通じて仮想世界を探索します。 CRIS と LUIS のおかげで、両方のゲームキャラクターは宇宙船やエイリアンに関する言葉を正しく理解し、応答できるようになりました。通常の VR ゲームと比較すると、Starship Commander はインタラクティブな映画のようなものです。

人工知能と VR 技術の発展により、将来的にはプレイヤーと NPC 間のやりとりがより自然で没入感のあるものになるでしょう。

[[183509]]

<<: Googleの人工知能学習により低ピクセル画像も鮮明に

>>: マシンビジョンについて知っておくべきこと