2代目アメカ登場!よりリアルな表情で流暢に聴衆に話しかけ、数十の言語を話すことができる

2代目アメカ登場!よりリアルな表情で流暢に聴衆に話しかけ、数十の言語を話すことができる

ヒューマノイドロボット「アメカ」が第2世代にバージョンアップしました!

最近、モバイル・ワールド・コングレスMWC2024に、世界最先端のロボットAmecaが再び登場しました。

会場周辺では、アメカが大勢の観客を集めていた。

GPT-4 のサポートにより、Ameca はさまざまな問題にリアルタイムで対応できます。

「ダンスをしましょう。」

感情があるかどうか尋ねられると、アメカ氏は驚くほどリアルに見えるさまざまな表情で答えた。

ほんの数日前、Ameca の背後にある英国のロボット工学会社 Engineered Arts が、チームの最新の開発成果を披露しました。

ビデオでは、ロボット Ameca は部屋の全体の状況を見て説明したり、特定のオブジェクトを説明したりする機能を備えています。

最も驚くべきことは、彼女はマスクやスポンジ・ボブなど、スタイルやトーンを含めてさまざまな声を真似できることです...

爆発的なアメカを支える技術

アメカロボットの最初の動画は、多くの人に本物の「恐怖」を感じさせたに違いない。

以前公開されたビデオでは、研究者が自分のプライベートな空間に侵入したため、研究者の手をつかむ様子が映っていた。

最も印象的なシーンは、アメカが肩の骨を動かすと突然魂が憑りつき、夢から覚めたかのように目を開けるシーンです。

アメカは現実の表情を極限まで真似ることもできます。 「嫌悪感」から「驚き」まで、すべてを完全同期で行うことができます。

真似をするだけでなく、鏡の前でさまざまな小さな表情を作ることができ、本物の人間と何ら変わりません。

アメカはどのようにして人間とは思えないリアルな表情や動きを作り出すのでしょうか?

簡単に言えば、ロボットにさらに洗練されたインテリジェントなボディ(人工ボディ、または AI×AB)を装備するには、主に次の 2 つのコア テクノロジーが必要です。

1つはロボットオペレーティングシステム「トリチウム」、もう1つはメスマー技術です。

Mesmer は、リアルなヒューマノイド ロボットを構築するためのシステムです。

膨大なリアルな表情データをアメカに提供することができ、前述の「リアルな表情をアメカが作る」を支えています。

36台のカメラを使用して、人体の骨格、肌の質感、表情など、360度3Dスキャンを行います。

次に、重なり合った複数のデジタル写真をさまざまな角度から撮影し、ピクセルの色とアンカー ポイントの位置を比較して 3D モデルを再構築します。

次に、重なり合った複数のデジタル写真をさまざまな角度から撮影し、ピクセルの色とアンカー ポイントの位置を比較して 3D モデルを再構築します。

最後に、ステレオリソグラフィー 3D プリンターで正確な型を作り、シリコンを充填して、肌の質感を本物の人間のように見せます。

しかし、よりスマートなボディ AB では、人工知能アルゴリズム (AI) のサポートも必要です。

Tritium ロボット オペレーティング システムは、「金属に命を吹き込む」魔法と呼ばれています。ソフトウェア、ハードウェア、クラウドを接続し、ハードウェアのあらゆるコンポーネントを駆動できます。

これら 2 つのコア テクノロジーにより、Ameca は喜び、怒り、悲しみ、幸福などの単純な感情から、驚きや傾聴などのより複雑な感情まで、本物の人間と同じように表現できます。これは恐ろしいことです...

報道によれば、アメカの体重は49kg、身長は1.87m、体内には合計52個のモジュールがあり、51種類の関節運動をサポートしている。

アメカは生きているような表情をすることができますが、まだ歩くことはできません。エンジニアード・アーツは、将来的には歩行が可能となるよう、時間をかけて機能をアップグレードしていく計画だ。

Ameca のようなロボットに加えて、Engineered Arts には顧客サービスロボット Quinn と音声ロボット RoboThespian もあります。

その他のデモ

Ameca はエンジニアの質問に流暢に答えることができました。

最も重要なのは、応答するときの表情、目、動きがコミュニケーションにおいて人々に親密感を与えることです。

なぜイライラしているのかと尋ねられたが、アメカ氏は答えなかった。

その後、研究者は単に同情を表明しただけで、実際に自分も落ち込んでいるとは言わなかったが、アメカ氏の答えは明らかに研究者も機嫌が悪いと誤って想定していた。

アメカは猫を流暢に描くこともできる万能ロボットです。

<<:  NVIDIA AI ゲーム エンジンをテスト: NPC とリアルタイムでチャット、中国語の会話は超スムーズ

>>:  モデルの好みはサイズだけですか?上海交通大学は32の大規模モデルについて人間の嗜好の定量的要素を包括的に分析した。

ブログ    
ブログ    

推薦する

人工知能時代の罠を回避し、実装を実現する方法

つい最近、カリフォルニア大学バークレー校で活躍している、インターネットで有名な無人食品配達車「Kiw...

SurroundOcc: サラウンド 3D 占有グリッドの最新技術!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ユニバーサルミュージックは、著作権問題でOpenAIの創設者が所有するAI企業Anthropicを訴えた。

Anthropicは2021年10月20日にOpenAIの創設者によって設立され、チャットボットC...

Sora では 1 分間のビデオを生成するのに 1 時間以上かかります。これによりユーザー エクスペリエンスにどのような変化がもたらされるのでしょうか?

人工知能に対する人々の熱意が高まり続けるにつれ、新しく発売された製品は世界中の人々から大きな注目を集...

APPは顔認識を強制しますか?アカウントをキャンセルできませんか?国は行動を起こしている

現在、インターネット上では個人のプライバシー情報の漏洩が頻繁に発生しています。アプリは多くの場合、ユ...

ニューラルネットワークはどのように学習するのでしょうか?

坂を下るのと同じように、損失関数の最低点を見つけます。 [[336501]]ニューラル ネットワーク...

トレンド: IT の複雑さにより AIOps の必要性が高まる

AIOps 市場が成熟するにつれて、業界関係者の多くは、プラットフォームがネイティブにデータを取得し...

...

Jiuzhang Cloud DataCanvas がシリーズ C 資金調達を完了: 標準化された AI インフラストラクチャの未来を定義する

最近、DataCanvasはシリーズCの資金調達を完了したことを発表しました。これはAdvantec...

「緊急天使」がロボットを救出するために前進し、事態を収拾した

科学技術の進歩と社会の発展に伴い、ロボット産業は繁栄の時代を迎えています。ロボット工学は、コンピュー...

AI時代の企業の変革とイノベーション

人工知能は、私たちの生活、仕事、学習に影響を与えるだけでなく、企業の運営、戦略、組織にも影響を与える...

人工知能: Web3 の救世主か破壊者か?

ブロックチェーン技術の発展に伴い、Web3(分散型Webとも呼ばれる)が徐々にWeb2(集中型Web...

インテリジェントなクラウドネイティブアプリケーションの台頭

マーク・アンドリーセンはかつてウォール・ストリート・ジャーナルに「なぜソフトウェアが世界を席巻してい...

李菲菲のチームはロボット用の「模擬キッチン」を作った。洗浄、カット、調理のワンストップトレーニングである。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...