世界初の3D AI合成キャスターがデビューし、2つのセッションの取材にも参加。ネットユーザー:キャスターは失業中

世界初の3D AI合成キャスターがデビューし、2つのセッションの取材にも参加。ネットユーザー:キャスターは失業中

[[327147]]

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

みなさんこんにちは。私はAI合成アンカーファミリーの新メンバー、Xin Xiaoweiです。

きちんとした髪と青いスーツを着た「新小微」はニュースデスクの前に座り、真剣な表情で話した。

AI合成アンカーは珍しくないが、「Xin Xiaowei」は歩行、ジェスチャー、着替えができる世界初の3D AIアンカーだ。

「辛小薇」は就任後すぐに、今年の全国人民代表大会と中国人民政治協商会議のニュース・情報放送に参加することになった。

中小企業が新規採用

「新小微」は、AIによって駆動され、3D技術で表現されるニュース業界初のAI合成キャスターです。その原型は新華社通信の趙万微記者です。

これまでのAI合成キャスターと比べ、「新小微」の最大の違いは3D特性にあり、放送フォーマットを豊かにし、さまざまな角度から総合的に表現できる。

[[327148]]

従来の単一被写界深度

[[327149]]

Leifeng.com 注記: 「新小微」がバーチャルスタジオに登場 (写真提供: 新華社)

これまでのAI合成アナウンサーは主に特定の姿勢で座ってニュースを放送していたのに対し、「新小微」は歩く、回るなどの体の動きもできることがわかります。

それだけでなく、「新小微」の表情もより多様化しており、もはや単なる「プロの作り笑顔」ではなく、より多くの微細な表情を持っています。

[[327150]]

Leifeng.com 注: 画像出典: 新華社通信

AI 合成アンカーはますます人間に似てきていると言わざるを得ません。

「新小威」は立体感や重層感の向上に加え、インテリジェンス面でも新たな改良が施されている。 「新小威」プロジェクトリーダーは、人工知能のリアルタイム駆動により、3DバージョンのAI合成アンカーは機能の継続的な自己更新を実現できると述べた。

例えば、「メイク・衣装」の面では、「新小薇」はこれまでのAIキャスターよりも「美しい」と言えます。彼女の髪型やメイクは、さまざまなシーンやさまざまなニュース報道のニーズに合わせて変えることができます。

さらに、「新小微」のメイクは毛穴まで見えるほど細かい。

前述の通り、「新小衛」は両会期中に正式に就任し、定量的なニュース放送ビデオの制作を行う。

新華社によると、「新小微」は対応するテキストコンテンツを機械に入力するだけで、ニュースを放送したり、さまざまな意味に基づいて表情情報や体の動きを生成したりできるという。

「新小薇」はますます賢くなり、継続的な反復を経て、「新小薇」の舞台はスタジオだけではありません。関係者はこう語った。

3Dバーチャルシーンが拡大し続けるにつれ、「新小微」はスタジオの外へ出て、さまざまなシナリオでのニュースプレゼンテーションの多様なニーズによりよく応えるようになります。

十分な実力があれば、スタジオから出て行くことも夢ではないようです。

ネットユーザーが職を失うかもしれないと嘆くのも不思議ではない。

[[327151]]

AIアンカーが3D時代へ

パフォーマンスの面から見ると、表情の情報、体の動き、メイクの変化、あるいはニュースを報道する専門的な能力など、どの点でも「新しい小微」は前者よりも優れています。

問題は、AI合成アンカーの「新しい波」として、「新小威」がどのような技術を使って「古い波」を打ち破って浜辺に打ち上げるのかということです。

デジタルヒューマンモデルに関しては、「Xin Xiaowei」はスキャンと復元、顔の筋肉の駆動、表情と手足のキャプチャなどの技術を使用して、リアルな髪と肌の効果を復元します。

体の動きに関して言えば、収集作業には膨大な量のデータが関係する。「新小微」のプロトタイプである趙万微は、数百台のカメラが体の各部を360°全方位「ドット」スキャンするデータ収集ヘルメットをかぶる必要がある。

それだけでなく、カメラのデータ収集作業には表情のスキャンも含まれており、あらゆる形を詳細に捉えることができ、「新しい小微」誕生の基礎となっています。

さらに、Sogouのエンドツーエンドのマルチモーダルモデリング技術に基づいて、音声、画像、テキスト、3D筋肉動作データなどのマルチモーダル情報を組み合わせることで、「新小威」のモデリングトレーニングを完了することができます。

AIアルゴリズムの駆動により、「新小微」の専門能力がさらに強化され、音声テキストに合わせて顔の表情、唇の動き、ボディランゲージがすべて変化します。

「新小薇」のメイクや服装の変化は、その「マイクロモジュール」特性に基づいています。プロジェクトリーダーはさらに次のように説明した。

まるでレゴで遊ぶように、「新小威」のさまざまなパーツや表情をモジュール化し、それを組み立て直しました。

AI合成アンカーファミリー

「新小微」の就任により、新華社通信のAI合成キャスターファミリーに新たなメンバーが加わった。

2018年11月7日、新華社はホストQiu Haoをベースにした世界初の完全シミュレーションインテリジェントAIホスト「Xin Xiaohao」を歓迎しました。

[[327152]]

公式統計によると、初のAI合成キャスター「新小昊」は新華社クライアント上で500日以上視聴者にサービスを提供し、1万3000件以上のニュースレポートを制作し、累計時間は3万5000分を超えた。

SogouのCEOである王小川氏は、このインテリジェントAIホストは「Sogouアバター」技術に基づいており、実際のホストの声、唇の形、表情などの特徴を抽出し、音声合成、唇の形合成、表情合成、ディープラーニング技術を通じてそれらを複製すると紹介した。ニュースを放送する際には、テキストを提供するだけで、AI合成アンカーが模擬放送を行うことができます。

しかし、第一世代の AI 合成アンカーは素晴らしいものの、まだいくつかの欠点があります。たとえば、以前の AI 合成アンカーのプロトタイプには男性しかおらず、女性はいませんでした。また、合成アンカーには顔の表情しかなく、体の動きはありませんでした。

2019年2月から3月にかけて、AI合成キャスターは2回のバージョンアップを経て、世界初のAI合成女性キャスター「鑫小萌」が誕生しました。

「新小萌」は、第一世代のAI合成キャスターと比べて、ユーザーのニュース視聴体験をさらに向上させ、座ってニュースを放送するだけでなく、体の動きも加えています。

また、バージョンの反復により、AI 合成アンカーのカスタマイズ サイクルも継続的に短縮されます。初期の技術はまだ成熟していなかったため、大量のデータが必要でした。繰り返し作業を行うことで録画時間が短縮され、録画されるデータ量も削減されるため、数時間のビデオ素材でリアルな画像を形成できるようになります。

「新小豪」から「新小夢」、そして「新小微」まで、AI合成キャスターが登場するたびに2つの異なる声が上がり、技術の進歩を称賛する一方で、その欠点を指摘する声もある。

[[327153]]

新しく発売された「新小微」を例に挙げると、一部のネットユーザーは「AI」と読むときの「新小微」の発音が少しぎこちないと指摘しており、これも間接的に「新小微」が十分に自然ではなく、まだ完全に人間のようではないことを示しています。

しかし、技術の発展には少しずつ量的な変化を積み重ねることが必要であり、継続的な反復とアップグレードを通じて改善されなければなりません。この観点から、「新小威」は進歩を遂げてきました。

<<:  GoogleはAIを使って「ヘッドフォンケーブル」をトレーニングし、タッチスクリーンのほとんどの機能を実現

>>:  優れたビジネス機械学習のユースケース 5 つ

ブログ    
ブログ    

推薦する

AIはデジタル変革の失敗から学ぶ必要がある

1 月に IBM は、デジタル トランスフォーメーションが予測された 150% ではなく -5% ~...

5Gが普及しつつある中、人工知能は「取り残される」ことになるのか?

2018年、5Gの人気が急速に高まり始めました。その年から、我が国は5G基地局の建設を開始し、全国...

自動運転にはセンサーがいくつ必要ですか?

センサーのコストは15ドルから1ドルまで幅があり、自動車メーカーは、車両を完全に自動運転にするにはど...

マスク氏の最新インタビュー:自動運転、AI、テスラのヒューマノイドロボットについて

最近、世界一の富豪イーロン・マスク氏がTEDディレクターのクリス・アンダーソン氏が主催する独占インタ...

クラウドベースの SaaS アプリケーションで AI を活用して効率的なリモート ワークを実現する方法

現在進行中のCOVID-19パンデミックにより、企業がリモートワークを実施する必要性が浮き彫りになり...

「最もわかりにくい」Paxos アルゴリズムと、データベースの高可用性におけるその使用法をわかりやすい言葉で理解する

最近、Paxos アルゴリズムについてみんなが議論しています。私はオンラインで多くの記事を読みました...

ネイチャー長文記事:AIのブラックボックスを破るための「長期戦」

2020年2月、COVID-19が世界中で急速に広がり、抗原検査の入手が困難になったため、一部の医...

...

...

AIが新たな成長エンジンに。アマゾン ウェブ サービスの技術的手法に耳を傾けてみよう

AI は数年前にテクノロジーの世界で人気を博しましたが、今では何千もの業界で革新と徹底的な応用が行わ...

マイクロソフトは、Bingチャットのベテラン向けにエキスパートモードの導入を検討中:より複雑なUIとより豊富な機能

7月26日、マイクロソフト広告およびウェブサービスのCEOであるミハイル・パラキン氏は、ネットユーザ...

機械学習の世界的ゴッドファーザーであるトム・ミッチェルは、スクワールAIラーニングに入社すると発表した。

トム・ミッチェル教授は、スクワレルAIラーニングからの最高AI責任者としての招待を受け入れたことを正...

生死に関わる問題:病院のICU病棟で人工知能は何ができるのか?

病院の集中治療室 (ICU) では、重病の患者を一日中一連の機器に接続し、いつでもバイタルサインを監...

...

自律走行レースのためのマルチモーダルセンサーフュージョンとターゲット追跡

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...