カメラを開くと、2Dイラストがリアルタイムでアニメーション化されます。中国のプログラマーが制作し、デモはオンラインで入手できます。

カメラを開くと、2Dイラストがリアルタイムでアニメーション化されます。中国のプログラマーが制作し、デモはオンラインで入手できます。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

アライグマを描いて、「代金を徴収」するクローズアップを撮るには、何ステップ必要ですか?

必要なのは、Tom Nook にスケルトンを添付し、エクスポートした SVG ファイルをブラウザにドラッグするだけです。

ちょうどこのように、トム・ヌークはカメラの前であなたが動くのと同じように動きます。

この TensorFlow.js プロジェクトは Pose Animator と呼ばれています。デモがリリースされるとすぐに、ネットユーザーたちは大喜びしました。

たとえば、デザイナーの Julia Jaskólska は、ダンスとイラストを完璧に組み合わせています。

身体を鍛えるだけでなく、新たな創造の可能性も開きます。

彼女は楽しそうにこうコメントした。

自分のイラストをアニメーション化するのがこんなに簡単だとは思っていませんでした!

実装の詳細

では、イラストはどのようにして生まれるのでしょうか?

Pose Animatorは、PoseNetとFaceMeshという2つのTensorFlow.jsモデルの認識結果に基づいて、2Dベクター画像とそのスケルトンのリアルタイムアニメーション処理を実行することを紹介しました。

その中で、コンピュータグラフィックスにおけるスケルタルアニメーションの考え方が借用され、ベクターキャラクターに適用されています。

スケルタルアニメーションでは、キャラクターは 2 つの部分で構成されます。

1 つ目はモデルを描画するためのスキン、2 つ目は動きを制御する鍵となるスケルトンです。

Pose Animator では、スキンは入力 SVG ファイル内の 2D ベクター パスによって定義されます。

さらに、Pose Animator は、PoseNet と FaceMesh に基づいたプリセットのボーン階層表現を提供します。

スケルトン構造の初期ポーズは、入力 SVG ファイルでユーザーによって指定されます。

その後、機械学習モデルの認識結果に基づいて、リアルタイムの骨の位置が更新されます。

現在、作者は 2 つの Web デモを公開しています。

レンズで撮影した画像に基づいてリアルタイムで動く 2D 画像。

もう 1 つは静止画像用です。

したがって、興味がある場合は、コンピューターの Chrome と iOS Safari の 2 つのブラウザーでプレイできます。

さらに、QuantumBit はテスト済みで、Android フォンの Chrome でも利用できます。

中国のプログラマーが制作

Pose Animator の作者は、Google のクリエイティブ テクノロジーの専門家である Shan Huang です。

[[325571]]

Shan Huang はカーネギーメロン大学を卒業し、コンピュータサイエンスの学士号とヒューマンコンピュータインタラクションの副専攻を取得しました。 2014年にGoogle(上海)に入社。

当時インターネット上で流行していた絵当てソング企画も彼女が始めたもの。

ポータル

GitHub プロジェクト: https://github.com/yemount/pose-animator

カメラキャプチャデモ: https://pose-animator-demo.firebaseapp.com/camera.html

画像バージョンデモ: https://pose-animator-demo.firebaseapp.com/static_image.html

<<:  エッジインテリジェンス: AIの次の波

>>:  ニューラル ネットワークを構築する超簡単な方法、あなたにもできます!

ブログ    
ブログ    
ブログ    

推薦する

...

2000億回のオープン学習を経て、DeepMindのAIはさらに洗練されてきた

[[415688]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

ロボット工学は良いが、誇張しすぎるのは良くない

現在、ロボット工学は科学技術分野における最先端技術となっており、先進国は、この技術面で優位に立つこと...

Python でシンプルなニューラル ネットワークを作成する方法 (コード付き)

[[251984]]ニューラル ネットワークの仕組みを理解する最良の方法は、自分でニューラル ネッ...

銀行、金融、保険業界に革命をもたらす主要技術

不安定な市場環境、規制上のハードル、そしてBrexitは、好況時でも最も回復力のある企業にさえ課題を...

劉玉樹:人工知能における中国と米国の格差は縮まっているが、まだやるべきことはある

著者の劉玉樹氏は中国人民大学重陽金融研究所学務委員会委員、マクロ研究部部長、研究者である。本稿は11...

ディープラーニングベースの対話状態追跡のレビュー

[[408715]] 1. はじめに1.1 研究の背景インターネットと個人用スマート端末の普及と幅広...

AI 請求書認識を実現する PaddleOCR ベースの Asp.net Core アプリケーション

簡単な紹介ユーザーは、認識する必要のある写真を一括でアップロードします。アップロードが成功すると、シ...

...

「ムスク」がスピーキングの練習に役立ちます! GitHub のリアルタイム AI 音声チャットが話題に

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Go 言語アルゴリズムの美しさ - 基本的なソート

[[404642]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...

...

ロボティック プロセス オートメーションについて知っておくべき 10 のこと

[[381496]]ロボティック プロセス オートメーションにより、ワークフローが合理化され、レガシ...

「アルゴリズムとデータ構造」では、バックトラッキングアルゴリズムの美しさを紹介します。

[[345679]]序文今回は、バックトラッキング アルゴリズムについて確認します。この問題解決の...