この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵を描くのが得意ではないけれど、自分だけの2Dワイフが欲しい場合はどうすればいいでしょうか?

問題ない。

本当に、手があればいいんです:

この AI はかなり優秀だと言わざるを得ません。彼女が描いた絵はまさに私の将来の妻に似ています!

はい、スケッチさえ提供できれば、AI はそれを二次元美少女に変換できるので、「どんなにスケッチっぽくても問題ありません」と言えます。

このAIは、日本のイラストサイト「Pixiv」の公式技術者によって「パートタイム」で開発されたもので、かつてはデイリートレンドリストのトップにランクインし、現在では約16万件の「いいね!」を獲得している。

その後、作者は512個のパラメータスライダーも追加し、ペイントスタイル、顔の投影、形状など、さまざまな側面を変更できるようになりました。詳細な設定は8192種類にも達しました。

コメント欄のネットユーザーはこう言った。

やめて!アーティストをこれ以上時代遅れにしないでください!

障害者でも描ける

下のコメント欄は現在、3つの主要な陣営によって占められています。

AI の絵画から新しい妻を幸せに選ぶ人もいます。

コメント欄には「大好きな顔が一瞬で現れてびっくり」といったコメントが溢れるだろうと思っていたら、そうでもなかった。それで、私のお気に入りをいくつか投稿しました。とてもかわいいです...

あ、ちなみにこの子を突き飛ばしたのは私です。

この小さな AI から離れて、このテクノロジーがイラストレーターの仕事を奪っているかどうかを真剣に考えることもできます。

コメント欄の最前列にいた個人イラストレーターと同じように、彼も複雑な気持ちだった。

もし誰かが私に、これによって画家としての仕事を失うことになるかと尋ねたら、私の答えは「いいえ」でしょう。しかし、私のように一生懸命働いている人間にとっては、この技術を説明するのは少し難しいように感じます。

漫画の神様・手塚治虫の全作品を学習し、手塚治虫風の新作「ぱいどん」を「創作」したという以前のAIを思い浮かべる人もいただろう。

テクノロジーが創作活動に干渉するというこの傾向について、ネットユーザーたちは、これが真の芸術的創作活動にとって祝福なのか呪いなのか分からないと述べている…

しかし、「考えすぎだ」と言う穏健派も多くいます。

世界一のお姫様、バーチャルシンガーの初音ミクのように、彼女の登場でリアルシンガーの数が減ることはないですよね?

それどころか、彼女のおかげで多くの若者が音楽に夢中になったのです。

そのため、どれだけ技術が発達しても「画家が必要なくなる」という状況は起こりません。

「テクノロジーは単なるツールに過ぎない」と固く信じているコメントもあります。

原作者の作業には影響はありませんが、アニメの制作効率は向上します。

もちろん、こうしたやや白熱した議論に加え、作者はデモ動画のみを公開しているため、コメント欄にはオープンソースやデモを求めるネットユーザーが多数現れている。

StyleGANをベースにした開発

著者は直接回答しなかったが、これまでの号ではスケッチから絵や顔を生成するための多くの手法を紹介してきた。

この AI もStyleGAN をベースにさらに発展したものになるはずです。

2019年に登場したこのアルゴリズムは、顔生成技術における大きな前進と言えるでしょう。

これまでの GAN は画像生成の解像度と品質に優れていましたが、研究者は画像のランダムな特徴を制御する方法など、画像生成プロセスをより深く理解できていません。

StyleGAN は GAN のジェネレーター ネットワーク構造を再設計しました。

ジェネレーターは学習した定数入力から開始し、潜在コードに基づいて各畳み込み層の画像「スタイル」を調整し、それによって画像の特徴、ひいては画像生成プロセス全体を直接制御します。

同時に、このプロセスはネットワークに直接注入されたノイズと組み合わせて、生成された画像のランダムな特性を直接変更できるため、StyleGAN に基づく新しいものが無限にあることもわかります。

著者はPixiv公式技術チームのメンバーです

実は冒頭でも述べたように、このAIは作者による実験的なアマチュア開発であり、開発者自身はPixiv公式VRoidチームのメンバーです。

このチームの主力製品は、Pixivが2018年にリリースした「2D方式で3Dモデルを作る」ことにフォーカスした3Dキャラクター作成ソフトウェア「VRoid Studio」です。

このように、アーティストはソフトウェアにプリセットされた 3D モデルに 2D で直接描画し、必要に応じてパラメータを調整できます。調整の結果は、3D モデルにリアルタイムで反映されます。

おそらくそれは彼の職業に関係しているのでしょう。開発者はまた、将来的には、スケッチを漫画に変換できるアマチュアAIに3Dモデル生成機能を追加し、スケッチから3次元までをワンステップで実行できるようにすると述べました。

この点に関しては、私のような不器用な人間は「GKD」としか言えません。

<<:  ビッグデータアルゴリズムにもっと積極的な役割を担わせる

>>:  データの筒状のビジョンを避け、人間と機械の調和のとれた共生関係を築く

ブログ    
ブログ    

推薦する

マイクロソフト、進化拡散法を用いたタンパク質生成のための新しい AI フレームワーク EvoDiff をオープンソース化

進化により、細胞プロセスを正確に制御する多様な機能性タンパク質が生み出されました。近年、この多様性か...

従来のプログラマーはどのように AI を変革し、学習するのでしょうか?アリババは最前線のアルゴリズムチームが開発したコアAI技術をオープンソース化

次のような疑問を持ったことはありませんか?人工知能は非常に人気があります。従来のプログラマーとして、...

...

DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

人工知能(AI)は人類社会を真に知的な時代へと導くことができるのでしょうか?人工知能産業は60年以上...

12ページの線形代数ノートがGitHubのホットリストに掲載され、ギルバート・ストラングからの手書きの署名も受け取っている。

すでに誰かが線形代数の要点を描くのを手伝ってくれています。全12ページ、半分がイラストなので初心者で...

TCP/IPトランスポート層におけるTCP BBRアルゴリズムについての簡単な説明

0x00. はじめにこれは、TCP/IP プロトコル スタック シリーズの 3 番目の記事です。前回...

...

復活したジャンルのトップ10を数えると、必ず気に入るジャンルが見つかる

統計モデルやその他のアルゴリズムに加えて、回帰は機械学習を正常に動作させるための重要な要素です。回帰...

原理から応用まで: ロジスティック回帰アルゴリズムの簡単な説明

ロジスティック回帰は、バイナリ分類タスクで最も一般的に使用される機械学習アルゴリズムの 1 つです。...

...

...

マテリアル界のImageNet、大規模6次元マテリアル実写データベースOpenSVBRDFを公開

計算グラフィックス分野では、マテリアルの外観は、実際のオブジェクトと光の間の複雑な物理的相互作用を表...

...