この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵を描くのが得意ではないけれど、自分だけの2Dワイフが欲しい場合はどうすればいいでしょうか？

問題ない。

本当に、手があればいいんです:

この AI はかなり優秀だと言わざるを得ません。彼女が描いた絵はまさに私の将来の妻に似ています!

はい、スケッチさえ提供できれば、AI はそれを二次元美少女に変換できるので、「どんなにスケッチっぽくても問題ありません」と言えます。

このAIは、日本のイラストサイト「Pixiv」の公式技術者によって「パートタイム」で開発されたもので、かつてはデイリートレンドリストのトップにランクインし、現在では約16万件の「いいね！」を獲得している。

その後、作者は512個のパラメータスライダーも追加し、ペイントスタイル、顔の投影、形状など、さまざまな側面を変更できるようになりました。詳細な設定は8192種類にも達しました。

コメント欄のネットユーザーはこう言った。

やめて！アーティストをこれ以上時代遅れにしないでください!

障害者でも描ける

下のコメント欄は現在、3つの主要な陣営によって占められています。

AI の絵画から新しい妻を幸せに選ぶ人もいます。

コメント欄には「大好きな顔が一瞬で現れてびっくり」といったコメントが溢れるだろうと思っていたら、そうでもなかった。それで、私のお気に入りをいくつか投稿しました。とてもかわいいです...

あ、ちなみにこの子を突き飛ばしたのは私です。

この小さな AI から離れて、このテクノロジーがイラストレーターの仕事を奪っているかどうかを真剣に考えることもできます。

コメント欄の最前列にいた個人イラストレーターと同じように、彼も複雑な気持ちだった。

もし誰かが私に、これによって画家としての仕事を失うことになるかと尋ねたら、私の答えは「いいえ」でしょう。しかし、私のように一生懸命働いている人間にとっては、この技術を説明するのは少し難しいように感じます。

漫画の神様・手塚治虫の全作品を学習し、手塚治虫風の新作「ぱいどん」を「創作」したという以前のAIを思い浮かべる人もいただろう。

テクノロジーが創作活動に干渉するというこの傾向について、ネットユーザーたちは、これが真の芸術的創作活動にとって祝福なのか呪いなのか分からないと述べている…

しかし、「考えすぎだ」と言う穏健派も多くいます。

世界一のお姫様、バーチャルシンガーの初音ミクのように、彼女の登場でリアルシンガーの数が減ることはないですよね？

それどころか、彼女のおかげで多くの若者が音楽に夢中になったのです。

そのため、どれだけ技術が発達しても「画家が必要なくなる」という状況は起こりません。

「テクノロジーは単なるツールに過ぎない」と固く信じているコメントもあります。

原作者の作業には影響はありませんが、アニメの制作効率は向上します。

もちろん、こうしたやや白熱した議論に加え、作者はデモ動画のみを公開しているため、コメント欄にはオープンソースやデモを求めるネットユーザーが多数現れている。

StyleGANをベースにした開発

著者は直接回答しなかったが、これまでの号ではスケッチから絵や顔を生成するための多くの手法を紹介してきた。

この AI もStyleGAN をベースにさらに発展したものになるはずです。

2019年に登場したこのアルゴリズムは、顔生成技術における大きな前進と言えるでしょう。

これまでの GAN は画像生成の解像度と品質に優れていましたが、研究者は画像のランダムな特徴を制御する方法など、画像生成プロセスをより深く理解できていません。

StyleGAN は GAN のジェネレーターネットワーク構造を再設計しました。

ジェネレーターは学習した定数入力から開始し、潜在コードに基づいて各畳み込み層の画像「スタイル」を調整し、それによって画像の特徴、ひいては画像生成プロセス全体を直接制御します。

同時に、このプロセスはネットワークに直接注入されたノイズと組み合わせて、生成された画像のランダムな特性を直接変更できるため、StyleGAN に基づく新しいものが無限にあることもわかります。

著者はPixiv公式技術チームのメンバーです

実は冒頭でも述べたように、このAIは作者による実験的なアマチュア開発であり、開発者自身はPixiv公式VRoidチームのメンバーです。

このチームの主力製品は、Pixivが2018年にリリースした「2D方式で3Dモデルを作る」ことにフォーカスした3Dキャラクター作成ソフトウェア「VRoid Studio」です。

このように、アーティストはソフトウェアにプリセットされた 3D モデルに 2D で直接描画し、必要に応じてパラメータを調整できます。調整の結果は、3D モデルにリアルタイムで反映されます。

おそらくそれは彼の職業に関係しているのでしょう。開発者はまた、将来的には、スケッチを漫画に変換できるアマチュアAIに3Dモデル生成機能を追加し、スケッチから3次元までをワンステップで実行できるようにすると述べました。

この点に関しては、私のような不器用な人間は「GKD」としか言えません。

<<: ビッグデータアルゴリズムにもっと積極的な役割を担わせる

>>: データの筒状のビジョンを避け、人間と機械の調和のとれた共生関係を築く

ブログ

Fei-Fei Li DeepMind の新しい「コードチェーン」が CoT を圧倒! Pythonコード推論を使用することで、大規模モデルのパフォーマンスが12%向上しました。

ブログ

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

障害者でも描ける

StyleGANをベースにした開発

著者はPixiv公式技術チームのメンバーです

Fei-Fei Li DeepMind の新しい「コードチェーン」が CoT を圧倒! Pythonコード推論を使用することで、大規模モデルのパフォーマンスが12%向上しました。

人工知能が高等教育を支援する：変化と持続

IBM、海洋ゴミに関する質問に答えるAIアバターを開発

AI アバターが CES に登場! Samsung の Neon チャットボットは学習、進化、記憶が可能です!

人工知能エンジニアリングについて知らないかもしれない7つのこと

スループットが約30倍に増加しました。田元東チームの最新論文は、大規模モデル展開の問題を解決している

推薦する

責任あるAIの構築

機械学習プロジェクトの完全な構築プロセスとタスクリストが公開されており、収集する価値があります。

512 個の GPU が 10 兆個のパラメータを持つ巨大モデルを作成します。このモデルは今年のダブルイレブンで使用されました

自動運転にはバブルが必要

人工知能は本当に万能なのでしょうか？

再ハッシュ: ブルームフィルタアルゴリズムの実装原理を理解する

私の国は自動運転のための最初の閉鎖された高速道路テスト環境を構築しました

2016年の音声認識の発展を技術的な観点から振り返る

エッジでの機械学習を活用して生産ラインの品質を向上させる方法

スマートウォッチからスマートコンタクトレンズまで、ウェアラブルデバイスはどのように進化しているのでしょうか?

人工知能とはいったい何でしょうか?それは人間に取って代わるのでしょうか？ AIのすべてを解説した本