この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵を描くのが得意ではないけれど、自分だけの2Dワイフが欲しい場合はどうすればいいでしょうか?

問題ない。

本当に、手があればいいんです:

この AI はかなり優秀だと言わざるを得ません。彼女が描いた絵はまさに私の将来の妻に似ています!

はい、スケッチさえ提供できれば、AI はそれを二次元美少女に変換できるので、「どんなにスケッチっぽくても問題ありません」と言えます。

このAIは、日本のイラストサイト「Pixiv」の公式技術者によって「パートタイム」で開発されたもので、かつてはデイリートレンドリストのトップにランクインし、現在では約16万件の「いいね!」を獲得している。

その後、作者は512個のパラメータスライダーも追加し、ペイントスタイル、顔の投影、形状など、さまざまな側面を変更できるようになりました。詳細な設定は8192種類にも達しました。

コメント欄のネットユーザーはこう言った。

やめて!アーティストをこれ以上時代遅れにしないでください!

障害者でも描ける

下のコメント欄は現在、3つの主要な陣営によって占められています。

AI の絵画から新しい妻を幸せに選ぶ人もいます。

コメント欄には「大好きな顔が一瞬で現れてびっくり」といったコメントが溢れるだろうと思っていたら、そうでもなかった。それで、私のお気に入りをいくつか投稿しました。とてもかわいいです...

あ、ちなみにこの子を突き飛ばしたのは私です。

この小さな AI から離れて、このテクノロジーがイラストレーターの仕事を奪っているかどうかを真剣に考えることもできます。

コメント欄の最前列にいた個人イラストレーターと同じように、彼も複雑な気持ちだった。

もし誰かが私に、これによって画家としての仕事を失うことになるかと尋ねたら、私の答えは「いいえ」でしょう。しかし、私のように一生懸命働いている人間にとっては、この技術を説明するのは少し難しいように感じます。

漫画の神様・手塚治虫の全作品を学習し、手塚治虫風の新作「ぱいどん」を「創作」したという以前のAIを思い浮かべる人もいただろう。

テクノロジーが創作活動に干渉するというこの傾向について、ネットユーザーたちは、これが真の芸術的創作活動にとって祝福なのか呪いなのか分からないと述べている…

しかし、「考えすぎだ」と言う穏健派も多くいます。

世界一のお姫様、バーチャルシンガーの初音ミクのように、彼女の登場でリアルシンガーの数が減ることはないですよね?

それどころか、彼女のおかげで多くの若者が音楽に夢中になったのです。

そのため、どれだけ技術が発達しても「画家が必要なくなる」という状況は起こりません。

「テクノロジーは単なるツールに過ぎない」と固く信じているコメントもあります。

原作者の作業には影響はありませんが、アニメの制作効率は向上します。

もちろん、こうしたやや白熱した議論に加え、作者はデモ動画のみを公開しているため、コメント欄にはオープンソースやデモを求めるネットユーザーが多数現れている。

StyleGANをベースにした開発

著者は直接回答しなかったが、これまでの号ではスケッチから絵や顔を生成するための多くの手法を紹介してきた。

この AI もStyleGAN をベースにさらに発展したものになるはずです。

2019年に登場したこのアルゴリズムは、顔生成技術における大きな前進と言えるでしょう。

これまでの GAN は画像生成の解像度と品質に優れていましたが、研究者は画像のランダムな特徴を制御する方法など、画像生成プロセスをより深く理解できていません。

StyleGAN は GAN のジェネレーター ネットワーク構造を再設計しました。

ジェネレーターは学習した定数入力から開始し、潜在コードに基づいて各畳み込み層の画像「スタイル」を調整し、それによって画像の特徴、ひいては画像生成プロセス全体を直接制御します。

同時に、このプロセスはネットワークに直接注入されたノイズと組み合わせて、生成された画像のランダムな特性を直接変更できるため、StyleGAN に基づく新しいものが無限にあることもわかります。

著者はPixiv公式技術チームのメンバーです

実は冒頭でも述べたように、このAIは作者による実験的なアマチュア開発であり、開発者自身はPixiv公式VRoidチームのメンバーです。

このチームの主力製品は、Pixivが2018年にリリースした「2D方式で3Dモデルを作る」ことにフォーカスした3Dキャラクター作成ソフトウェア「VRoid Studio」です。

このように、アーティストはソフトウェアにプリセットされた 3D モデルに 2D で直接描画し、必要に応じてパラメータを調整できます。調整の結果は、3D モデルにリアルタイムで反映されます。

おそらくそれは彼の職業に関係しているのでしょう。開発者はまた、将来的には、スケッチを漫画に変換できるアマチュアAIに3Dモデル生成機能を追加し、スケッチから3次元までをワンステップで実行できるようにすると述べました。

この点に関しては、私のような不器用な人間は「GKD」としか言えません。

<<:  ビッグデータアルゴリズムにもっと積極的な役割を担わせる

>>:  データの筒状のビジョンを避け、人間と機械の調和のとれた共生関係を築く

ブログ    
ブログ    
ブログ    

推薦する

分散型AIで製造業を強化

家庭内の新しい仮想アシスタントから、受信トレイから迷惑メールを削除するスパムフィルターまで、人工知能...

プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある

この時代において、プライバシーは長い間誤った主張となってきました。プライバシー保護をある程度回復する...

ディープフェイクは今回、顔を変えるだけでなく、街そのものを変えてしまった。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

清華大学がサッカーAIを開発:初めて10人の選手を同時にコントロールして試合を完了し、勝率は94.4%

[[434349]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

RNN モデルが Transformer の覇権に挑戦!ミストラル7Bに匹敵する1%のコストパフォーマンス、世界最多の100以上の言語をサポート

ビッグモデルが退化する中、トランスフォーマーの地位も次々と脅かされてきました。最近、RWKV は最新...

自然言語処理シーケンスモデル - CRF 条件付きランダムフィールド

シーケンスモデルにおけるHMM(隠れマルコフモデル)を習得した後は、別のシーケンスモデルであるCRF...

2020年のAIの7つの開発トレンド

[[320187]]追加の AI アプリケーションの需要が高まるにつれて、企業はデータ サイエンス ...

...

AIを実際にどのように実装するかまだ検討中ですか? OpenPOWERは未来がここにあることを伝えます

[51CTO.com からのオリジナル記事] モノのインターネットの普及とセンサーの広範な使用により...

Transformer 機械学習モデルとは何ですか?

翻訳者 | 李睿校正:孫淑娟近年、Transformer 機械学習モデルは、ディープラーニングとディ...

「新世代人工知能」の10の応用シナリオが北京宜荘に上陸

[[349350]] 10月29日、北京亦荘イノベーション発表体験研究イベントで記者らが自動運転タク...

...

...

Googleは、ニュースコンテンツを作成するために生成AIツールを使用するためにいくつかの出版社と提携していると報じられている。

2月28日、Adweekは、Googleがいくつかの出版社と、ニュースコンテンツを作成するための新...