安定拡散法を使って超リアルな人間の顔を生成する3つの方法

安定拡散法を使って超リアルな人間の顔を生成する3つの方法

翻訳者 |ブガッティ

レビュー | Chonglou

他の人はAI画像を使ってリアルなを生成できるのに、自分顔は欠陥歪みだらけで明らかに偽物のように見えてしまうのなぜだろう、と不思議に思ったことはありませんか?プロンプトや設定を調整してみましたが、の人が生成した画像品質匹敵することができませんでした何を間違えたのです?

このブログ記事では、Stable Diffusion を使用して超リアルな人間の顔を生成するための3 つの主要な手法について説明します。まず、基本モデルを使用して画像を生成できるように、プロンプト エンジニアリングの基礎について説明します次に、安定拡散へのアップグレード方法について説明します。 XLモデルは、より大きなパラメータとトレーニングを通じて画像の品質を大幅に向上させることができます。最後に、高品質な画像を生成するために特別に設計されたカスタムモデルを紹介します

1.迅速なエンジニアリング

まず、現実的なを生成するために、肯定的な手がかりと否定的な手がかりを書く方法を学びます Hugging Face Spacesで入手可能なStable Diffusionバージョン2.1デモ使用します。無料で、始めるために何も設定する必要はありません

リンク: hf.co/spaces/stabilityai/stable-diffusion

ポジティブなプロンプトを作成するときは、画像の必要な詳細とスタイルをすべて含めるようにしてくださいこの例では、通りを歩いている若い女性の画像を生成したいと考えています。基本的な否定的な手がかりを使用しますが、画像内での間違いの繰り返しを避けるために、追加のキーワードを追加することもできます

ポジティブなヒント: 20 代若い女性が、都会の街の風景を背景に、晴れた日中の光と明るい色彩の中、自信に満ちたフレンドリーな表情でカメラをまっすぐに見つめながら、カジュアルモダンでスタイリッシュな服を着て通りを歩いています。

否定的なヒント: 「醜い外観醜い、未熟、漫画、アニメ、 3D 描画、漫画、イラスト、最悪な品質、低品質」。

順調なスタートを切りました。画像は正確ですが、画像の品質は改善の余地があります。ヒントを微調整することもできます、これが基本モデルから得られる最良のものです。

2.安定拡散 XL

安定拡散法を使用する 高品質の画像を生成するためのXL ( SDXL )モデル。潜在画像まずベースモードを使用して生成され、次にリファイナーを使用して処理され、詳細で正確な画像が生成されます

リンク: hf.co/spaces/hysts/SD-XL

画像を生成する前に、下にスクロールし詳細オプション」を開きますネガティブヒントを追加し、シードを設定し、リファイナーを適用して、最高の画像品質を実現します。

次に、いくつかの小さな変更を加えて、前と同じプロンプトを記述します。一般的な若い女性画像を生成する代わりに若いインド人女性の画像を生成します

この結果は大幅に改善されました。顔立ちも完璧です。他の民族の顔を生成して偏りがないか確認し、結果を比較してみましょう。

リアルな顔が撮れますが、すべての画像Instagramフィルターがかかっています。通常、実際の肌は滑らかではなく、ニキビ、シミ、そばかす、シワがあります

3. CivitAI : RealVisXL V2.0

この部分では傷跡とリアルな肌を持つ詳細な人間の顔を生成しますこの目的のために、高品質の画像を取得するために微調整されたCivitAIカスタム モデル( RealVisXL V2.0 )を使用します

リンク: civitai.com/models/139562/realvisxl-v20

作成ボタンをクリックしてモデルをオンラインで使用したり Stable Diffusion WebUIからダウンロードしてローカルで使用することもできます。

まず、モデルをダウンロードしファイルStable Diffusion Web UIモデルディレクトリ( C:\WebUI\ webui \models\Stable- Diffusion)に移動します

Web UIにモデルを表示するには更新ボタンを押して、 realvisxl20… モデル チェックポイントを選択する必要があります

まず、同一の肯定プロンプト否定プロンプトを記述し、高品質の 1024X1024 画像を生成します。

この写真は完璧ですね。カスタム モデルを最大限に活用するには、プロンプトを変更する必要があります。

モデル ページを下にスクロールし、気に入ったフォトリアリスティックな画像をクリックすると、新しい肯定および否定的なヒントが表示されます。 CivitAI の画像には、肯定的および否定的な手がかりと高度なステアリングが付属しています

ポジティブなヒント: 「インドの若い女性の画像、集中力があり、決意に満ち、リアル、ダイナミックなポーズ、超高解像度、シャープな質感、高精細の RAW 写真、繊細な人間の顔、浅い被写界深度、鋭い目、 (リアルな肌の質感: 1.2 ) 、明るい肌、 DSLR 、フィルムの質感

否定的なプロンプト: 「(最低品質、低品質、イラスト、3D 2D 絵画、漫画、スケッチ) 、口を開けて

リアルな肌を持つインド人女性の詳細な画像があります。基本のSDXLモデル比べて改良されたバージョンです

異なる人種を比較するために、さらに3 つの画像を生成しました。肌の傷跡、肌の凹凸顔の特徴の正確さなど、結果は驚くべきものでした

結論は

ジェネレーティブアート進歩は、まもなく現実の画像と合成画像を区別できないレベルに到達するでしょう。これは、さまざまな現実世界のデータに基づいてトレーニングされたカスタム モデルを使用して、簡単なテキスト プロンプトから誰でも非常にリアルなスプレッド可能なメディアを作成できる未来を示しています。急速な進歩は刺激的な可能性を意味します。おそらく、いつの日か、リアルな動画を制作することが、説明文を入力するのと同じくらい簡単になるかもしれません。

本稿では、非常に正確でリアルなを生成するためのヒントエンジニアリング高度な安定したデザインモデル、衣服の微調整モデルについて学習しますより良い結果必要場合はcivitai.com でさまざまな高品質モデルを調べることをお勧めします

原題:安定拡散法を使用して超リアルな顔を生成する 3 つの方法、著者: Abid Ali Awan


<<:  マスク氏、ロボット「オプティマスプライム」が服を畳む動画を公開、動きはゆっくりだが自然

>>:  AI戦争が近づく中、ChatGPTが軍事禁止を解除

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2023 年のエンタープライズ AI トレンド トップ 10

2022 年の AI に関する大きな話題は、研究室や概念実証から生まれ、ビジネス価値を獲得するため...

孔俊:中国は人工知能の軍事応用を規制する措置を講じている

2021年8月29日、カブールの空に大きな爆発音が響き、米軍の無人機が7人の子供を含む10人の罪のな...

Meta がピクセルレベルのモーション トラッキング モデルを発表、簡易版はオンラインで利用可能

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2019年の人工知能レビュー:産業の発展は急速な進展を遂げている

2019年、中国の人工知能市場は「熱狂的」だった。IDCの統計によると、世界の人工知能市場規模は20...

...

34 個の事前トレーニング済みモデルを比較して再現します。PyTorch と Keras のどちらを選択しますか?

Keras と PyTorch は確かに最も初心者に優しいディープラーニング フレームワークであり...

...

30年の沈黙と60年の経験を経て、「人工知能」の過去と現在とは?

30年以上沈黙していた「人工知能」という言葉は、ここ2年で非常に人気が高まり、テクノロジー企業の主...

ついに、データ、情報、アルゴリズム、統計、確率、データマイニングをわかりやすく説明してくれる人がいました!

[[282346]]データとは何かデータとは何でしょうか? これは私たちがほとんど無視する質問にな...

物流業界におけるインテリジェント化のトレンドは、倉庫ロボットの将来性を浮き彫りにしています。

近年、電子商取引業界の急速な発展により、物流業界、特に物流倉庫に対する要求は徐々に高まっています。人...

AIが書いた記事は教師を本当に騙すことができる

過去数年間、機械学習 (ML) と人工知能 (AI) の専門家は、以前は完全に人間が実行できると考え...

ロボットが人間のように学習できるようにする Google RT-2 AI モデルとは何ですか?

ビッグモデルが急増し、仮想世界から現実世界に進出しています。 Google DeepMind は最近...

...

AIの民主化:ローコードおよびノー​​コードソリューションの台頭

今年初め、イノベーション、リサーチ、インキュベーションのグローバルディレクターであるルネ・シュルテ氏...

C# バイナリ ツリー トラバーサル アルゴリズムの実装の簡単な分析

C# アルゴリズムは、バイナリ ツリーの定義、既知のバイナリ ツリーの構築方法、および C# でバイ...