安定拡散法を使って超リアルな人間の顔を生成する3つの方法

安定拡散法を使って超リアルな人間の顔を生成する3つの方法

翻訳者 |ブガッティ

レビュー | Chonglou

他の人はAI画像を使ってリアルなを生成できるのに、自分顔は欠陥歪みだらけで明らかに偽物のように見えてしまうのなぜだろう、と不思議に思ったことはありませんか?プロンプトや設定を調整してみましたが、の人が生成した画像品質匹敵することができませんでした何を間違えたのです?

このブログ記事では、Stable Diffusion を使用して超リアルな人間の顔を生成するための3 つの主要な手法について説明します。まず、基本モデルを使用して画像を生成できるように、プロンプト エンジニアリングの基礎について説明します次に、安定拡散へのアップグレード方法について説明します。 XLモデルは、より大きなパラメータとトレーニングを通じて画像の品質を大幅に向上させることができます。最後に、高品質な画像を生成するために特別に設計されたカスタムモデルを紹介します

1.迅速なエンジニアリング

まず、現実的なを生成するために、肯定的な手がかりと否定的な手がかりを書く方法を学びます Hugging Face Spacesで入手可能なStable Diffusionバージョン2.1デモ使用します。無料で、始めるために何も設定する必要はありません

リンク: hf.co/spaces/stabilityai/stable-diffusion

ポジティブなプロンプトを作成するときは、画像の必要な詳細とスタイルをすべて含めるようにしてくださいこの例では、通りを歩いている若い女性の画像を生成したいと考えています。基本的な否定的な手がかりを使用しますが、画像内での間違いの繰り返しを避けるために、追加のキーワードを追加することもできます

ポジティブなヒント: 20 代若い女性が、都会の街の風景を背景に、晴れた日中の光と明るい色彩の中、自信に満ちたフレンドリーな表情でカメラをまっすぐに見つめながら、カジュアルモダンでスタイリッシュな服を着て通りを歩いています。

否定的なヒント: 「醜い外観醜い、未熟、漫画、アニメ、 3D 描画、漫画、イラスト、最悪な品質、低品質」。

順調なスタートを切りました。画像は正確ですが、画像の品質は改善の余地があります。ヒントを微調整することもできます、これが基本モデルから得られる最良のものです。

2.安定拡散 XL

安定拡散法を使用する 高品質の画像を生成するためのXL ( SDXL )モデル。潜在画像まずベースモードを使用して生成され、次にリファイナーを使用して処理され、詳細で正確な画像が生成されます

リンク: hf.co/spaces/hysts/SD-XL

画像を生成する前に、下にスクロールし詳細オプション」を開きますネガティブヒントを追加し、シードを設定し、リファイナーを適用して、最高の画像品質を実現します。

次に、いくつかの小さな変更を加えて、前と同じプロンプトを記述します。一般的な若い女性画像を生成する代わりに若いインド人女性の画像を生成します

この結果は大幅に改善されました。顔立ちも完璧です。他の民族の顔を生成して偏りがないか確認し、結果を比較してみましょう。

リアルな顔が撮れますが、すべての画像Instagramフィルターがかかっています。通常、実際の肌は滑らかではなく、ニキビ、シミ、そばかす、シワがあります

3. CivitAI : RealVisXL V2.0

この部分では傷跡とリアルな肌を持つ詳細な人間の顔を生成しますこの目的のために、高品質の画像を取得するために微調整されたCivitAIカスタム モデル( RealVisXL V2.0 )を使用します

リンク: civitai.com/models/139562/realvisxl-v20

作成ボタンをクリックしてモデルをオンラインで使用したり Stable Diffusion WebUIからダウンロードしてローカルで使用することもできます。

まず、モデルをダウンロードしファイルStable Diffusion Web UIモデルディレクトリ( C:\WebUI\ webui \models\Stable- Diffusion)に移動します

Web UIにモデルを表示するには更新ボタンを押して、 realvisxl20… モデル チェックポイントを選択する必要があります

まず、同一の肯定プロンプト否定プロンプトを記述し、高品質の 1024X1024 画像を生成します。

この写真は完璧ですね。カスタム モデルを最大限に活用するには、プロンプトを変更する必要があります。

モデル ページを下にスクロールし、気に入ったフォトリアリスティックな画像をクリックすると、新しい肯定および否定的なヒントが表示されます。 CivitAI の画像には、肯定的および否定的な手がかりと高度なステアリングが付属しています

ポジティブなヒント: 「インドの若い女性の画像、集中力があり、決意に満ち、リアル、ダイナミックなポーズ、超高解像度、シャープな質感、高精細の RAW 写真、繊細な人間の顔、浅い被写界深度、鋭い目、 (リアルな肌の質感: 1.2 ) 、明るい肌、 DSLR 、フィルムの質感

否定的なプロンプト: 「(最低品質、低品質、イラスト、3D 2D 絵画、漫画、スケッチ) 、口を開けて

リアルな肌を持つインド人女性の詳細な画像があります。基本のSDXLモデル比べて改良されたバージョンです

異なる人種を比較するために、さらに3 つの画像を生成しました。肌の傷跡、肌の凹凸顔の特徴の正確さなど、結果は驚くべきものでした

結論は

ジェネレーティブアート進歩は、まもなく現実の画像と合成画像を区別できないレベルに到達するでしょう。これは、さまざまな現実世界のデータに基づいてトレーニングされたカスタム モデルを使用して、簡単なテキスト プロンプトから誰でも非常にリアルなスプレッド可能なメディアを作成できる未来を示しています。急速な進歩は刺激的な可能性を意味します。おそらく、いつの日か、リアルな動画を制作することが、説明文を入力するのと同じくらい簡単になるかもしれません。

本稿では、非常に正確でリアルなを生成するためのヒントエンジニアリング高度な安定したデザインモデル、衣服の微調整モデルについて学習しますより良い結果必要場合はcivitai.com でさまざまな高品質モデルを調べることをお勧めします

原題:安定拡散法を使用して超リアルな顔を生成する 3 つの方法、著者: Abid Ali Awan


<<:  マスク氏、ロボット「オプティマスプライム」が服を畳む動画を公開、動きはゆっくりだが自然

>>:  AI戦争が近づく中、ChatGPTが軍事禁止を解除

ブログ    

推薦する

ユーザーの検索ログに基づくマルチタスク学習による商品タイトル圧縮手法

まとめTaobao や Tmall などの電子商取引プラットフォームでは、検索エンジン最適化 (SE...

...

画像内の文字の教師なし学習

[[201526]]人間の行動に関する研究が最近、Nature の子会社である Nature Hum...

...

教師なしトレーニング用のスタック型オートエンコーダは時代遅れですか? ML博士が8つのオートエンコーダを比較

ベルリン工科大学のディープラーニング博士課程の学生であるティルマン・クロコッチ氏は、複数のタスクにお...

AI搭載ストレージは企業がデータからより多くの価値を引き出すのに役立ちます

ストレージを、手作業で手間がかかる必需品ではなく、自動運転車として考えることができたらどうでしょうか...

AIは製造業にどのように役立つのでしょうか?

AI を活用して製造効率を向上させ、インテリジェントな自動化で業界を変革します。製造業は人工知能技...

...

会話型AIの本当の限界は人間の忍耐力だ

私たちは多くの驚くべき進歩を目撃しました。最新の AI 技術は、数千億の計算能力を瞬時に活用すること...

Huggingfaceの機械学習科学者が、ホットなラマ2を特集する分析記事を執筆

Meta は無料の商用バージョンである Llama 2 をリリースし、ネットワーク全体を席巻しました...

新しい量子アルゴリズムは非線形方程式を解読しました。コンピューターは人間に取って代わり、預言者になれるのでしょうか?

かつて私たちは、コンピューターがどれだけ強力であっても、未来を予測するには不十分であると考えていまし...

人工知能と機械学習の違いは何ですか?

[[197626]]人工知能は新しい用語ではなく、その開発の歴史は数十年にわたります。それは 19...

機械学習は株式市場を正確に予測できるのでしょうか?

株式市場が始まって以来、人々はシステムを悪用し、市場に勝とうとしてきました。長年にわたり、人々は何千...

...

これはGPT-4が愚かである理由についての新たな説明である

かつては世界で最も強力だと考えられていたGPT-4も、リリース以来、いくつかの「信頼の危機」を経験し...