女神の若々しい姿が全開!テンセントのAIモデルGFPGANがGitHubのホットリストで1位に

女神の若々しい姿が全開!テンセントのAIモデルGFPGANがGitHubのホットリストで1位に

[[440335]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

古びた絵が髪の毛のように鮮明になるのを見るのはどんな感じでしょうか?

明るい目と透き通った髪を見ると、もともとぼやけていた肖像画がすぐに生き生きとしたものになります。

(これはAIを使って復元された高円円の幼少期の写真です)

より長い期間の歴史上の著名人の写真も取り扱うことができます。

魯迅氏の若き日の元気な姿が鮮やかに再現されている。

チューリングの修復はさらに印象的です。目がより鮮明になっているだけでなく、髪の毛や眉毛などの細部も完璧に修復されています。

上記の効果を実現するために、専門的な PS スキルは必要ありません。Web デモを使用して、マウスを数回クリックするだけで写真をアップロードできます。

このような便利な修復ツールは、すぐに多くのネットユーザーを魅了し、視聴したり試用したりしました。

多くの人が、子供の頃に撮った低解像度の写真を使って実験をしますが、その効果はまるで 10 年以上前に目の前に立っているかのようです。

ぼやけた写真でも一瞬でポートレートに変身。この感動はすぐに味わえますよ〜

集合写真の復元は簡単で、その効果にネットユーザーは驚きの声を上げました。

これは、GitHub のホットリストで何日もトップにランクされている AI 修復プロジェクト、 GFP-GANで、 8,400 個のスターが付いています。

最近、インターネット上で古い写真の修復に新たな流行が起こり、試してみようという人が殺到しています。

このプロジェクトはTencent PCG ARC Laboratoryによって提案され、関連論文がCVPR2021に掲載されました。

さあ、その魔法を体験してみましょう。

デモ

GFP-GAN は、Colab、Hugging Face、またはローカルでコードを実行して試すことができます。

今日はHugging Faceのウェブサイトでそれを体験します。

インターフェイスに示されているように、修復したい写真を左側の画像ボックスにドラッグし、「送信」をクリックするだけです。

たとえば、写真をアップロードすると、結果は次のようになります。

そして自動的に顔をまっすぐにしてくれます。

驚くべきことに、眼鏡をかけた人物の肖像画に遭遇した場合、GFP-GAN はレンズの反射さえも高解像度で処理できるのです。

u1s1さん(正直に言うと)、復元された写真は何十年も前に撮影されたものとは到底思えません!

GFP-GAN なら孫悟空の猿の顔も簡単に再現でき、特に光の復元効果が抜群です。

また、修復プロセス中に肌が過度に滑らかになることはなく、顔の自然なシワが詳細に完全に表示されます。

GAN による肖像画の復元

では、GFP-GAN はどのようにしてこのような強力な効果を実現するのでしょうか?

研究者たちはStyleGAN2にインスピレーションを受けました。

GAN はリアルな画像を生成できるので、そこに含まれる顔情報は顔の復元にも役立ちますか?

そのため、GFP-GAN のモデルフレームワークでは、劣化除去モジュールと事前トレーニング済みの GAN が主に事前確率として使用されます。

2 つのモジュールは、潜在エンコーディング マッピングと複数のチャネル分割空間特徴変換レイヤー (CS-SFT) を介して接続されます。

トレーニングの過程では、まず低品質の顔に対してノイズ低減などの大まかな処理を施し、その後顔情報を保持する必要があります。

忠実度に関しては、研究者は顔の構成要素の損失を導入して、どの詳細を強調して保持する必要があるかを判断し、次にアイデンティティ保持損失を使用してそれらを修復しました。

第一著者は唐暁教授の下で学んだ。

この論文の筆頭著者は、Tencent ARC Lab(深圳アプリケーション研究センター)の研究者である Xintao Wang 氏です。

彼は浙江大学で学士号を取得し、香港中文大学で博士号を取得しました。

博士課程では、Tang Xiaoou教授とChen Change Loy教授に師事しました。

彼の研究対象にはコンピュータービジョンとディープラーニングがあり、特に画像とビデオの復元に重点を置いています。

[[440339]]

論文の宛先:
https://arxiv.org/abs/2101.04061

GitHub プロジェクトページ:
https://github.com/TencentARC/GFPGAN

Hugging Faceトライアルポータ​​ル:
https://huggingface.co/spaces/akhaliq/GFPGAN

<<:  2022年にエネルギー・公益事業分野で注目すべき4つの技術トレンド

>>:  コードを入力せずに機械学習を行うことはできますか?アマゾンウェブサービスが今回大きな動きを見せた

ブログ    
ブログ    
ブログ    

推薦する

最初のRISC-Vラップトップが公開される、またはWindowsシステムが搭載されると思われますが、年末までに利用可能になりますか

チップ業界では、Armとx86が現在の主流のアーキテクチャであり、オープンなRSIC-Vが将来の方向...

復旦大学などがAnyGPTをリリース:画像、音楽、テキスト、音声をサポートする任意のモーダル入出力

最近、OpenAIのビデオ生成モデルSoraが人気を集めており、生成AIモデルのマルチモーダル機能が...

自動運転のためのリアルタイム測位技術の詳細説明

1 概要自動運転車 (AV) が安全で効率的な運転を実現するには、リアルタイムで正確かつ堅牢な位置特...

トレンド検索No.1!韓国、ハリー・ポッターの「透明マント」を作るためにカメレオン型ソフトロボットを開発

[[417131]]韓国が「カメレオンソフトロボット」の開発に成功、78件のコメントがつき、ホット検...

科学者らは脳の信号を読み取り「操作」できる新たな神経電子システムを開発

海外メディアの報道によると、コロンビア大学の研究チームは、脳の信号を「操作」し、病的な結合を阻害でき...

ソニー、AI製品の倫理審査を実施へ

日経新聞によると、ソニーは早ければ2021年春にも、倫理的リスクのスクリーニングに人工知能を活用した...

人工知能と創造性:人間と機械の境界線が曖昧になる

今日の世界では、人工知能(AI)が私たちの日常生活にますます統合されつつあります。 SiriやAle...

AI はどのようにしてよりスマートな建物を作り出すのでしょうか?

[[405913]]センサー、ビッグデータ、人工知能 (AI) を融合したスマート ビルの出現は、...

TCP/IPトランスポート層におけるTCP BBRアルゴリズムについての簡単な説明

0x00. はじめにこれは、TCP/IP プロトコル スタック シリーズの 3 番目の記事です。前回...

...

米国、人工知能に関する大統領令を発表

人工知能には大きな可能性があり、その可能性と危険性の両方を兼ね備えています。 AI を責任を持って使...

2018年、ブロックチェーンは監査人の仕事を破壊するでしょうか?

電卓が普及した後、そろばんの使い方しか知らなかった会計士は失業した。ゴールドマン・サックスは最盛期に...

自動運転のゴールドラッシュ、このトラックの価値は少なくとも3000億ドル

[[384274]]市場主導型の自動運転プロセスの第2フェーズが始まるにつれ、自動運転の商業化が議題...

...

人工知能と機械学習が進化する10の方法

[[411678]]人工知能は現在、多くの CEO にとって最重要課題となっています。この話題は目新...