HDに検閲済み!デューク大学が開発したAIが1秒でモザイクを復元

HDに検閲済み!デューク大学が開発したAIが1秒でモザイクを復元

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ピクセルが足りない場合は、後の写真編集で補いますか?

Zhihuで低ピクセルの写真編集を検索すると、ヘルプ投稿が多すぎて、すべてを読み終えることができませんでした。また、PSテクニック、プラグインツール、さまざまな写真編集アプリに関するチュートリアルも多すぎて目が回ってしまうほどでした。重要な点は、効果がどうなるかまったくわからないことです。

しかし、デューク大学の研究チームは最近、低ピクセルの問題をすべて解決できるPULSEと呼ばれるAI写真編集技術を開発しました。画像の元の解像度を64倍に拡大できるとされており、どんなに画質の悪い画像でも数秒で高精細でリアルな画像に変えることができます。モザイク状の顔画像や毛穴、シワ、髪の毛までも鮮明に復元できます。

モザイクが数秒で高解像度の肖像画に変わる

PULSE は、潜在空間探索によって写真をサンプリングする新しい超解像度アルゴリズムです。従来の方法では最大 8 倍しか拡大できなかったのに対し、16 x 16 ピクセルの低解像度 (Low Resolution、LR) を 1024 x 1024 ピクセルの高解像度 (High Resolution、HR) に数秒で 64 倍に拡大できます。

まずは一例を見てみましょう。写真編集業界で最も加工が難しいとされるLRヘッドショットも、PULSEを使えばわずか数秒で高精細かつ繊細な画像に生まれ変わります。

さらに重要なのは、PULSE は顔の主要な特徴を特定し、より高い解像度で同様の詳細セットを生成できることです。写真に写っている肖像画はぼやけていますが、PULSE は眉毛、まつげ、髪の毛、顔の形などの顔の細部も「想像」して、高精細でリアルな肖像画を作成できます。

しかし、過度なぼかしによって生成されたポートレートは、単なる仮想の新しい顔であり、実際には存在しません。したがって、この技術は個人の識別には使用できません。たとえば、監視カメラで撮影されたピントが合っていない、認識できない画像は、PULSE を通じて実際のポートレートに復元することはできません。

「実在しない、本物のように見える新しい顔を生成できるほどの超高解像度の画像が生成されたことはこれまでなかった」とデューク大学のチームに所属するコンピューター科学者、シンシア・ルーディン氏は語った。

同時に、この研究で使用された技術は、医学、顕微鏡、天文学、衛星画像などの分野で広く活用できると付け加えた。また、研究チームは論文をプレプリントライブラリarVixに公開しており、IEEE国際コンピュータービジョンおよびパターン認識会議(CVPR 2020)にも掲載されています。

従来の写真編集を超えた「ロスカット」

LR 画像の場合、HR 解像度部分を LR 画像に一致させて超高解像度 (SR) を得るという従来の方法では、HR 画像の感度が低下したり、画像にムラができたり、画像が歪んだりすることがよくあります。

この研究では、デューク大学の研究チームが新たなアイデアを模索し、新しい超解像アルゴリズムPULSEを提案しました。LR画像をトラバースして詳細をゆっくりと追加するのではなく、HRに対応するLRを見つけて、「損失を減らす」ことでSR画像を取得します。

オリジナルLR(最初の行)、PULSE出力HR(真ん中の行)、HR対応LR(最後の行)

PULSE は生成的敵対的ネットワーク (GAN) を使用します。これは、名前が示すように、敵対的なゲームプレイを通じてターゲット トレーニングを実行するトレーニング モデルです。その主な構造には、ジェネレーターとディスクリミネーターが含まれます。同じ写真トレーニング セットで、1 つは受信した画像をトレーニングして出力することを担当し、もう 1 つは出力を受信して​​十分にリアルかどうかを確認することを担当します。

元の画像と比較した後のテスト結果は次のとおりです。

図中、1 行目は元の画像、2 行目は「損失を低減」して得られた HR に対応する LR、3 行目は PULSE によって得られた HR です。元の画像とはまだ若干の違いがありますが、復元度はすでに非常に高いことがわかります。

論文によると、SRにおけるPULSEの利点を検証するために、デューク大学の研究チームは4つの異なる画像スケーリング方法を使用して比較研究を実施した。この研究では、CelebA HQデータセットから1440枚の画像を使用し、LR顔画像、特に目、唇、髪などの詳細について、スケール係数x8およびx64で実験を実施しました。

PULSE は、特に X64 解像度で明らかな利点を示し、特に目や唇などの細部でぼやけたポートレートが完全に復元されます。これは他の方法ではほぼ不可能です。

また、テスト結果については、研究者らは知覚的超解像でよく使われるMOSテスト方法を使用し、5人の評価者に画像結果を1~5のスケールで採点してもらいました。その結果、HRソースの高解像度画像解像度は3.74点だったのに対し、PULSEは3.60点に達し、その差はわずか0.14で、実際の高品質画像のレベルにほぼ達したと言えます。

しかし、研究者たちはPULSEがまだ完璧ではないことを認めている。生成される高解像度の画像は、プロのオリジナル画像とは多少異なります。しかし、テクノロジーとツールが進歩するにつれて、このテクノロジーも少しずつ改善されていきます。

現在、研究チームは PULSE を Github オープンソース プラットフォームにリリースし、569 個のスターを獲得しています。写真編集に困っている友達はインストールして試してみてください〜(Githubアドレス:https://github.com/adamian98/pulse)

<<:  AIを使用するための実践的な方法論:次の5つのステップに従ってください

>>:  コンピュータービジョン技術によって変革が期待できる3つの業界

ブログ    
ブログ    

推薦する

すべてがAI+になる新しい形の人工知能があなたを待っています

人工知能技術は急速に発展し、人々の生活に微妙な影響を与えています。掃除ロボット、調理ロボット、配達ロ...

...

AIの活用を拡大するには? 人工知能には「1%の問題」がある

人工知能(AI)については多くの報道や解説がなされてきました。奇跡を起こすことができると言う人もいれ...

アルゴリズムの芸術: MySQL order by のさまざまなソートアルゴリズムの巧みな使用

[[337135]]この記事では、MySQL におけるキーワードの原則を比較的マクロな観点から見てい...

GitHub CEO: AIはプログラマーに取って代わることはできない

GitHub の CEO である Thomas Dohmke 氏は最近、人工知能とソフトウェア開発の...

GoogleからNvidiaまで、テクノロジー大手はAIモデルを解読するためにレッドチームハッカーを採用している

ChatGPTの一般公開の1か月前に、OpenAIはケニアの弁護士Boru Golloを雇い、AIモ...

「初の顔認証事件」の最終判決がこちら

[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...

AI チップ: なぜそれほど重要なのか?

周りを見渡せば、人工知能がいかに重要になっているかがわかるでしょう。顔認識カメラでも音声アシスタント...

自然言語処理(NLP)はソーシャルエンジニアリング攻撃の解決に役立ちます

新しいツールは、件名や URL に基づいてソーシャル エンジニアリング攻撃を検出するのではなく、テキ...

人工知能が巨大な応用価値を生み出す

飛行機搭乗時の「顔スキャン」から無人スーパーマーケットまで、多機能巡回ロボットからスマート医療まで....

MIT は隠れた物体を「認識」できるロボットを開発中。「私たちはロボットに超人的な認識力を与えようとしている」

MITの研究者らは、視覚と無線周波数(RF)センシングを組み合わせて、視界から隠れている物体でも見...

...

あなたは「オアシス」からどれくらい離れていますか? テクノロジーオタクが世界を救う方法をご覧ください

【元記事は51CTO.comより】最近、VR熱血ゲームを題材にした映画『レディ・プレイヤー1』が主要...

...

今後10年間で、AIは次の10の分野で世界に革命を起こすだろう

21 世紀に実現可能かつ実現されるであろう AI の驚くべき応用例をすべて紹介します。 AI が世界...