この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 ピクセルが足りない場合は、後の写真編集で補いますか? Zhihuで低ピクセルの写真編集を検索すると、ヘルプ投稿が多すぎて、すべてを読み終えることができませんでした。また、PSテクニック、プラグインツール、さまざまな写真編集アプリに関するチュートリアルも多すぎて目が回ってしまうほどでした。重要な点は、効果がどうなるかまったくわからないことです。 しかし、デューク大学の研究チームは最近、低ピクセルの問題をすべて解決できるPULSEと呼ばれるAI写真編集技術を開発しました。画像の元の解像度を64倍に拡大できるとされており、どんなに画質の悪い画像でも数秒で高精細でリアルな画像に変えることができます。モザイク状の顔画像や毛穴、シワ、髪の毛までも鮮明に復元できます。 モザイクが数秒で高解像度の肖像画に変わるPULSE は、潜在空間探索によって写真をサンプリングする新しい超解像度アルゴリズムです。従来の方法では最大 8 倍しか拡大できなかったのに対し、16 x 16 ピクセルの低解像度 (Low Resolution、LR) を 1024 x 1024 ピクセルの高解像度 (High Resolution、HR) に数秒で 64 倍に拡大できます。 まずは一例を見てみましょう。写真編集業界で最も加工が難しいとされるLRヘッドショットも、PULSEを使えばわずか数秒で高精細かつ繊細な画像に生まれ変わります。 さらに重要なのは、PULSE は顔の主要な特徴を特定し、より高い解像度で同様の詳細セットを生成できることです。写真に写っている肖像画はぼやけていますが、PULSE は眉毛、まつげ、髪の毛、顔の形などの顔の細部も「想像」して、高精細でリアルな肖像画を作成できます。 しかし、過度なぼかしによって生成されたポートレートは、単なる仮想の新しい顔であり、実際には存在しません。したがって、この技術は個人の識別には使用できません。たとえば、監視カメラで撮影されたピントが合っていない、認識できない画像は、PULSE を通じて実際のポートレートに復元することはできません。 「実在しない、本物のように見える新しい顔を生成できるほどの超高解像度の画像が生成されたことはこれまでなかった」とデューク大学のチームに所属するコンピューター科学者、シンシア・ルーディン氏は語った。 同時に、この研究で使用された技術は、医学、顕微鏡、天文学、衛星画像などの分野で広く活用できると付け加えた。また、研究チームは論文をプレプリントライブラリarVixに公開しており、IEEE国際コンピュータービジョンおよびパターン認識会議(CVPR 2020)にも掲載されています。 従来の写真編集を超えた「ロスカット」LR 画像の場合、HR 解像度部分を LR 画像に一致させて超高解像度 (SR) を得るという従来の方法では、HR 画像の感度が低下したり、画像にムラができたり、画像が歪んだりすることがよくあります。 この研究では、デューク大学の研究チームが新たなアイデアを模索し、新しい超解像アルゴリズムPULSEを提案しました。LR画像をトラバースして詳細をゆっくりと追加するのではなく、HRに対応するLRを見つけて、「損失を減らす」ことでSR画像を取得します。 オリジナルLR(最初の行)、PULSE出力HR(真ん中の行)、HR対応LR(最後の行) PULSE は生成的敵対的ネットワーク (GAN) を使用します。これは、名前が示すように、敵対的なゲームプレイを通じてターゲット トレーニングを実行するトレーニング モデルです。その主な構造には、ジェネレーターとディスクリミネーターが含まれます。同じ写真トレーニング セットで、1 つは受信した画像をトレーニングして出力することを担当し、もう 1 つは出力を受信して十分にリアルかどうかを確認することを担当します。 元の画像と比較した後のテスト結果は次のとおりです。 図中、1 行目は元の画像、2 行目は「損失を低減」して得られた HR に対応する LR、3 行目は PULSE によって得られた HR です。元の画像とはまだ若干の違いがありますが、復元度はすでに非常に高いことがわかります。 論文によると、SRにおけるPULSEの利点を検証するために、デューク大学の研究チームは4つの異なる画像スケーリング方法を使用して比較研究を実施した。この研究では、CelebA HQデータセットから1440枚の画像を使用し、LR顔画像、特に目、唇、髪などの詳細について、スケール係数x8およびx64で実験を実施しました。 PULSE は、特に X64 解像度で明らかな利点を示し、特に目や唇などの細部でぼやけたポートレートが完全に復元されます。これは他の方法ではほぼ不可能です。 また、テスト結果については、研究者らは知覚的超解像でよく使われるMOSテスト方法を使用し、5人の評価者に画像結果を1~5のスケールで採点してもらいました。その結果、HRソースの高解像度画像解像度は3.74点だったのに対し、PULSEは3.60点に達し、その差はわずか0.14で、実際の高品質画像のレベルにほぼ達したと言えます。 しかし、研究者たちはPULSEがまだ完璧ではないことを認めている。生成される高解像度の画像は、プロのオリジナル画像とは多少異なります。しかし、テクノロジーとツールが進歩するにつれて、このテクノロジーも少しずつ改善されていきます。 現在、研究チームは PULSE を Github オープンソース プラットフォームにリリースし、569 個のスターを獲得しています。写真編集に困っている友達はインストールして試してみてください〜(Githubアドレス:https://github.com/adamian98/pulse) |
<<: AIを使用するための実践的な方法論:次の5つのステップに従ってください
>>: コンピュータービジョン技術によって変革が期待できる3つの業界
毎日生成されるデータの量は増加し続けています。その結果、これらの企業はこれまで以上に多くのデータを保...
携帯電話を使って顔をスキャンして支払いをするとき、会社の入退室管理を通過するとき、あるいは道路を運転...
翻訳: ブガッティ企画:千山ほとんどの企業は、記録システムの IT 監査を毎年実施しています。しかし...
現在、大規模言語モデル (LLM) は、自然言語処理 (NLP) の分野で変化の波を引き起こしていま...
COVID-19パンデミックの発生以来、世界中の研究チームがコロナウイルスの検出や感染の予測に役立つ...
電子ファンネットワークが報じた(文/李婉婉)近年、技術の継続的な進歩に伴い、人工知能産業は急速に発展...
人工知能の概念は長年提唱されてきたが、最近の流行は「人間対機械」の競争で囲碁の世界的名人、イ・セドル...
COVID-19の影はまだ消えていないが、今年のプレミアリーグの試合の最初の週末は珍しい「好天」を...
最近、Paxos アルゴリズムについてみんなが議論しています。私はオンラインで多くの記事を読みました...
エッジ AI では、システムを他のシステムに接続する必要がないため、ユーザーはデータをリアルタイムで...
序文みなさんこんにちは。私はカタツムリを採っている小さな男の子です。 LeetCode を練習してい...
IT Homeは11月2日、LinkedInがユーザーの就職活動コーチとなり、次の仕事を見つける手助...
序文ドイツ連邦政府は2018年に「ドイツ人工知能開発戦略」を発表し、人工知能分野におけるドイツの研究...
2019 年 10 月末時点で、HanLP と呼ばれる自然言語処理ライブラリが GitHub で ...
韓国のお笑いタレント、パク・チソンさんとその母親が自宅で死亡しているのが発見されたが、これはうつ病が...