ぼやけた写真が好きな人はいません。本当の顔を復元したいという衝動にかられたことはありませんか? AI アルゴリズムにより、あらゆることが可能になります。ソフィアは、これが AI の進化の前兆かもしれないと考えています。 一般的なモザイクを除去するには、PS を使用できます。シンプルな構成と色で、画像内の不要な要素を簡単に削除できます。しかし、PS は結局のところ、画像の内容をサンプリングした後の単なる充填であり、まさに「犬の皮の絆創膏」のようなもので、損傷した内容をまったく修復できず、モザイクに直面したときには無力です。しかし、AI アルゴリズムが普及した今、新たな可能性が見えてきました。モザイクに対処するために、人々はそれを「HD」にするための複数の方法を考案してきました。 AI画像推測手法:PULSE 米デューク大学の研究チームがAIアルゴリズム「PULSE」を開発した。これは「Photo Upsampling via Latent Space Exploration」の略で、SR超解像技術の一種で、ピクセルを埋めるのではなく、大きな高精細画像を生成し、その後、画像の解像度を下げて元の画像と比較し、最も一致度の高い画像を見つけるというものだ。これは間違いなく画像復元技術の新たな道です。 従来のデブロッキング方法は、低解像度の画像を取得し、対応するピクセルと照合して追加のピクセルが必要な場所を「推測」し、コンピューターが以前に見た高解像度の画像に平均化しようとするというものです。このアプローチの結果、髪の毛や肌のテクスチャがピクセルごとに完全に揃わない場合があり、テクスチャ領域が歪んでぼやけて見えることになります。 このシステムは、16 x 16 の低解像度画像を数秒で 1024 x 1024 ピクセルに変換し、ピクセル数を元の 10,000 倍以上に増やして高解像度の画像を実現します。低解像度の写真では目立たない毛穴や髪の毛などの細部も、コンピューターで生成された写真ではよりはっきりと見えるようになります。 PULSE は、復元できないぼやけた画像をリアルな画像に復元できます。この AI アルゴリズムは、ぼやけた顔画像からぼやけたテキスト画像まで、理論的にはあらゆる種類の画像を復元できますが、復元された画像は元の画像とはわずかに異なります。 PULSE の結果にまだ満足できない場合は、次の方法を試してください。 AI推論手法:DeepCreamPy 毎日インターネットを閲覧していると、無効な情報を含む写真が大量に見つかります。それらの写真には、情報が欠落しているか、人工的に「糊」の層で覆われています。こうした画像自体へのダメージは「モザイク」よりも直接的で、画像情報の破壊は極めて徹底的です。 「deeppomf」というニックネームを持つプログラマーが、ディープニューラルネットワークを使用して魔法のようなプログラム「DeepCreamPy」を開発しました。ソフトウェアがアップロードされ共有された後、1週間以内に500回以上ダウンロードされました。 DeepCreamPy は、不規則な画像に対して意味のある予測を生成できる画像復元の新しいモデルを提案します。最終的な予測結果は、追加の後処理やブレンディング操作を必要とせずに、画像の残りの部分と完全に適合します。 そして最大の利点は、このアルゴリズムを実行するために非常に強力な計算能力を持つ機器を必要としないことです。このような強力な AI アルゴリズムを実行するには、普通のコンピューターだけが必要です。グラフィカルインターフェースはまだ完成していませんが、作者はトレーニング済みの事前構築モデルを公開しています。ニューラルネットワークについて何も知らない人でも、手順に従うだけでこのツールの魔法の力を体験できます。 極端にぼやけた画像を見ると、人々はいつも「人間の心は無修正だから、自然は高解像度だ」と冗談を言います。しかし、AIアルゴリズムの進歩により、高解像度は想像上のものではなく、現実のものとなりました。この技術を応用すれば、ぼやけた画像や低解像度の写真を簡単に高解像度の画像に修復することができます。AI技術の敷居の低さと幅広い応用範囲は、人々の作業を大幅に節約します。 |
>>: 人工知能を活用して顧客サービス体験を向上させる 5 つの方法
それは1998年、オーストラリアF1グランプリの時のことでした。 36周目にフィンランド人ドライバー...
近年、人工知能は頻繁に話題になっていますが、まだ真の実現には程遠い状況です。人工知能技術の開発におけ...
[[184558]] Gorgonia は、Go での機械学習を容易にし、多次元配列を含む数式の記述...
機械学習は、例と経験を通じてコンピューターにタスクの実行を教える人工知能のサブセットであり、研究...
まとめクリックスルー率の推定などのオンラインリアルタイム応答システムでは、応答時間に関して非常に厳し...
企業がビッグデータを活用するには、データ サイエンティストと開発者がデータを準備して整理し、アナリス...
翻訳者 |李睿レビュー | Chonglou今日、大規模言語モデル (LLM) は、言語生成から画像...
科学者たちは、人間が常に人型ロボットに対して不可解な恐怖を抱いているという不可解な現象を発見した。 ...
[[351390]]コインの表裏のように、技術の進歩は人々の生産と生活を促進する一方で、深刻な実際...
[51CTO.comからのオリジナル記事]現在、疫病と政治環境の影響により、多くの不確定要素が重なり...
この調査の結果、人工知能と機械学習、クラウドコンピューティング、5Gテクノロジーが2022年に影響を...
[51CTO.com クイック翻訳] 機械学習は、機械が直接プログラムされることなく学習できるように...