人工知能は非常に人気があります。PULSE は低品質のモザイク画像を保存し、数秒で高解像度の画像に変換できます。

人工知能は非常に人気があります。PULSE は低品質のモザイク画像を保存し、数秒で高解像度の画像に変換できます。

[51CTO.com オリジナル記事] モザイクとはどういう意味ですか?従来のモザイクは、主に映画やテレビのメディアで重要な領域をカバーしたり、ぼかし処理を行ったりするために使用されます。例えば、動画では、人物の顔やその他の部分が露出すると不都合な場合、モザイクという芸術的な加工技術を使って隠します。

1950年代以降、世界的な映画産業の発展に伴い、映画には流血シーンやポルノシーンが頻繁に登場するようになり、18歳以下の鑑賞に適さないシーンにはモザイク処理を施すよう求める声も出始めた。それ以来、モザイクには新たな役割が加わった。オリジナルのハイビジョン画像の一部が太い小さな四角で覆われ、破ることのできない禁断の領域が形成されたのだ。これにより、数え切れないほどの情熱的な若者たちが頭を悩ませ、モザイクで覆われた奇跡を見るために必死にそれを破る方法を探した。

人々がどれだけ努力しても、モザイクを破る方法を見つけることはできません。しかし、技術の発達により、モザイクを破ることが現実のものとなりました。米国のデューク大学の研究者数名は、PULSE AIアルゴリズムを使用してモザイクを完全に除去し、モザイク前のピクセル効果を実現しました。

[[384230]]

では、モザイクレベルの画像を数秒で高解像度に変換するにはどうすればよいでしょうか? PULSE アルゴリズムは、わずか数秒で 16 x 16 ピクセルの低解像度画像を 64 倍の 1024 x 1024 ピクセルの高解像度画像に拡大し、元々存在しなかった特徴を「想像」することができます。アルゴリズムで処理すると、毛穴、小じわ、まつげ、無精ひげなど、元の LR 写真では確認できない細部もはっきりと確認できます。ただし、PULSE システムは、低解像度の画像を取得した後、ゆっくりと新しい詳細を追加するのではなく、AI によって生成された高解像度の画像を反復処理し、これらの高解像度の画像に対応する低解像度の画像を元の画像と比較し、最も近い画像を見つけます。たとえば、モザイク顔画像は PULSE アルゴリズムを使用して撮影され、最初に鼻、口、目などの顔の詳細を追加してからモザイクを追加します。次に、モザイク画像を元の画像と比較および調整し、元のモザイク画像と一致するまでアルゴリズムを継続的に繰り返します。つまり、「謎の」画像がデコードされます。

[[384231]]

元の LR 画像と、PULSE によって復元されてダウンスケールされた LR 画像は、それらに最も近い HR 画像と一致し、これが復元された HR 画像になります。

しかし、この技術には欠点もあり、取得した画像のデコード部分はソフトウェアによって想像されたものであり、必ずしも元の外観とは限らないため、違いが生じる可能性があります。したがって、この写真はぼやけた瞬間から別の写真となり、元の美しさに戻ることは決してできませんでした。

実際、この技術の登場には長所と短所の両方がある。例えば、画像の鮮明さの点では、考古学的なデータの信頼性が高まる可能性がある。あるいは、刑事映画のように、刑事警察がモザイク映像で容疑者をはっきりと見ることができない場合、容疑者の最も近い姿を生成し、大群衆の中で容疑者を逮捕するための強力なサポートを提供することができる。例えば、法廷番組では犯罪容疑者の顔が覆われていたり、映画やテレビ番組ではブランドロゴがぼやけたマットで描かれていたりしている。認識精度がますます向上しているGoogleマップでは、多くの場所がぼかされ、特別にモザイク処理されて、一部の軍事機密が隠されている。つまり、「コードを解読する」技術と能力があるなら、「コードを持つ」という安定性と権利も大切にしなければならないのです。

私たち全員が今も将来もモザイクを必要としていることは間違いありません。それは様々な形で現れますが、決して消えることはありません。 AIなどの技術の進歩により、検閲されたコンテンツはますます現実に近づくかもしれませんが、それが現実を実現するために必要かどうかは私たちが決めることができます。あるいは、本当に有益なところでは、愛情深く与え合えるかどうかを検討してください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  機械学習とディープラーニングの5つの主な違い

>>:  人工知能開発の動向

ブログ    
ブログ    

推薦する

中国におけるAI人材の格差はどれほど大きいのか?教育省の学習基準では高校生にAIを学ぶことを義務付けている

[[220662]] 1956 年、ダートマス大学で開催された会議で、コンピューターの専門家であるジ...

初心者からプロまでが使用する機械学習ソフトウェア トップ 10

この記事では、機械学習に最適なソフトウェアについて説明します。これらのソフトウェアは、ML コードを...

未来に向けて、自動運転のための初のマルチビュー予測+計画世界モデルが登場

最近、ワールドモデルという概念が大きな盛り上がりを見せており、自動運転の分野もただ黙って見ているわけ...

人工知能が VPS と共有ホスティング オプションの議論を再構築

人工知能は数え切れないほど多くの業界を前例のない形で変えています。ウェブホスティングは人工知能が関与...

...

自然言語処理がCOVID-19に対する世界的な戦いに貢献

インターネットの普及と膨大な情報の出現により、人工知能の分野における重要な方向性としての自然言語処理...

ディープラーニングは錬金術のようなものです。どんな迷信的な習慣がありますか?ユーザー: ランダムシード=42 は良い結果をもたらします

[[441423]]機械学習分野の研究者は皆、パラメータ調整という課題に直面していますが、言うほど簡...

...

Baidu が DeepVoice の最終バージョンをリリース: 10,000 人の声を真似て 30 分でアクセントを習得

今年初め、検索大手の百度は、人気のディープラーニング技術を使用してテキスト読み上げ(TTS)変換を実...

医療における AI 導入の 5 つの障壁

人間の想像力を幅広い臨床応用に活用するとなると、医療用人工知能の道のりはまだまだ長い。 [[2761...

...

生成型AIを学ぶ際の7つの課題

生成 AI は変革の原動力となり、機械が達成できるものの限界を押し広げています。テキストや画像の生成...

革新的な人工視覚脳インプラントが初めて視覚障害者に移植される

現時点では失明を治す方法はないが、初めての人工視覚システムの移植が初めて成功し、失明した人々の視力を...