モザイクは人々に嫌われており、「モザイクは人類の文明の進歩を妨げる」という諺が生まれたほどです。映画でモザイクを見ると退屈し、文書でモザイクを見ると興味を失います... 数え切れないほどの友人が、モザイクは本当に取り除くことができないのかという質問の答えを探しています。 ワンクリックでコード化されたコンテンツをコード化解除できるブラックテクノロジーはありますか? 原則として、モザイクは永久的な情報損失を表します。モザイクの原理は非常に単純です。多数の小さなピクセルを 1 つの大きなピクセルに結合し、平均色を取ってモザイクを作成します。モザイクは明らかに不可逆な操作です。平均から、どの数値の平均であるかを推測することはできません。 しかし、モザイクを復元するのは本当に不可能なのでしょうか? 一般的に言えば、モザイクを削除するには、想像力を働かせて、失われた内容を描き直す必要があります。この方法は非効率的であり、結果が安定しません。近年の AI テクノロジーの普及により、多くの驚くべきアプリケーションが誕生しました。最近、AIによるモザイク除去に関するニュースがいくつかありました。見てみましょう。 デピックス 最近注目を集めているデコードツールです。 Depix は GitHub 上のオープンソースであり、主にテキストモザイクを削除するために使用されます。開発者の場合は、以下のリンクから GitHub ページにアクセスしてプロジェクトをフォローできます。 Depix GitHub ホームページ: https://github.com/beurtschipper/Depix まずはDepixの効果を見てみましょう。 Depix によるモザイク除去の効果。上から順に、モザイク後の文字、Depix による修復効果、元の画像です。 モザイクの完璧な復元ではありませんが、手作業では難しい、言葉では言い表せないほどの大量のものを、ある程度読みやすい文字に復元できるというのは、驚くべきことです。 Depix はどのようにしてこれを達成したのでしょうか? Depixの原理は、実は理解するのが難しくありません。まず、Depix はテキスト テーブルを使用してテキストをモザイク化します。 Depix で使用されるテキスト テーブルは、復元される予定の文字の 2 文字の組み合わせを含む De Bruijn シーケンスを採用しています。 デ・ブリュインシーケンス Depix の開発者は、多くのテキストがモザイク化された後、いくつかのモザイク ブロックが 2 つの文字の組み合わせになるため、この 2 つの文字が非常に重要であると考えています。たとえば、下の図では、特定のモザイク ピクセルに実際には「o」と「b」の両方が含まれており、この 2 つの文字により、より正確な一致が提供されます。 2文字マッチングにより、対応するテキストを正確に識別できます 最後に、モザイク ブロック ルックアップ テーブルが生成されます。 次に、Depix は DebBruijn シーケンスのモザイク ルックアップ テーブルを使用して、復元するモザイク テキストを照合します。モザイク テキストのブロックがルックアップ テーブルの結果と一致すると、かなり正確なテキストに復元されます。完璧ではありませんが、どのような文字であるかを認識できるほどの効果があります。 簡単に言えば、Depix の原理は、モザイクを既知のコード化されたデータと照合し、それを復元することです。この技術の出現により、モザイクでパスワードを隠すなどのシナリオに課題が生じています。しかし、Depix には明らかに限界があります。現在は主に英語の文字とアラビア数字の認識に使用されています。当面、Depix は膨大な量の漢字を処理することができません。 グーグルブレイン Depix はテキストのデコードに希望を与え、Google Brain は画像のデコードの代表です。 Google Brain は Google が立ち上げた AI プロジェクトであり、画像モザイク除去に関する研究は非常に詳細です。 Google Brain は、多数の高解像度と低解像度のサンプリングを通じて学習し、復元結果に一致するルールを導き出す新しいピクセル再帰型超解像技術を使用します。たとえば、Google Brain は特定の黒い点がメガネのものであると学習しているため、モザイクを復元するときに、これらの黒い点を目に復元できます。テストから判断すると、その効果は実に驚異的です。 Google の画像デコード AI このような AI 技術の用途は何でしょうか? モザイク除去は、特定の状況でのみ特定の用途に使用されます。同様のアルゴリズムは、多くの場合に役割を果たします。画像を修復する必要がある限り、役立ちます。たとえば、写真を撮るときに手が震えて、写真がピントが合わずぼやけてしまったらどうすればいいでしょうか。従来の方法は、単純で大まかなシャープニングかもしれません。しかし、写真アプリが AI 技術を採用していれば、失われたディテールやシャープネスを「補い」、できるだけ使いやすい写真に仕上げることができます。 要約する 上記以外にも、AIを利用して画像を強化する技術は数多くあります。例えば、Waif2xのインテリジェント画像拡大技術や、NVのDLSS技術などです。実は、これらはデモザイク処理のAIと似ています。これらはすべて、AIを利用して存在しない、または破損した画像情報を「埋めて」、画像の鮮明度を高めます。 今後、AIアルゴリズムの改善、機械学習の蓄積、ハードウェアの計算能力の向上により、AIデコードと画像強化はより驚くべき効果を発揮するでしょう。おそらく将来的には、モザイクはもはや視聴の障害ではなくなるでしょう。 |
<<: 研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている
>>: 法律教育ロボット「ダニウ」が潼南で任務に就き、一般市民に無料の法律サービスを提供
[[345310]]企業価値AI業界の専門家であるジョン・ミカエリス氏は、「AIを活用する企業は、よ...
オクルージョンは、コンピューター ビジョンにおける最も基本的な問題ですが、未だに解決されていない問題...
世界がデータの津波と格闘する中、データセンターは急速に進化しています。スマート接続デバイスの数の急速...
MOEA フレームワークは、多目的進化アルゴリズム (MOEA) を開発するための Java ライ...
[[396949]]近年、新世代の通信およびナビゲーション技術の継続的な進歩を背景に、我が国のドロー...
[[348196]]画像ソース: unsplash人工知能はこの時代の合言葉であり、技術専門家、学...
メタの副社長兼国際問題担当会長で元英国副首相のニック・クレッグ氏は、BBCとの最近のインタビューで、...
胸部X線(CXR)検査は、さまざまな病気のスクリーニングや診断に広く使用されている臨床画像診断法です...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
コンピューター ビジョンは、写真やビデオなどのデジタル画像の側面に焦点を当てた人工知能のサブフィール...
写真大型模型天井GPT-4、だんだんと鈍くなってきているのでしょうか?これまでにも多くのユーザーが疑...
1. ナレッジグラフとは何ですか?現実世界にはさまざまなものが存在します。物事の間にはいくつかの種類...
[51CTO.com クイック翻訳]デジタル経済が世界を席巻する中、人工知能は今日私たちが知っている...