ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

モザイクは人々に嫌われており、「モザイクは人類の文明の進歩を妨げる」という諺が生まれたほどです。映画でモザイクを見ると退屈し、文書でモザイクを見ると興味を失います... 数え切れないほどの友人が、モザイクは本当に取り除くことができないのかという質問の答えを探しています。 ワンクリックでコード化されたコンテンツをコード化解除できるブラックテクノロジーはありますか?

原則として、モザイクは永久的な情報損失を表します。モザイクの原理は非常に単純です。多数の小さなピクセルを 1 つの大きなピクセルに結合し、平均色を取ってモザイクを作成します。モザイクは明らかに不可逆な操作です。平均から、どの数値の平均であるかを推測することはできません。

しかし、モザイクを復元するのは本当に不可能なのでしょうか? 一般的に言えば、モザイクを削除するには、想像力を働かせて、失われた内容を描き直す必要があります。この方法は非効率的であり、結果が安定しません。近年の AI テクノロジーの普及により、多くの驚くべきアプリケーションが誕生しました。最近、AIによるモザイク除去に関するニュースがいくつかありました。見てみましょう。

デピックス

最近注目を集めているデコードツールです。 Depix は GitHub 上のオープンソースであり、主にテキストモザイクを削除するために使用されます。開発者の場合は、以下のリンクから GitHub ページにアクセスしてプロジェクトをフォローできます。

Depix GitHub ホームページ: https://github.com/beurtschipper/Depix

まずはDepixの効果を見てみましょう。

Depix によるモザイク除去の効果。上から順に、モザイク後の文字、Depix による修復効果、元の画像です。

モザイクの完璧な復元ではありませんが、手作業では難しい、言葉では言い表せないほどの大量のものを、ある程度読みやすい文字に復元できるというのは、驚くべきことです。 Depix はどのようにしてこれを達成したのでしょうか?

Depixの原理は、実は理解するのが難しくありません。まず、Depix はテキスト テーブルを使用してテキストをモザイク化します。 Depix で使用されるテキスト テーブルは、復元される予定の文字の 2 文字の組み合わせを含む De Bruijn シーケンスを採用しています。


デ・ブリュインシーケンス

Depix の開発者は、多くのテキストがモザイク化された後、いくつかのモザイク ブロックが 2 つの文字の組み合わせになるため、この 2 つの文字が非常に重要であると考えています。たとえば、下の図では、特定のモザイク ピクセルに実際には「o」と「b」の両方が含まれており、この 2 つの文字により、より正確な一致が提供されます。


2文字マッチングにより、対応するテキストを正確に識別できます

最後に、モザイク ブロック ルックアップ テーブルが生成されます。

次に、Depix は DebBruijn シーケンスのモザイク ルックアップ テーブルを使用して、復元するモザイク テキストを照合します。モザイク テキストのブロックがルックアップ テーブルの結果と一致すると、かなり正確なテキストに復元されます。完璧ではありませんが、どのような文字であるかを認識できるほどの効果があります。

簡単に言えば、Depix の原理は、モザイクを既知のコード化されたデータと照合し、それを復元することです。この技術の出現により、モザイクでパスワードを隠すなどのシナリオに課題が生じています。しかし、Depix には明らかに限界があります。現在は主に英語の文字とアラビア数字の認識に使用されています。当面、Depix は膨大な量の漢字を処理することができません。

グーグルブレイン

Depix はテキストのデコードに希望を与え、Google Brain は画像のデコードの代表です。 Google Brain は Google が立ち上げた AI プロジェクトであり、画像モザイク除去に関する研究は非常に詳細です。

Google Brain は、多数の高解像度と低解像度のサンプリングを通じて学習し、復元結果に一致するルールを導き出す新しいピクセル再帰型超解像技術を使用します。たとえば、Google Brain は特定の黒い点がメガネのものであると学習しているため、モザイクを復元するときに、これらの黒い点を目に復元できます。テストから判断すると、その効果は実に驚異的です。


Google の画像デコード AI

このような AI 技術の用途は何でしょうか? モザイク除去は、特定の状況でのみ特定の用途に使用されます。同様のアルゴリズムは、多くの場合に役割を果たします。画像を修復する必要がある限り、役立ちます。たとえば、写真を撮るときに手が震えて、写真がピントが合わずぼやけてしまったらどうすればいいでしょうか。従来の方法は、単純で大まかなシャープニングかもしれません。しかし、写真アプリが AI 技術を採用していれば、失われたディテールやシャープネスを「補い」、できるだけ使いやすい写真に仕上げることができます。

要約する

上記以外にも、AIを利用して画像を強化する技術は数多くあります。例えば、Waif2xのインテリジェント画像拡大技術や、NVのDLSS技術などです。実は、これらはデモザイク処理のAIと似ています。これらはすべて、AIを利用して存在しない、または破損した画像情報を「埋めて」、画像の鮮明度を高めます。

今後、AIアルゴリズムの改善、機械学習の蓄積、ハードウェアの計算能力の向上により、AIデコードと画像強化はより驚くべき効果を発揮するでしょう。おそらく将来的には、モザイクはもはや視聴の障害ではなくなるでしょう。

<<:  研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている

>>:  法律教育ロボット「ダニウ」が潼南で任務に就き、一般市民に無料の法律サービスを提供

ブログ    
ブログ    
ブログ    

推薦する

「初の顔認証事件」の最終判決がこちら

[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...

...

...

...

新しい世代の AI 人材はどこから生まれ、どこに向かうべきでしょうか?

[[443279]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

...

...

...

最も人気のあるオープンソースの機械学習 JavaScript フレームワーク 5 つ

[[235929]]機械学習に興味がある、または JavaScript を使用して機械学習の専門家に...

IoTとAIを活用した依存症治療

IoT によって促進される相互接続性と AI の学習機能は、幅広い問題を解決する可能性を示しています...

Dialogflow、Lex、Watson、Wit、Azure Robots の比較

[51CTO.com クイック翻訳] チャットボットは顧客とコミュニケーションをとる革新的な方法です...

モバイル写真と人工知能が出会うとき

現在では、カメラ機能はスマートフォンの標準機能となり、スマートフォンの大きなセールスポイントとなって...

AIの終末: 人間は本当の自己認識を持っていない

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

生成AIは昨年人気が高まったが、米国のIT関連の仕事の数はわずか700件しか増加しなかった

1月8日のニュースによると、2023年には、生成型人工知能が企業や投資家の間で大きなブームを引き起こ...

アメリカのAI企業の優位性を打ち破り、AI数学オープンソースモデルでアベルが1位に

ChatGPTに代表される大型モデル製品は新たな産業革命を先導し、国内外の機関が関連技術研究に積極的...