ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか？

モザイクは人々に嫌われており、「モザイクは人類の文明の進歩を妨げる」という諺が生まれたほどです。映画でモザイクを見ると退屈し、文書でモザイクを見ると興味を失います... 数え切れないほどの友人が、モザイクは本当に取り除くことができないのかという質問の答えを探しています。ワンクリックでコード化されたコンテンツをコード化解除できるブラックテクノロジーはありますか?

原則として、モザイクは永久的な情報損失を表します。モザイクの原理は非常に単純です。多数の小さなピクセルを 1 つの大きなピクセルに結合し、平均色を取ってモザイクを作成します。モザイクは明らかに不可逆な操作です。平均から、どの数値の平均であるかを推測することはできません。

しかし、モザイクを復元するのは本当に不可能なのでしょうか? 一般的に言えば、モザイクを削除するには、想像力を働かせて、失われた内容を描き直す必要があります。この方法は非効率的であり、結果が安定しません。近年の AI テクノロジーの普及により、多くの驚くべきアプリケーションが誕生しました。最近、AIによるモザイク除去に関するニュースがいくつかありました。見てみましょう。

デピックス

最近注目を集めているデコードツールです。 Depix は GitHub 上のオープンソースであり、主にテキストモザイクを削除するために使用されます。開発者の場合は、以下のリンクから GitHub ページにアクセスしてプロジェクトをフォローできます。

Depix GitHub ホームページ: https://github.com/beurtschipper/Depix

まずはDepixの効果を見てみましょう。

Depix によるモザイク除去の効果。上から順に、モザイク後の文字、Depix による修復効果、元の画像です。

モザイクの完璧な復元ではありませんが、手作業では難しい、言葉では言い表せないほどの大量のものを、ある程度読みやすい文字に復元できるというのは、驚くべきことです。 Depix はどのようにしてこれを達成したのでしょうか?

Depixの原理は、実は理解するのが難しくありません。まず、Depix はテキストテーブルを使用してテキストをモザイク化します。 Depix で使用されるテキストテーブルは、復元される予定の文字の 2 文字の組み合わせを含む De Bruijn シーケンスを採用しています。

デ・ブリュインシーケンス

Depix の開発者は、多くのテキストがモザイク化された後、いくつかのモザイクブロックが 2 つの文字の組み合わせになるため、この 2 つの文字が非常に重要であると考えています。たとえば、下の図では、特定のモザイクピクセルに実際には「o」と「b」の両方が含まれており、この 2 つの文字により、より正確な一致が提供されます。

2文字マッチングにより、対応するテキストを正確に識別できます

最後に、モザイクブロックルックアップテーブルが生成されます。

次に、Depix は DebBruijn シーケンスのモザイクルックアップテーブルを使用して、復元するモザイクテキストを照合します。モザイクテキストのブロックがルックアップテーブルの結果と一致すると、かなり正確なテキストに復元されます。完璧ではありませんが、どのような文字であるかを認識できるほどの効果があります。

簡単に言えば、Depix の原理は、モザイクを既知のコード化されたデータと照合し、それを復元することです。この技術の出現により、モザイクでパスワードを隠すなどのシナリオに課題が生じています。しかし、Depix には明らかに限界があります。現在は主に英語の文字とアラビア数字の認識に使用されています。当面、Depix は膨大な量の漢字を処理することができません。

グーグルブレイン

Depix はテキストのデコードに希望を与え、Google Brain は画像のデコードの代表です。 Google Brain は Google が立ち上げた AI プロジェクトであり、画像モザイク除去に関する研究は非常に詳細です。

Google Brain は、多数の高解像度と低解像度のサンプリングを通じて学習し、復元結果に一致するルールを導き出す新しいピクセル再帰型超解像技術を使用します。たとえば、Google Brain は特定の黒い点がメガネのものであると学習しているため、モザイクを復元するときに、これらの黒い点を目に復元できます。テストから判断すると、その効果は実に驚異的です。

Google の画像デコード AI

このような AI 技術の用途は何でしょうか? モザイク除去は、特定の状況でのみ特定の用途に使用されます。同様のアルゴリズムは、多くの場合に役割を果たします。画像を修復する必要がある限り、役立ちます。たとえば、写真を撮るときに手が震えて、写真がピントが合わずぼやけてしまったらどうすればいいでしょうか。従来の方法は、単純で大まかなシャープニングかもしれません。しかし、写真アプリが AI 技術を採用していれば、失われたディテールやシャープネスを「補い」、できるだけ使いやすい写真に仕上げることができます。

要約する

上記以外にも、AIを利用して画像を強化する技術は数多くあります。例えば、Waif2xのインテリジェント画像拡大技術や、NVのDLSS技術などです。実は、これらはデモザイク処理のAIと似ています。これらはすべて、AIを利用して存在しない、または破損した画像情報を「埋めて」、画像の鮮明度を高めます。

今後、AIアルゴリズムの改善、機械学習の蓄積、ハードウェアの計算能力の向上により、AIデコードと画像強化はより驚くべき効果を発揮するでしょう。おそらく将来的には、モザイクはもはや視聴の障害ではなくなるでしょう。

<<: 研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている

>>: 法律教育ロボット「ダニウ」が潼南で任務に就き、一般市民に無料の法律サービスを提供

ブログ

ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか？

生活における人工知能の主な応用

人工知能の力：デジタル創造性から金融技術まで、知能は新たな機会をもたらす

ChatGPT で質問するときによくある誤解 10 選

2019年の人工知能の予測と展望

メールを受け取りましたか？ GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

百度、中国企業のインテリジェントアップグレードプロセスを加速させる新型PaddlePaddleスマートマシンを発売

業界: 過去数か月で、古い AI チップの価格が下がり、大規模モデルのトレーニングのコストが 60% 低下しました。

サイバーセキュリティにおける AI: 誇大宣伝と現実

推薦する

OpenAIは、レビューの効率を向上させ、人間の関与を減らすことができるコンテンツレビュー機能をテストしている。

18年経った今、マイクロソフトの自然言語処理技術はどうなっているのでしょうか?

AIプロジェクトの失敗はもはや人材不足のせいにはされない

2021年に自動運転はどのように発展するのでしょうか？

ハッシュ長拡張攻撃に対して脆弱なアルゴリズム

我が国の人工知能市場の規模は2022年に3705億元に達すると推定されている。

K平均法アルゴリズム Java実装クラスタ分析 681 三国志の将軍

AI仮想読書機、ジェスチャー認識+OCR+音声TTS

ジェフ・ディーンの大規模マルチタスク学習SOTAは苦情を受け、再現には6万ドルかかる

Ocado が機械学習を活用して食品廃棄を減らし、飢餓と闘う方法

アルトマンの巨大な AI 帝国を深く探ります。核融合プラントから不死技術センターまで、その規模は驚異的です。

人間のフィードバックなしで調整します。田元東チームの新しい研究RLCD：無害で有益なアウトラインライティングはベースラインモデルを全面的に上回る