ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

モザイクは人々に嫌われており、「モザイクは人類の文明の進歩を妨げる」という諺が生まれたほどです。映画でモザイクを見ると退屈し、文書でモザイクを見ると興味を失います... 数え切れないほどの友人が、モザイクは本当に取り除くことができないのかという質問の答えを探しています。 ワンクリックでコード化されたコンテンツをコード化解除できるブラックテクノロジーはありますか?

原則として、モザイクは永久的な情報損失を表します。モザイクの原理は非常に単純です。多数の小さなピクセルを 1 つの大きなピクセルに結合し、平均色を取ってモザイクを作成します。モザイクは明らかに不可逆な操作です。平均から、どの数値の平均であるかを推測することはできません。

しかし、モザイクを復元するのは本当に不可能なのでしょうか? 一般的に言えば、モザイクを削除するには、想像力を働かせて、失われた内容を描き直す必要があります。この方法は非効率的であり、結果が安定しません。近年の AI テクノロジーの普及により、多くの驚くべきアプリケーションが誕生しました。最近、AIによるモザイク除去に関するニュースがいくつかありました。見てみましょう。

デピックス

最近注目を集めているデコードツールです。 Depix は GitHub 上のオープンソースであり、主にテキストモザイクを削除するために使用されます。開発者の場合は、以下のリンクから GitHub ページにアクセスしてプロジェクトをフォローできます。

Depix GitHub ホームページ: https://github.com/beurtschipper/Depix

まずはDepixの効果を見てみましょう。

Depix によるモザイク除去の効果。上から順に、モザイク後の文字、Depix による修復効果、元の画像です。

モザイクの完璧な復元ではありませんが、手作業では難しい、言葉では言い表せないほどの大量のものを、ある程度読みやすい文字に復元できるというのは、驚くべきことです。 Depix はどのようにしてこれを達成したのでしょうか?

Depixの原理は、実は理解するのが難しくありません。まず、Depix はテキスト テーブルを使用してテキストをモザイク化します。 Depix で使用されるテキスト テーブルは、復元される予定の文字の 2 文字の組み合わせを含む De Bruijn シーケンスを採用しています。


デ・ブリュインシーケンス

Depix の開発者は、多くのテキストがモザイク化された後、いくつかのモザイク ブロックが 2 つの文字の組み合わせになるため、この 2 つの文字が非常に重要であると考えています。たとえば、下の図では、特定のモザイク ピクセルに実際には「o」と「b」の両方が含まれており、この 2 つの文字により、より正確な一致が提供されます。


2文字マッチングにより、対応するテキストを正確に識別できます

最後に、モザイク ブロック ルックアップ テーブルが生成されます。

次に、Depix は DebBruijn シーケンスのモザイク ルックアップ テーブルを使用して、復元するモザイク テキストを照合します。モザイク テキストのブロックがルックアップ テーブルの結果と一致すると、かなり正確なテキストに復元されます。完璧ではありませんが、どのような文字であるかを認識できるほどの効果があります。

簡単に言えば、Depix の原理は、モザイクを既知のコード化されたデータと照合し、それを復元することです。この技術の出現により、モザイクでパスワードを隠すなどのシナリオに課題が生じています。しかし、Depix には明らかに限界があります。現在は主に英語の文字とアラビア数字の認識に使用されています。当面、Depix は膨大な量の漢字を処理することができません。

グーグルブレイン

Depix はテキストのデコードに希望を与え、Google Brain は画像のデコードの代表です。 Google Brain は Google が立ち上げた AI プロジェクトであり、画像モザイク除去に関する研究は非常に詳細です。

Google Brain は、多数の高解像度と低解像度のサンプリングを通じて学習し、復元結果に一致するルールを導き出す新しいピクセル再帰型超解像技術を使用します。たとえば、Google Brain は特定の黒い点がメガネのものであると学習しているため、モザイクを復元するときに、これらの黒い点を目に復元できます。テストから判断すると、その効果は実に驚異的です。


Google の画像デコード AI

このような AI 技術の用途は何でしょうか? モザイク除去は、特定の状況でのみ特定の用途に使用されます。同様のアルゴリズムは、多くの場合に役割を果たします。画像を修復する必要がある限り、役立ちます。たとえば、写真を撮るときに手が震えて、写真がピントが合わずぼやけてしまったらどうすればいいでしょうか。従来の方法は、単純で大まかなシャープニングかもしれません。しかし、写真アプリが AI 技術を採用していれば、失われたディテールやシャープネスを「補い」、できるだけ使いやすい写真に仕上げることができます。

要約する

上記以外にも、AIを利用して画像を強化する技術は数多くあります。例えば、Waif2xのインテリジェント画像拡大技術や、NVのDLSS技術などです。実は、これらはデモザイク処理のAIと似ています。これらはすべて、AIを利用して存在しない、または破損した画像情報を「埋めて」、画像の鮮明度を高めます。

今後、AIアルゴリズムの改善、機械学習の蓄積、ハードウェアの計算能力の向上により、AIデコードと画像強化はより驚くべき効果を発揮するでしょう。おそらく将来的には、モザイクはもはや視聴の障害ではなくなるでしょう。

<<:  研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている

>>:  法律教育ロボット「ダニウ」が潼南で任務に就き、一般市民に無料の法律サービスを提供

ブログ    
ブログ    

推薦する

OpenAIは、レビューの効率を向上させ、人間の関与を減らすことができるコンテンツレビュー機能をテストしている。

人工知能のスタートアップ企業OpenAIは8月16日、GPT-4がコンテンツレビュー機能をテストして...

18年経った今、マイクロソフトの自然言語処理技術はどうなっているのでしょうか?

[51CTO.com からのオリジナル記事] 自然言語処理は、人工知能の開発において常に克服しなけ...

...

AIプロジェクトの失敗はもはや人材不足のせいにはされない

AI の取り組みが失敗すると、その責任はスキルのギャップにあるとされることが多いです。しかし、それだ...

2021年に自動運転はどのように発展するのでしょうか?

EEtimesより翻訳2021年に自動運転車はどうなるでしょうか。自動運転業界の昨年の業績は平凡で...

ハッシュ長拡張攻撃に対して脆弱なアルゴリズム

ハッシュは、一般的に「ハッシュ」と翻訳され、「ハッシュ」と直接書き起こされることもあります。ハッシュ...

...

我が国の人工知能市場の規模は2022年に3705億元に達すると推定されている。

人工知能は、機械を通じて人間の思考と意思決定をシミュレートすることに重点を置いたコンピューターサイエ...

K平均法アルゴリズム Java実装 クラスタ分析 681 三国志の将軍

1. k-meansアルゴリズムの紹介: k-means アルゴリズムは入力量 k を受け取り、n ...

AI仮想読書機、ジェスチャー認識+OCR+音声TTS

こんにちは、みんな。最近はAIGCのコンテンツを研究しており、公式アカウントのコンテンツを長い間更新...

ジェフ・ディーンの大規模マルチタスク学習SOTAは苦情を受け、再現には6万ドルかかる

2021 年 10 月、Jeff Dean が新しい機械学習アーキテクチャである Pathways ...

Ocado が機械学習を活用して食品廃棄を減らし、飢餓と闘う方法

[[282701]] [51CTO.com クイック翻訳] 食品廃棄は世界中で大きな問題となっていま...

アルトマンの巨大な AI 帝国を深く探ります。核融合プラントから不死技術センターまで、その規模は驚異的です。

制御された核融合から AGI、そしてチップ業界全体の再編まで、アルトマン氏の将来の AI 展望は、も...

人間のフィードバックなしで調整します。田元東チームの新しい研究RLCD:無害で有益なアウトラインライティングはベースラインモデルを全面的に上回る

大規模モデルがより強力になるにつれて、低コストでモデルの出力を人間の嗜好や社会の公共価値により沿った...

...