モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

パスワードを隠すためにまだモザイクを使用していますか? 「見透かされる」ことには注意してください。

ピクセル化 (モザイクとも呼ばれる) は、次のような画像の一部領域の解像度を下げることで特定の重要な情報を隠す一般的なコーディング方法です。

例えば:

写真の中のモザイクを探してください! (見つからない場合は右の元画像をご覧ください)

しかし、情報を隠したいのに、その逆を行い、画像を元の状態に復元しようとするテクノロジーもあります。

最近、Depix と呼ばれる GitHub プロジェクトが非常に人気になり、開始からわずか 3 日間で 6.9k のスターを獲得しました。プロジェクトの作者である Sipke Mellema は情報セキュリティ コンサルタントです。

プロジェクトアドレス: https://github.com/beurtschipper/Depix

Depix は、ピクセル化された画像のスクリーンショットから元の画像に含まれるテキスト パスワードを回復できます。このプロジェクトは、リニア ボックス フィルターを使用して作成されたピクセル化された画像を扱います。下の図に示すように、プロジェクト作成者は、ピクセル化された画像、復元された効果、および元の画像の比較結果を示しています。

モザイクはかなり密でしたが、それでも Depix は隠された情報を基本的に解読することができました。

使い方

Depix を使用してピクセル化された画像のスクリーンショットからテキスト パスワードを回復することも比較的簡単です。

スクリーンショットから長方形のピクセル化されたブロックを切り取ります。

同じフォント設定(テキスト サイズ、フォント、色、hsl を含む)を持つエディターで、処理する文字の De Bruijn シーケンスを貼り付けます。

可能であれば、ピクセル化された画像に使用したのと同じスクリーンショット ツールを使用して、シーケンスのスクリーンショットを撮ります。

次のコマンドを実行します:

Depix アルゴリズムは、線形ボックス フィルターが各ブロックを個別に処理するという事実を利用します。検索画像内の各ブロックに対してピクセル化を実行し、直接一致するものを検索します。

ほとんどのピクセル化された画像の場合、Depix は単一の一致を見つけようとし、これらの一致が正しいと想定します。複数の一致するブロックを囲む結果は、ピクセル化された画像内で同じ幾何学的距離にあると見なされ、これらの一致も正しいと見なされます。このプロセスは複数回繰り返されます。

正しいブロックの幾何学的一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。

Depixのアルゴリズム

ピクセル化は、多くの場合、線形ボックス フィルターを使用して実現されます。線形ボックス フィルターは実装が簡単で、高速であり、複数のブロックを並列に処理できます。

線形ボックス フィルターは決定論的なアルゴリズムであるため、同じ値をピクセル化すると、通常は同じピクセル化されたブロックが生成されます。同じブロック位置を使用して同じテキストをピクセル化すると、同じブロック値が生成されます。一致するパターンを見つけるために、テキストをピクセル化してみることもできます。幸いなことに、これは秘密の値の一部にも機能します。各ブロックまたはブロックの組み合わせをサブ問題として考えることができます。

プロジェクトの作成者は、潜在的なフォントの参照テーブルを作成することを選択しませんでした。アルゴリズムでは、同じ背景に同じテキスト サイズと色が必要です。最新のテキスト エディターでは、色相、彩度、明度も追加されるため、使用できるフォントの数は膨大になります。

プロジェクト作成者が提示した解決策もシンプルです。処理する文字の De Bruijn シーケンスを使用し、それを同じエディターに貼り付けて、スクリーンショットを撮ります。このスクリーンショットは、類似ブロックの検索画像として使用できます。例:

de Bruijn シーケンスには、処理される文字の 2 文字の組み合わせがすべて含まれます。一部のブロックは 2 つの文字と重なるため、これは重要です。正しい一致を見つけるには、画像内で同じピクセル構成のブロックを検索する必要があります。

次のテスト画像では、Depix アルゴリズムは「o」の一部を見つけることができません。これは、検索画像では検索ブロックに次の文字(「d」)の一部も含まれていますが、元の画像ではそこにスペースがあるためです。

De Bruijn 文字列を作成するときにスペースを追加すると、明らかに同じ問題が発生します。つまり、アルゴリズムが後続の文字の適切なブロックを見つけることができないのです。スペースと文字の両方が含まれる画像では検索に時間がかかりますが、結果はより良くなります。

ほとんどのピクセル化された画像の場合、Depix はブロックに一致するものを 1 つ見つけて、それが正しいものであると想定できるようです。周囲のマルチマッチングブロックのマッチング結果は、ピクセル化された画像内で同じ幾何学的距離にあるとみなされ、これらのマッチングも正しいと想定されます。

正しいブロックに幾何学的な一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。 Depix の出力は完璧ではありませんが、かなり優れています。

次の図は、ランダムな文字を含むテスト画像のピクセル除去結果を示しています。ほとんどの文字は正しく読み取られています。

このプロジェクトに興味のある読者は、自分で試してみることができます。

スクリーンショットを撮る際に機密情報をぼかす場合、単純に「モザイク」を使うことはできなくなったようです。

<<:  将来、人工知能ロボットに置き換えられる可能性のある10の仕事

>>:  Transformerを廃止すれば、完全な畳み込みネットワークでもE2E検出を実現できる。

ブログ    
ブログ    
ブログ    

推薦する

AIと拡張現実が職場でどのように進化しているか

[51CTO.com クイック翻訳]職場における支援/拡張現実 (AR) と人工知能 (AI) の潜...

統計と機械学習の違いは何ですか?

[[263249]]ビッグデータダイジェスト制作出典: medium編纂者:周嘉楽、郭小白、蒋宝尚...

Claude3 が GPT4 に教訓を与えました!オープンAI最強の対戦相手の深夜爆弾、全貌解析付き!

制作:51CTO テクノロジースタック(WeChat ID:blog)深夜、OpenAI の最大のラ...

知能の本質:人間の知能と人工知能

なぜコンピューターは知能を発揮できるのでしょうか? コンピューターの知能と人間の知能の類似点、相違点...

...

...

...

誰でも使えるディープラーニング: 3 つの主要な自動化ディープラーニング プラットフォームの紹介

ディープラーニング技術は複雑で、ゼロから開発するのが難しい場合が多いですが、Microsoft の ...

...

IDCの予測: 今年のAI市場規模は1565億ドルに達し、前年比12.3%増となる

市場調査会社IDCは、2020年の世界の人工知能市場の規模は2019年に比べて12.3%増加すると予...

びっくり!外国人が人間の皮膚マスクでiPhone Xに挑戦:予想外の結果

iPhone Xのレビュー解禁に伴い、海外の主要主流メディアやテクノロジーブログが関連するテストや体...

音声認識の次のピークは「人間の領域」でしょうか?

[[208154]]ディープラーニングが普及し、音声認識に広く使用されるようになって以来、字幕の単...

Byteチームは、認知生成リストSoTAを理解するためのマルチモーダルLLMであるLynxモデルを提案しました。

GPT4 などの現在の大規模言語モデル (LLM) は、画像が与えられた場合にオープンエンドの指示...