知っていましたか?モザイクはもう安全ではありません! こんにちは、友人の皆さん。私は Jiguo.com で一番食べることが大好きなキーボード戦士、Jiguojun です。友人が私に尋ねました、Jiguojun に何が起こったのですか?何が起こっているのか尋ねると、彼はスクリーンショットをいくつか送ってくれました。見てみると、ああ—— 先月、世界最大のゲイ向け出会い系プラットフォーム「GitHub」で「Depix」というプロジェクトが人気を博したことが判明した。名前は分かりやすく「アンチピクセル」で、AI技術を使ってモザイクを除去するという意味です。 これには賛否両論があります。良い点は、古いドライバーは「コードは見えても心の中ではコードがわからない」というスキルを長い間習得しているものの、コードなしで見る方が明らかに便利で快適であることです。悪い点は、パスワードやデバイスの IMEI コードなどの個人情報が削除される可能性があることです。 コード化されていたものが本当にコード化されなくなりました! 本当に治るんです!元の著者は元の投稿でその効果の例を直接示しました。 この画像は処理のために Depix に投入されます。グラフィック カードの匂いを嗅いだ後、AI でモザイク処理された画像が出力されます。 手動で並べ替えた後、コード化されたテキスト コンテンツ「Hello from the other side」を取得できます。 これが元の画像です: 見て、似ているだけではなく、まったく同じです。 原則: シンプルで粗雑 画像の各ピクセルはデータのセットです(通常、RGBの3原色は0〜255の値で表されます)。モザイクは基本的に、画像を小さなグリッドに分割し、各グリッド内のすべてのピクセル値のRGB平均値を計算します。 最も単純な例を挙げると、黒と白を平均するとグレーになります。グレーの深さは、各小さなグリッド内の黒の割合によって異なります。 カラー画像のモザイクは比較的複雑ですが、原理は同じです。つまり、さまざまな色の RGB 値と、色が占める小さなグリッドの領域に基づいて、加重平均値、つまり平均色が得られます。 そのため、モザイクは個人情報を保護し、機密コンテンツを隠すために広く使用されています。これには、パスワードの隠蔽、インタビュー対象者の顔のモザイク、ポルノ情報の遮蔽などが含まれますが、これらに限定されません。CCTV は、David をモザイク処理するトリックさえ使用しました。 恥ずかしさからなのか、小さすぎるからなのかは分かりません。
よく知られているモザイク防止アルゴリズムである Depix の対策は非常に単純かつ大まかです。計算を直接逆にし、AI を使用して小さなグリッドをデータベース内の既存の文字の組み合わせと継続的に一致させます。それだけでなく、Depix では文字間隔の違いも非常に慎重に考慮し、「広い間隔」と「狭い間隔」のデータベースを同時に作成して、さまざまな段落形式を認識できるようにしています。 すると、一部の学生は、「著者はテキスト データベースのみを構築したので、友人はそれを使用してグラフィック コードを解読することはできないのですよね?」と尋ねるかもしれません。
ジグオジュンがあなたの小さな考えを知らないとは思わないでください!ジグオジュンもこのニュースを初めて聞いたとき、興奮しながら「P...Pah!」を開封したのを覚えています。情報漏洩の可能性が心配です。しかし、GitHubでのdepixの紹介によると、プロジェクトの目的はコードを削除することではなく、パスワード回復に使うことだそうです。携帯電話などモザイク処理された画像に対するパスワード回復ツールです。 したがって、テキストでコード化されていない画像は想像することしかできません (トゥルーカラー)。 弱点が目立ち、反撃は容易 慌てないで!モザイクから取得できる唯一の情報はピクセル値であり、これは次の値に相当します。 1+2+1+3+2+1 がわかれば、結果 10 を簡単に得ることができます。しかし、10 を知っても、元のデータの構成を判断するのは困難です。つまり、英語の筆記体文字など、データベースにないテキストは認識できません。 それだけでなく、著者はまだ中国語のデータベースを構築していません。これはわかりやすいですね。26文字+10桁の数字の作業量を、漢字の数万文字と比べると、なんとも言えないですね。 まとめると、Depix でできることは次のようになります。
情報のセキュリティが本当に心配な場合は、英語の文字をペイントブラシで覆い、ぼかすことができます。 または、モザイクのカラーブロックを拡大するだけでも、幽霊を認識できます。 準備さえしておけば、この種のパスワードクラッキングに対抗するのは非常に簡単です。 顔のデコード:アルゴリズムは素晴らしいが、失敗はひどい この研究はCVPR 2020で発表され、論文のタイトルは「PULSE: 生成モデルの潜在空間探索による自己教師付き写真アップサンプリング」です。 もちろん、デューク大学が開発したアルゴリズムは、当初は現地の人々の顔をモデルにしてトレーニングされていたため、アジア人の顔を解読する際には間違いは避けられません。たとえば、復元された画像は次のとおりです。 修理は大丈夫だと思いますか?しかし、元の画像は次のとおりです。 顔のデータベースが一致しなかったので、車はまっすぐ祖母の家へ向かいました。 コーディングは依然として信頼できますが、不器用にならないようにしてください。
情報漏洩が本当に心配な場合は、太いコード(複数の濃い色のブロック)を使用すると、心配する必要がなくなります。 しかし、まったく言葉にならないモザイクが 1 つあります。 他の人がはっきりと見ることができないのではないかと心配していますか? |
<<: 人工知能を活用して顧客サービス体験を向上させる 5 つの方法
>>: シリコンバレーの大企業も「名門校の学位」を重視するのでしょうか? Redditの男の魂を問う質問が白熱した議論を巻き起こす
[51CTO.com クイック翻訳] 画像処理と比較すると、ビデオから洞察を抽出したり、AI 技術を...
ジェニファー・ターナーの代数学の授業はかつてとても眠くて、多くの生徒が眠気を催していた。現在、教育を...
検索システムにはヘッド効果が存在する可能性が高く、高品質のミッドテールおよびロングテール製品が十分な...
[[244104]] Scientific American誌によると、近い将来、人工知能(AI)が...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
近年、ドローン産業の発展は急速です。業界の段階的な改善と成熟により、製品の種類、数量、市場規模の継続...
過去 10 年間で、機械学習への関心は爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエ...
IEEEは、米国、英国、中国、インド、ブラジルの最高情報責任者(CIO)と最高技術責任者(CTO)を...