厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

怖い話をしてください。

今朝、同僚とWeChatでチャットをしていて、女性の同僚の最近の変化について話しました。

その結果、彼はテキストをモザイク処理し、スクリーンショットを撮ってグループに投稿しました。

私はさらにもう一撃加えました:

@XXX、彼はあなたについて悪いことを言いました〜

予想外に、この同僚は積極的に近づいてきて、「秘密のテキスト」の内容を直に指摘しました。

当時の私はこんな感じでした。

これを見た先生はこう付け加えた。

いつの時代ですか?ぼかしたら判別できなくなると思いますか?数分で復元できます!

好奇心が湧いたので、私はすぐにこの技術についての「調査」を始めました。

(追記:元のチャット画像は記事の最後に掲載しています)

モザイク化されたテキストを復元するにはどうすればいいですか?

さらに、外資系企業の主任研究員であるダン・ペトロ氏(以下、ダン)が、この2日間でこんな投稿をした。

彼はすぐに本題に入った。

モザイク化(ピクセル化)は非常に悪質かつ危険な方法であり、機密データが漏洩する可能性があります。

ダンは彼の主張を裏付けるために、  編集解除 ツール。

次に、このツールを使ってモザイクテキストを少しずつ復元する方法を実演しました。

上記の例から、元のテキストが厚いモザイク層で覆われていても、このツールの前では「裸」のように見えることは難しくありません。

おそらく、この装置の操作は複雑だと言うでしょう?

いやいやいや。

とても簡単です。たった 2 つのステップです。

  • npm installで依存関係をインストールする
  • npm startで開始する

モザイク画も復元されている

しかし、非常に現実的な問題は、Depix によって復元されたテキストは視覚効果の点であまり良くないということです。

Depix で復元したテキストは、まだところどころぼやけています。

そこで、Jumpsec Lab の研究者がこの件を指摘し、興味深い課題も提示しました。

パスワードを解読してしまった場合は、ご連絡ください。

この課題は Dan に大きな関心を呼び起こし、Unredacter を開発するに至りました。

そこで、Unredacter の助けを借りて、Dan はこの課題を無事に克服しました。

その後、ダンは研究者に連絡を取り、研究者は電子メールで返信し、ダンの結果が正しいことを確認しました。

それだけでなく、ダンは、スミアリングによって作成されたモザイクの場合、GiMP、Photoshop、その他のエディターのいずれでも結果が同じになることも紹介しました。

したがって、彼のクラッキング方法はある程度の普遍性を持っているはずです。

もちろん、私たちは生活の中である程度「コーディング」する必要があります。モザイクは安全ではないので、もっと良い方法はあるのでしょうか?

これに対するダンの返答は次のとおりです。

黒いバーを使用してブロックします。

モザイク画も復元されている

実際、AIコミュニティでは「モザイクの復元」という問題を長らく研究してきました。

例えばデューク大学  PLUSEもその1つで、CVPRでもトップになりました。

ただし、修復されるのはテキストではなく、ポートレートです。例:

原理的な観点から見ると、それは本質的に生成的敵対ネットワークです。   (GAN)

PLUSE は主に、ぼやけたモザイク ピクセルに基づいて存在しない新しい顔を「描画」し、それをモザイク状態に圧縮して元の画像と比較し、類似したバージョンを表示します。

もちろん、この技術は完璧ではなく、失敗することもあります。

例えば、ネットユーザーがマリオで試してみたところ、結果は…

うーん…この「味」は普通じゃない。

もう一つ

最後に、冒頭の物語の答えを明らかにしましょう。

これは本当に痛い教訓です...

プロジェクトアドレス:

https://github.com/bishopfox/unredacter

<<:  ハイパーオートメーション — AIの新時代における自動化

>>:  陳丹奇と清華大学特別賞受賞学生が新たな成果を発表:Google BERTが提案したトレーニングルールを破る

ブログ    
ブログ    

推薦する

AIデータサービス業界は「認知戦争」に突入。なぜYunce Dataは業界No.1の座を維持しているのか?

新しいインフラストラクチャにより、AI の実装が加速され、その背後にある「糧」である AI データ ...

...

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

[[422314]]近年、都市化と道路交通建設の加速により、自動車旅行の需要が継続的に増加しており、...

...

Keras の重み制約を使用してディープ ニューラル ネットワークの過剰適合を減らす

[[333587]]重み制約は、ディープラーニング ニューラル ネットワーク モデルのトレーニング ...

人工知能が本格的に登場し、企業はその挑戦に挑む準備ができている

多くの企業は、短期的には利益が見込めないため、AIパイロットプロジェクトを推進できず、AIプロジェク...

電流制限アルゴリズムを理解すれば十分です。

TL;DR (長すぎるので読まないでください)現在の制限アルゴリズム: カウンター、スライディング...

...

...

中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。

中国科学院が1月17日に発表したところによると、このほど中国科学院深圳先進技術研究所医療工学研究所低...

...

26億のパラメータ、智源と清華が中国の大規模事前トレーニングモデルをオープンソース化

最近、北京人工知能研究院と清華大学の研究チームは共同で、中国語を中核とした大規模な事前学習済み言語モ...

ディープラーニングはオイラー方程式を「破壊」する準備ができている

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

[ディープラーニングシリーズ] PaddlePaddleとTensorflowでGoogLeNet InceptionV2/V3/V4を実装する

前回の記事では、GoogLeNet InceptionV1のネットワーク構造を紹介しました。この記事...

...