最終的にAIによってモザイクが見破られたとき、私たちのプライバシーはどこに隠されるのでしょうか?

[[239842]]

モザイクといえば、多くのオタクがそれに腹を立てていると思います。1、2時間かけてダウンロードした後、開いてみたら暗号化されていたのです... おそらくコンピューターを壊したくなるでしょう。

もちろん、オタクの気分を害することもあるが、モザイクは保護の役割を果たすこともよくある。たとえば、ホラーや流血シーン、警察官などが出てくる画像の場合、モザイクをかけることで人々に不快感を与えることを避け、公務員の安全を守ることができます。さらに、この映画の検閲はオタクの感情を傷つけることを意図したものではなく、すべて商業的な必要性のためです。一般的に、日常的な使用においてモザイクについて批判すべき重大な点は基本的に何もありません。

しかし問題は、人工知能時代の到来により、Mosaic が「解読」されるリスクに直面する可能性があることです。

うまくコードを書くためにAIは怠け者ではない

私たちは日常の写真やビデオでモザイクをよく目にしますが、その起源についてはよく知らない人も多いかもしれません。

「モザイク」とは英語の「mosaic」の音訳で、もともとはブロック状の象嵌技法の一種で、古代ギリシャに起源を持ちます。画像に部分的なぼかしを施す方法は、特定の領域の色レベルを調整し、乱れたカラーブロック効果を生み出すことです。このようなカラーブロックは小さな正方形のようなもので、モザイクに非常に似ています。そのため、この画像をぼかす処理はモザイクと呼ばれます。

[[239843]]

実は簡単に言うと、画像の解像度を下げることです。本来、顔は1000万ピクセルに分割できますが、現在は10に縮小されています。それでも認識できますか？

したがって、エンコードが重いかどうかは、解像度がどの程度低下するかだけを見て判断します。

モザイクは画像処理なので、当然ながら、写真と動画という 2 つの基本的なシナリオがあります。

写真をぼかすのは基本的に難しいことではありません。写真は静止しているので、領域を選択して直接操作するだけです。しかし、動的なビデオをコーディングする場合、技術的な困難が生じます。

ビデオは画像のフレームで構成されています。この問題を解決する最も直接的な方法は、各フレームをぼかしてから組み合わせることのようです。ビデオのぼかしは完了です。しかし、それは明らかにありそうにありません。従来の映画フィルムは 1 秒あたり 24 フレームです。5 分間のビデオを処理する場合でも、何千枚もの画像を処理する必要があります。作業が完了すると、すべてがモザイク状になるでしょう。

この目的のために、人々は多くのアイデアを思いつきました。 YouTube はかつて、ユーザーが車のナンバープレートの番号、家の番号、銀行カードなどの個人情報をぼかすことができるカスタムぼかしツールをリリースしたことがある。表面的には、技術初心者でも簡単にモザイクを追加できます。しかし、困ったことに、このツールはコーディング範囲を簡単に拡張することができます。たとえば、ナンバープレートをコーディングすると、車の前面全体がぼやけてしまう可能性があります。顔をコーディングすると、体全体がぼやけてしまう可能性があります。

Microsoft が開発したコーディングツールでは、より正確に追跡できる可能性があります。このツールは人工知能技術に基づいており、ディープラーニングニューラルネットワークを構築することで、ビデオ内の顔を正確に検出し、追跡を実現できます。また、ビデオ内の他のキャラクターの「誤読」を避けるために、さまざまな顔を認識できます。この一連のプロセスを通じて、人工知能コーディングのパフォーマンスは非常に良好になります。

コーディングに人工知能を使用することは、コーディング技術の大きな進歩と言えます。人間が画像をフレームごとに処理する必要はなく、ビデオクリップを抽出、コピー、レンダリング、追跡するために扱いにくいビデオ処理ソフトウェアを使用する必要もありません。これにより、モザイクがターゲットの動きの速度に追いつかず、露出を引き起こす状況を大幅に回避できます。

しかし、モザイクの目的はプライバシーを保護することですが、その背後にある実際の内容について人々の好奇心を刺激しています。 AIコーディングも暇ではなく、「デコード」するグループも大忙しです。

自分の槍を使って他人の盾を攻撃する：AIは「解読」が得意のようだ

デコードロジックも非常にシンプルです。モザイクはぼやけた画像処理なので、わかりやすく説明してあげてもいいのではないでしょうか。

少し前、NVIDIA、フィンランドのアアルト大学、MITは共同で、AIを使用して数ミリ秒以内にぼやけた画像を微調整する技術を開発しました。実際、同様のぼかし画像処理技術は数多く存在します。これらは、コーディングレベルが低い一部の画像を処理する場合には役立つかもしれませんが、より複雑な画像の処理には使用しないでください。

もちろん、モザイク除去技術の研究開発に真剣に取り組んでいる人もいます。

2016年、テキサス大学は、モザイクの閉塞を効果的に貫通し、画像情報を識別できるモザイク除去方法を開発しました。技術者らは顔とテキストの認識システムを構築し、インターネット上の画像を使ってそれを訓練した。最終的に、ぼやけた動画内の顔を復元する精度は80％以上、モザイクがひどくかかった顔でも約50％の正確な復元率を達成した。

このレベルを達成できれば、検閲を軽々しく利用する人々の警戒心を喚起するのに十分であるはずだ。

昨年、Google はさらに残酷なことをしました。マイクロソフトがモバイル顔認識を発表した直後、グーグルは、新しいピクセル再帰超解像技術を採用することで、Google Brainが画像の高ピクセルと低ピクセル間の変化パターンを取得し、コード化されたコンテンツのより正確なマッチングを実現できると発表した。例えば、赤い部分が唇であることを学習した後、対応する部分を唇に復元します。

つまり、Google Brain は学習とトレーニングを通じて、モザイクに基づいて写真に写っている顔の本来の姿を「埋める」ことができるのです。

Google は Microsoft の面目を与えていないようです...

オタクの友人たちはみんな、これを試してみたいと思っているはずです。そして、何度も希望と失望の間で揺れ動くことがないように、Google がこの技術をすぐに実用化してくれることを期待しています。

しかし客観的に言えば、ぼかしは実際には画像に回復不可能な損傷を与える行為です。したがって、絵は「復元された」と言うよりも、「推測された」と言った方が正確でしょう。一般的な意味でのモザイク画像を人工知能で復元するために必要な条件は、大量の画像比較です。これはテキサス大学と Google の両方に当てはまり、元の画像素材がない場合、人工知能は元の画像に可能な限り近づくことしかできないことを意味します。

モザイクが破られても、私たちのプライバシーは安全でしょうか?

ただし、近いということは、必ずしも元の画像と同じであるとは限りませんが、非常に似ている可能性があることを意味します。この観点からすると、モザイク除去技術の出現は、間違いなく、この記事の冒頭で述べたプライバシーとセキュリティの問題に大きな脅威をもたらすでしょう。

[[239846]]

誰も見たくないこの可能性に対処するために、次のような方法が考えられます。

***、イメージを暗号化して変更します。テキサス大学は、ぼかしやコード化されたビデオの認識率は高いものの、南カリフォルニア大学が開発した P3 技術 (プライバシー保護写真共有) を使用して修正された画像の認識精度は 17% しかありません。この技術は、インターネット時代における写真配信の安全性を確保するために開発されました。同様の技術は数多く存在し、写真の詳細な特徴を変更することで人工知能の推測の方向を誤らせ、プライバシーとセキュリティを保護することができます。

次に、コーディング形式を変更します。サイモンフレーザー大学の研究者たちは、人工知能を使って、ぼかす必要のある顔を芸術的にレンダリングする方法を考案した。こうすることで、話者の感情的な特徴を示し、視覚効果をよりドライにすることができます。結局のところ、モザイクが揺れているのを常に見ているというのは、あまり良い視覚体験とは言えません。

[[239847]]

さらに、抽象画で処理された顔は、基本的に人間の顔とは無関係に見えるはずです... Google がそれでも認識したいのであれば、より複雑な抽象芸術の絵画にさらに力を入れなければならないかもしれませんし、マスターになるには少なくとも 10 年から 8 年かかるかもしれません。

3番目に、極端な「コーディング」を使用します。モザイク画像を「復元」できる理由は、一方では解像度が十分に低下していないこと、そして、コード化された画像にはまだ元の画像の特徴がある程度残っていることです。まあ、知られたくないなら、大雑把に隠せばいいだけだよ。顔に黒いバーを貼り付けたり、白い光を当てたり、大きな顔文字を使って感情を表現するという問題は、おそらく人工知能には解決方法がない。ただし、このトリックは注意して使用する必要があります。結局のところ、ビデオ内で浮かんでいる大きな黒いバーと比較すると、モザイクの方が快適です。

もちろん、モザイク除去技術に直面しても、過度に不安になったり緊張したりする必要はありません。一方、その技術はまだ成熟には程遠く、現在は顔認識の「復元」に限られており、文字や商標などはまだ含まれていない。一方、画像のぼかしと鮮明さの技術は、犯罪捜査事件の重要な写真の復元、考古学資料の鮮明さ、さらには家庭の古い写真の修復など、多くの場面で積極的な意義を持っている。

ぼやけた画像を鮮明にすることに比べると、モザイクを解読することが最も難しいステップであることは明らかです。モザイクさえ除去できれば、日常の写真や動画の高画質化も簡単です。さらに、モザイク除去技術が最終的に成熟したとしても、プライバシーが簡単に漏洩する可能性があるため、必然的に法的および道徳的制約に直面することになるだろう。

したがって、適切な制約の下で、モザイクのようなものと戦わなければなりません。

<<: 人工知能は寒い冬を迎え、自動運転車の開発は妨げられている

>>: ニューラルネットワークの層とノードの数を設定する方法