Reddit で話題: 言葉では言い表せない写真に透かしを追加することに特化したアプリが AI によって解読されました!

Reddit で話題: 言葉では言い表せない写真に透かしを追加することに特化したアプリが AI によって解読されました!

ベルギーの通信会社は、10代の若者向けに「.comdom」というセキュリティアプリをリリースした。このアプリは、送信した写真に受信者の情報を透かしとして追加し、プライベートな写真の二次的拡散を防ぐことができる。しかし予想外に、わずか数日で研究者グループによって解読され、元の画像が完璧に再現され、Redditのネットユーザーの間で白熱した議論が巻き起こった。

まず真面目な質問をさせてください。あなたの上の階のベッドで寝ている男性から、なんとも言えない写真を受け取ったことはありますか?

18歳未満の10,300人を対象にした調査では、セクスティングはますます一般的になりつつあり、15%の若者がセクスティングをしたことがあるという結果が出ました。欧米諸国では、その割合はさらに高くなっています。たとえば、ベルギーでは、15~21歳の若者の約50%がこれを行っています。

こうした画像の悪用を防ぐため、ベルギーの通信事業者テレネットが解決策を考案した。同社はチャイルドフォーカスと協力して「.comdom」というアプリを立ち上げた。名前が示すように、このアプリはティーンエイジャー間のテキストメッセージのやり取りをより安全にします。

簡単に言えば、写真に透かしを追加できます。一般的な透かしとは異なり、これには写真の受信者の名前と電話番号が含まれます。さらに、透かしは写真全体を覆っており、通常の画像編集ツール(Photoshop など)では削除するのが困難です。

そうすれば、誰かに送信したプライベートな写真が再配布された場合、誰がそれをしたかが全員にわかります。このようにして、テレネットは二次的に拡散されるプライベートな写真の割合を減らすことを望んでいます。

しかし、透かしを追加した後は本当に安全なのでしょうか?

透かしが破られ、AIが助ける

今日、このアプリのクラックに関する投稿が Reddit のホットリストのトップになりました。

わずか数日間で、ベルギーのゲント大学のIDLab-MEDIAの研究者数名が、高画質を維持しながら自動的に透かしを削除できるツールを開発し、その結果を添付しました。

アプリを使用して透かしを入れた画像

[[286066]]

透かしを削除するにはツールを使用する

完璧な修復ですか?後者の写真がオリジナルだと言ったら、多くの人が信じるだろうと思います。彼らはどうやってそれを行うのでしょうか?答えはAIです。

透かし除去の研究は、ゲント大学のピーター・ランバート教授のIDLab-MEDIA研究グループの研究者、マーティン・コートー氏とハンネス・マリーン氏(写真左から右)によって実施されました。研究者は、アプリケーションがどのように透かしを構築するかを簡単に調べることができます。次に、ランダムに選択された数千枚の写真のコレクションに透かし自体を(複数の形式で)適用しました。最後に、これを基に、比較的単純な人工知能アルゴリズム (ニューラル ネットワーク) をトレーニングして、透かし入りの写真と元の写真との関係を見つけます。その後、このアルゴリズムはアプリで撮影した写真から透かしを削除できるようになります。

「.comdomの開発者は、現代のAI技術の力を過小評価していた」。しかし、研究者らは、このアプリを使用する人々を保護するため、透かしを削除するソフトウェアはリリースしないと述べた。

透かしを削除することは小さな問題ですが、社会的に大きな意義があります。

表面的には、これは「大学生が商用アプリケーションを解読することに成功した」というもう一つの事例だが、特にディープフェイク技術がますます成熟しつつある今日、その背後にある社会的意義を過小評価することはできない。そのため、このニュースがRedditに投稿されるとすぐに、コミュニティユーザーの注目を集め、白熱した議論が巻き起こりました。まずは、この事件についてみんながどう思っているかを見てみましょう。

ディープフェイクの懸念: 顔を公開せずに写真を投稿するのはもはや「それほど」安全ではない

アプリ開発者の観点から見ると、彼らは確かに、画像が一般ユーザーによって再び拡散されるのを防ぐ実行可能なメカニズムを発見したのです。しかし、AI 実践者の目には、この方法は少し幼稚に思えます。

Rhakae:このいわゆる「言葉にできない写真を安全に送信する」機能は意味がないと思います。最も効果的な方法は、1) 決して投稿しないこと、2) 投稿する場合でも顔を見せないことです。

MuonManLaserJab : Rhakae が挙げた 2 つの点に加えて、もっと効果的な方法がもう 1 つあると思います。自分のゲイビデオを上司に送って「私が作ったこのディープフェイクがどれだけリアルか見てよ!」と言えるような画像偽造ソフトウェアの開発に取り組んでいます。そうすると、将来同じような情報が漏れても、誰も興味を持たないでしょう。 (これは毒を毒で対抗することの頂点です!)

Dr_Thrax_Still_Does: 2020 年には、頭身入れ替え機能を実現できるアプリや Web サイトが間違いなく多数登場すると言っても過言ではありません。さらに、十分な数の写真を入力すると、AI は実際の詳細に非常に近い写真を生成することもできます。

注意:顔を見せないことは完全に安全というわけではありませんが、少なくとも比較的安全です。全員を止めることはできないが、ほとんどの人を止めることができれば、それはかなり良いことだ。このプロジェクトの目的は、透かしを完全に削除することです。では、透かしを再構築できると想定してよいのでしょうか?

MuonManLaserJab : テクノロジーを秘密にしておくのは常に困難です。遅かれ早かれ、アルゴリズムが発見され、誰かがこのテクノロジーを悪用する可能性があります。しかし、セキュリティ モデルが侵害されると、テクノロジは新しいアップグレード モデルを開発せざるを得なくなると私は考えています。

schludy : 次のステップは、服を脱ぐことです!

AbsolutelyNotTim : 生涯にわたる追求です。

賢いネットユーザーはその背後にある実装原則を分析している

LartTheLuser : 特別に構築されたウェーブレット基底関数の秘密セットと、暗号化キーに対応するウェーブレット重みセットの逆ウェーブレット変換を、要素が .comdom にのみ知られている楕円曲線セットのドメイン パラメータとして使用する必要があります。鍵の漏洩を防ぐために、数百に及ぶ複数の楕円曲線が使用され、冗長性があるため、時間の経過とともに再利用できます。

次に、信号は、これらの信号を逆畳み込みできる非常に強力なニューラル ネットワークによる敵対的生成を通じて生成されたいくつかの複雑な関数で畳み込まれた逆ウェーブレット変換を受けます。

次に、上記のプロセスの逆を実行して、.comdom アプリケーションが画像を画面に読み込むときに、透かしが画面に動的に追加されるように作成します。つまり、次のことを行う必要があります。1) 強力なニューラル ネットワークを実行して、縮退した畳み込み信号を逆畳み込みします。 2) ウェーブレット基底関数の事前知識を使用してウェーブレット変換を実行し、楕円曲線の重みのいくつかのサブセットを取得します。 3) 特別な専用の楕円曲線を使用して、さまざまな楕円曲線をコンポーネントに分解し、そのコンポーネントが有効なキーであり、画像透かしコンテンツのハッシュに対応するコードであることを確認します。このハッシュ値は、透かしの内容を取得し、それを画像に重ねるために使用されます。

こうすることで、既知の画像がアプリや他の参加アプリに表示されるたびに、常に透かしが入れられるようになります。これを解決する唯一の方法は、非常に難しい AI の問題、非常に難しいシグナリングの問題、そしてこれまで解読不可能だった暗号化メカニズムの複雑なシーケンスを解決することです。

これは CIA やその他の高度な諜報機関が使用しているメカニズムであると確信しています。

ミリ秒レベルで画像ノイズを除去します! NVIDIAとMITの新しいAIシステムは透かしを完璧に除去できる

実際、画像から透かしを削除することは新しいことではありません。 ICML2018では、NVIDIA、MITなどの研究者らが、画像から透かしやぼかしなどのノイズを自動的に除去し、ほぼ完璧に復元できる画像ノイズ除去技術「Noise2Noise」を実演しました。レンダリング時間は数ミリ秒です。

このディープラーニングによるノイズ除去方法により、「ノイズ」のない鮮明な画像を使用せずに、透かしを完全に除去できます。効果は以下のとおりです。

研究チームは、ImageNet データセットから 50,000 枚の画像を使用して AI システムをトレーニングしました。このシステムは、ノイズのない対応する画像を見たことがない場合でも、画像からノイズを除去できます。

Noise2Noiseと呼ばれるこのAIシステムはディープラーニングを使用して作成されましたが、クリーンな画像とノイズのある画像のペアでネットワークをトレーニングするのではなく、ノイズのある画像のペアでネットワークをトレーニングし、ノイズのある画像のみを必要とします。 Noise2Noise のトレーニングには、コンピューターで生成された画像と MRI スキャンも使用されました。

研究者たちは、ノイズのみを使用してNoise2Noiseをトレーニングすることで、天体写真、磁気共鳴画像法(MRI)、脳スキャンなど、ノイズを多く含むことが知られている画像にもこの手法を使用できることを期待している。

左から右へ: 入力ノイズ画像、ノイズ除去画像、オリジナル画像

IXI データセットから 50 人の被験者の約 5,000 枚の画像が、Noise2Noise の MRI 画像ノイズ除去機能をトレーニングするために使用されました。人工的なノイズがない場合、結果は元の画像よりもわずかにぼやけますが、鮮明さは十分に復元されます。

MRI 画像のノイズ除去

「これは概念実証であり、公開されているMRIデータベースでトレーニングしたが、将来的には現実世界での応用に有望である可能性がある」とNvidiaの研究員ジェイコブ・ムンクバーグ氏は語った。

Noise2Noise システムは、破損した画像を使用してトレーニングされたニューラル ネットワークを使用してこれを実行します。きれいな画像は必要ありませんが、ソース画像を 2 回観察する必要があります。実験では、さまざまな合成ノイズ (加法ガウスノイズ、ポアソンノイズ、二項ノイズ) の影響を受けたターゲット画像でも、クリーンなサンプルを使用して復元された画像と「ほぼ同じ」品質を維持できることが示されています。このシステムの最も興味深い点は、画像のレンダリングにかかる​​時間をミリ秒レベルまで大幅に短縮できることです。

「適切で一般的な状況下では、クリーンな信号を観察することなく、破損したサンプルのみから信号を再構築する方法を学習でき、クリーンなサンプルの場合と同様に実行できることが分かりました」と研究者らは論文に記している。「以下に示すように、統計的な観点からは結果は些細なものかもしれませんが、実際にはこのアプローチにより、クリーンなデータが利用可能である必要がなくなり、信号再構築の学習が大幅に簡素化されます。」

写真に透かしを入れたり削除したりすることについてどう思いますか?


<<:  アヴネットの鍾喬海氏:人工知能はモノのインターネットの実装を加速させる

>>:  AIが高度な数学の核心を突破、微分方程式と不定積分を1秒以内に解き、その性能はMatlabをはるかに上回る

ブログ    
ブログ    

推薦する

...

GTA6のトレーラーは1億回以上再生されており、3人のAI巨人も数秒でGTAギャングに変身できる

新しいGTAゲームの予告編を見ましたか?この予告編は3つのギネス世界記録を破り、再生回数は1億回を超...

概念から事例まで: 初心者向けの機械学習アルゴリズムトップ 10

この記事では、まず初心者が知っておくべき機械学習 (ML) アルゴリズムのトップ 10 を紹介し、い...

アイデアから実装まで、2018 年の 13 の驚くべき新しい NLP 研究

2018 年には、自然言語処理の分野で多くの刺激的なアイデアやツールが生まれました。概念的な視点から...

ナレッジグラフを使用して RAG 機能を改善し、大規模モデルの幻覚を軽減する

幻覚は、大規模言語モデル (LLM) を使用するときによく発生する問題です。 LLM は流暢で一貫性...

マイクロソフト、AIシステムツール「Counterfit」のソースコードを公開

最近、マイクロソフトは、開発者が AI および機械学習システムのセキュリティをテストできるように設計...

4Dミリ波レーダーSLAMソリューション研究

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

携帯電話で AI を使用するにはどうすればいいですか?写真を撮るのは本当にハイテクです

AI、つまり人工知能は、携帯電話で長い間使用されてきました。たとえば、最も一般的な音声アシスタントは...

...

AIと機械学習が建設業界にもたらす変化

建設業界は長い間、伝統的な手作業のプロセスで知られてきましたが、テクノロジーの進歩により急速に変化し...

AI、機械学習、ディープラーニングのつながりと違いを1つの記事で理解する

急速に変化する今日のテクノロジーの世界では、人工知能 (AI)、機械学習 (ML)、ディープラーニン...

Java と Python のアルゴリズムとデータ構造に関する面接の質問

Uber や Netflix などの企業でプログラミング、コーディング、ソフトウェア開発の職に応募す...

...

AI 主導のビジネス変革を通じてデジタル成熟を達成するにはどうすればよいでしょうか?

[[388979]]デジタル時代においては、情報の流れがあらゆるものの中心となります。すべてが感知...