AI技術のダークサイド:犯罪者と人工知能の関係

AI技術のダークサイド:犯罪者と人工知能の関係

[[248661]]

ビッグデータダイジェスト制作

編集者: DonFJ、Jiang Baoshang

機械学習は、誰もが使いたいと思っている、または現在使用しているテクノロジーです。

しかし、それを使えるのは良い人だけだとお考えですか? 若すぎるし、単純すぎるのです!

次に、AI テクノロジーのダークサイド、つまり犯罪者と人工知能の邪悪な関係を明らかにします。

コンピューティング サイエンスがまだ十分に開発されておらず、ヒューリスティックな問題を解決できなかったときには、多くのセキュリティ問題はルールを使用して解決されていましたが、これらのルールは「死んで」いました。

当時は、コンピューターがパスワードを解読したり、認証コードを読み取ったり、道路交通のパターンを理解したりできるとは誰も思っていませんでした。しかし現在、人工知能は急速に発展しており、時代遅れのルールベースのセキュリティシステムは、AIによって数秒で簡単に破壊される可能性があります。

検証コードとAIの切っても切れない関係

インターネットを閲覧するときに最も面倒なのは、常に入力を求められる確認コードです。これは、あなたが本物の人間であり、悪意を持ってアクセスしているプログラムではないことをコンピューターが確認する方法です。

これは、私たち人間のユーザーがマウスとキーボードを使用して Web サイトやリソースにアクセスする操作を、プログラムを使用してコンピューターで実行できるためです。

たとえば、Facebook にログインするときに間違ったパスワードを 3 回続けて入力すると、Web サイトは必ず確認コードをポップアップ表示し、あなたが本物の人間であり、悪意のあるブルート フォース パスワード クラッキング プログラムではないことを確認します (もちろん、最初に思い浮かぶのは、はしごが蹴られたということです)。 Facebook や他の多くの企業のサーバーではこのセキュリティ対策が採用されており、このセキュリティ対策では検証コードが使用されます。たとえば、一般的な検証コードは次のようになります。

長年にわたり、CAPTCHA は悪意のある攻撃コードと人間のユーザーを区別するのに効果的でした。しかし、今はスマート AI の時代が到来しており、認証コードは簡単に通過できる質問になっているようです。

CNN(畳み込みニューラルネットワーク)は、大量の検証コード学習データセットを与えることができれば、検証コードを解読するための非常にシンプルな技術です。各検証コードには、テキストの認識やオブジェクトの識別など、特定の目的があります。

しかし、これらの質問はCNNの前では無意味だろう。上記は、あまり専門用語を使わない簡単な例です。単純なニューラルネットワークの原理を知っていれば理解できます。

検証コードの保護が無効になったため、ブルートフォースクラッキングの脅威はさらに恐ろしいものになっています。たくさんの写真からバスや道路標識を見つけるような、もっと難しい認証コードを見たことがあると言うかもしれません(YouTube をたくさん訪れたことがあるはずです!)。しかし、実際には、それらは AI にとって難しいことではありません。Google はオブジェクト検出を検索エンジンの基本機能としてのみ使用していますが、Google のオブジェクト検出がいかに優れているかについて聞いたことがあるはずです。

GANとパスワード

注: GAN = Generative Adversarial Networks、発音: dry! 翻訳すると、adversarial generative network になります。

私たちは通常、特に奇妙なパスワードを設定することはありません。結局のところ、次のようなパスワードを目にすることはまれです: 5f2#V0”P?oz3 (ほぼ外れ値)。

当社のパスワードのほとんどは、kronebourg1664 のような名前と、覚えやすく入力しやすい大文字または小文字の数字で構成されています。

もちろん、パスワードを次のように設定する大胆な人もいます: password (これは間違いなく頻繁に盗まれます)。

最初のパスワードを推測することに関しては、人間の脳にとっても GTX 1080 GPU にとっても、それは難しすぎます。(GTX 1080 は NVIDIA の GPU で、ゲームをプレイするだけでなく、今ではディープラーニング プロジェクトを実行するために使用する人が増えています)。

しかし、他のパスワードは比較的簡単です。では、これらのパスワードをどうやって推測するのでしょうか? 最も簡単な方法は、分厚い辞書を調べて、各単語をパスワードとして試してみることです。この場合、「password」を使用した子供のパスワードも推測できます。

何ですか?本当に「password」をパスワードに使っているんですか?君の英語はなかなか良いね。ピンインの「mima」をパスワードにしてみては?早くもっと信頼できるものに変更しましょう...

さあ、ハイテクを活用して AI を使ってパスワードを推測してみましょう。 AI は辞書を調べることができると思いますか? もちろんできません。ニューラル ネットワークは独自に大量のパスワード候補を生成します。この一連の候補を使用して、パスワードを解読します。すごいですね? PassGAN の記事を読んでください。次の図は、これらの候補がどのように生成されるかを説明しています。

PassGAN: パスワード推測のためのディープラーニングアプローチのarxivリンクは次のとおりです。

https://arxiv.org/abs/1709.00440

ニューラル ネットワークに精通している場合でも、この論文はそれほど簡単には思えないかもしれません。 これは単に入力から結果を予測するものではありません。まずデータからデータの特性を学習し、次にジェネレーターが同様の特性を持つサンプルをいくつか生成できるようにする特別なネットワーク構造です。

専門的には、Generative Adversarial Network(Generative Adversarial Network、一般的にはGANと略されます。GANを提唱したのは、ディープラーニングに関する素晴らしい本を書いた偉大な作家Goodfellowです)と呼ばれています。 GAN は、ジェネレーターとチェッカーの 2 つのニューラル ネットワークで構成されています。

チェッカーは入力データが妥当かどうかを検証するために使用され、ジェネレーターは生成されたデータがチェッカーの検査に合格できるように自身を進化させるために使用されます。

翻訳者注: ここにはリンクがありますが、ポータルで「ニューラルネットワーク」というキーワードを検索した結果に過ぎず、意味がないので省略してもいいと思います...。あと、GANの元の説明は退屈すぎて他の人には理解されないのではないかと心配だったので使用しませんでした。そのため、自分の理解に基づいて書きました。翻訳がうまくない場合は、この文を翻訳するために私に連絡してください。

PassGAN を使用するには、不明なソース (JD.com、Baidu、Tencent から漏洩した可能性あり) からの実際のパスワード データセットが必要です。このデータセットから、人々が実際に使用するデータセットがどのようなものであるかを少なくとも大まかに把握することができます。通常は、大文字、日付、ランダムな数字、名前などです。

次に、ノイズ ジェネレーターを使用して乱数を生成する必要があります。ノイズ ジェネレーターとパスワード データセットは、ニューラル ネットワーク モデルの入力になります。

ネットワークの出力はバイナリ分類値です。つまり、教師ありトレーニング中に、ネットワーク モデルにパスワードが本物か偽物かが伝えられます。

ニューラル ネットワークの各フォワード パス中に、ネットワークの出力が実際のラベル値と比較され、エラー値が返されてネットワークの重みが反復的に変更されます。ネットワーク モデルが変化すると、ノイズに基づいてジェネレーターによって生成された結果が実際のパスワードに近づくため、モデルのトレーニングに応じてジェネレーターも成長します。

ジェネレーターがトレーニングされた後、ノイズを入力すると、ネットワークは非常に現実的なパスワードを出力します。したがって、PassGAN を数時間実行するだけで、大量のパスワード候補が得られます。

AIとフィッシング

[[248663]]

フィッシングは非常に一般的なハッキング手法です。銀行、China Mobile、China Unicom、Weibo からのメールを装った、少し奇妙に見えるメールを受け取ったことがあるはずです。次に、感染する可能性のある Web ページに移動するリンクが電子メールに記載されます。

このようなフィッシングメールを作りたい場合、Facebook や他の大企業のメールスタイルと言語を真似するだけで済みます。次に、ソフトウェアを更新する必要があると表示されたり、クリックして何か驚くようなことがないか確認したり、ログイン情報を入力するように求められたりします。

単純で、粗野で、古風。あなたが書いたものはすべて犯罪者のサーバーに送信されます。それはさておき、AIはどのようにして釣りに関わるようになったのでしょうか?

機械学習にはクローラーと呼ばれる強力なツールがあり、対象のウェブサイトからさまざまな情報をクロールすることでフィッシングの手法を向上させることができます。クローラーによって保存されたデータを通じて、ハッカーはこれらのウェブサイトの外観やテキストの書き方を学習し、大量の偽の電子メールを作成して大規模に送信することができます。しかし、メールをどこに送ればよいかわからないのも問題です。そのため、賢いハッカーは、前述の GAN テクノロジーを使用して電子メール アドレスを推測することもできるため、騙される可能性が高くなります。

現在使用している電子メールにはフィッシング対策のセキュリティ対策が施されており、非常に安全だと言う方もいるかもしれません。しかし悲劇なのは、機械学習がフィッシングチェックを通過できるフィッシングメールを生成する方法を知っていることです。

トレーニング セットは次のようになります。一連の電子メールのうち、一部はフィッシング対策によってブロックされ、一部は正常に送信できます。次に、これに基づいてニューラル ネットワーク モデルをトレーニングし、フィッシング アルゴリズムがそれを検出する方法を理解できます。近い将来、フィッシングメールがフィッシング対策網をすり抜けてしまう可能性があります。

詳細については、この DeepPhish の論文をクリックしてください。

https://albahnsen.com/wp-content/uploads/2018/05/deepphish-simulating-malicious-ai_submitted.pdf

えーと、要約させてください。

幸いなことに、現在 AI によって克服されているセキュリティ領域は 3 つだけです。残念なことに、詐欺的な広告など、AI ハッカーの脅威に直面するシナリオは依然として数多く存在します。しかし、私は、AI を合法的に利用することによるメリットは、犯罪者が AI を悪用することによる害よりもはるかに大きいと信じています。

皮肉なことに、街頭パトロールからオンライン詐欺まで、犯罪解決に人工知能が使われている例は数多くあります。最後にまとめます。

1. パスワードが GAN に推測される可能性があると思われる場合は、すぐにパスワードを変更してください。たとえば、wenzhaizhenshuai は良いパスワードです (誰も 文摘菌帅 を考えないので、GAN はこの情報を学習できません)。

2. メールの送信者が安全であると確信できる場合を除き、知らない人から送信されたリンクをクリックしないでください。

3. AIを悪用しないでください。

関連レポート:

https://medium.com/predict/a-technical-look-at-how-criminals-use-ai-4080f2e325a9

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」からのオリジナル記事です]

この著者の他の記事を読むにはここをクリックしてください

<<:  4つの主要な機械学習プログラミング言語の比較: R、Python、MATLAB、Octave

>>:  機械学習の12の経験則

ブログ    
ブログ    
ブログ    

推薦する

IoTとAIがコロナウイルスの流行中に企業の事業再開をどのように可能にしているか

[[333668]]数か月に及ぶ極度の不確実性、経済の閉鎖、孤立の後、ようやくゆっくりと経済が機能し...

Googleが検索エンジンアルゴリズムを調整:HTTPSサイトのランキングが上昇

[[117728]] Googleは公式ブログで、検索エンジンのアルゴリズムを調整し、HTTPS暗号...

...

スマートホームデバイスにおける自然言語生成の応用

スマートホームデバイスへの自然言語生成 (NLG) の統合により、テクノロジーとのやり取りの方法に革...

フォーブス誌の2020年のAIに関するトップ10予測: 人工知能はますます「疎外」されつつある!

人工知能 (AI) は間違いなく 2010 年代のテクノロジーのテーマであり、新しい 10 年が始ま...

...

...

...

ナレッジグラフを使用して RAG 機能を改善し、大規模モデルの幻覚を軽減する

幻覚は、大規模言語モデル (LLM) を使用するときによく発生する問題です。 LLM は流暢で一貫性...

Interspeech 2023 | Volcano Engine ストリーミングオーディオテクノロジー: 音声強化と AI オーディオコーディング

背景マルチデバイス、マルチパーソン、マルチノイズなどのさまざまな複雑なオーディオおよびビデオ通信シナ...

偏見と不平等にノーと言いましょう!マイクロソフト、物議を醸していた顔認識サービスの提供を停止

マイクロソフトは、動画や画像に基づいて感情を識別するサービスを含む、人工知能を活用した顔認識ツールの...

...

シェフとAIが協力してあなたの味覚を刺激します

[[394881]]ソニーのAIチームによると、FlavorGraphは人工知能技術を使って2つの材...

01 コーヒーとsocket.ioで実装されたナップサックアルゴリズム

まず、なぜこれを書くのかお話しします。プログラマーになるのは本当に大変です。長い年月を経ても、レンガ...

Googleは、自社のBardを含むチャットボットの使用には注意するよう従業員に警告している。

ロイター通信は6月19日、事情に詳しい4人の関係者の話として、グーグルの親会社アルファベットはチャッ...