とても怖い！最初のAIはすでに詐欺行為を行っている

[[250441]]

この記事はGeek View (ID: geekview) の許可を得て転載しています。

[[250442]]

アメリカの古典的な詐欺映画「オーシャンズ11」シリーズ

WeChatが国民的ソーシャルソフトウェアになって以来、さまざまな詐欺師の主な戦場も、当初の電話やテキストメッセージ詐欺から産業アップグレードへと移行し、モバイルインターネット時代への突入に成功しました。

結局のところ、知人同士の交流のためのソーシャルツールとして、WeChatを通じて信頼を得るコストは他の方法よりもはるかに低く、「秦の始皇帝がお金を送る」時代は終わりました。

詐欺師たちは、若い男性を狙った「お茶詐欺」など、WeChatをベースにした多くの詐欺手法を開発してきました。

WeChatは、知り合い同士のソーシャルネットワーキングソフトウェアになる前の初期の頃に大流行しました。基本的な流れは、武夷山の茶屋の所有者の孫娘が、祖父が重病で親戚が茶屋を欲しがっていることに絶望し、「シェイク」や「近くの人」を通じて「選ばれた人」の被害者を見つけ、最終的には被害者を段階的に興奮させて、お茶を買うためにお金を費やさせ、茶屋の所有権を守らせたというものでした。

メディアの報道により、このような詐欺は徐々に効果を失っていった。しかし、詐欺師たちはまだ新しい手口を考え出している。最近、メディアはより新しい詐欺を明らかにした。最近、趙さんは父親から音声メッセージを受け取った。その中で父親は食料品を買うお金を持ってこなかったと言い、趙さんに200元を振り込むように頼んだ。

趙さんは「お父さん、あなたですか？」と尋ねると、すぐに音声による返事が返ってきた。趙さんは父親のなまりを聞いてお金を振り込んだが、それでも騙された。

もう一人の被害者は滄州市の王さんだ。王さんはクラスメートからWeChatメッセージで送金を手伝ってほしいと頼まれ、促す音声メッセージを送った。彼女はその声が同級生の声だとわかり、親切にも500元を送金したが、やはり騙された。

この詐欺の主な理由は、WeChat アカウントのハッキングです。現在のバージョンの WeChat では音声メッセージを転送できませんが、詐欺師は音声ファイルを抽出したり、「WeChat の拡張バージョン」(通常は xposed フレームワークに基づくプラグイン) をインストールしたりすることで、音声メッセージを転送する効果を得ることができます。

この詐欺はそれほど技術的ではありませんが、より注意深く詐欺師に直接電話するだけで、簡単に詐欺師を打ち負かすことができます。

この「WeChatの強化版」はプラグインに相当する

しかし、詐欺師たちは、お互いの面子を保つという中国の社会ルールを巧みに利用しました。友人や親戚が電話で100元を借りるよう頼んできた場合、ケチな印象を与えてしまうため、直接電話をかけて質問することは通常考えられません。

また、相手の声がある以上、当然人々はそれ以上調べようとはしませんから、このような詐欺が成功するのも不思議ではありません。

[[250443]]

諺にもあるように、悪魔は常に聖人より強い。電話をかけるだけで詐欺師を倒せると本当に思っていますか?

現在の技術では、アルゴリズムを通じて人間の発話一式を生成できるようになっています。怒りや喜びといった感情のさまざまなトーンさえも、本物と区別がつかないほど鮮明に再現できます。必要なのは、生成する人物のほんの数文だけです。

この技術は、2016年にカナダのモントリオール大学に設立されたGoogleの人工知能研究所（MILA）によって開発された。

MILAは、音響合成技術をベースに、2017年4月にLyrebirdを設立しました。コトドリはコトドリと呼ばれる鳥の一種で、他の多くの鳥の鳴き声を真似できるだけでなく、聞いたほとんどすべての音を真似できるという特別な才能を持つ鳥です。

自分だけの音声アバターを作成

同社のウェブサイトのデモセクションでは、本物そっくりのトランプ大統領とオバマ大統領の公式合成音声を聞くことができる。米国では、電話で家族と話す際に機械合成した文章を使って実験した記者もいたが、母親はまったく違いがわからなかったという。

このような非常にリアルな合成音を生成できるのは、その背後にある技術がニューラルネットワークと機械学習だからです。

ニューラルネットワークは、人間の脳内のニューロン間の電気信号の伝達をシミュレートし、入力データを処理します。

階層化されたニューロンを使用して、大量のサンプルデータから共通の特徴を要約します。自然な人間の音声を生成する最初のニューラルネットワークは、DeepMind の WaveNet でした。はい、AlphaGo を開発した会社です。

具体的な原理はやや複雑なので、ここでは詳しくは触れませんが、簡単に言うと、WaveNet は PS の痕跡が明らかな機械音声を、より流暢で自然な音声に変換し、機械音声と人間の声の差を大幅に減らすことができます。現在、ゴーストビデオ業界で盛んに利用されています。

Lyrebird はさらに一歩進んで、音色、ピッチ、音節、休止などの複数の特徴に基づいて人の声を定義し、よりリアルな声を生成することができます。

[[250445]]

詐欺師は、嫌がらせの電話の録音を通じてあなたの声を抽出し、それを Lyrebird で生成して、上で述べた信頼性を確認するための電話をかけるというプロセスを完了することができます。

声が信頼できないなら、頼れるのは顔だけです。詐欺師の口頭による詐欺の WeChat メッセージを受け取った場合は、すぐにビデオ通話を行ってください。そうすれば、詐欺師はパニックに陥るはずです。

[[250446]]

実際、声だけでなく、少し前にRedditで話題になった有名人の顔を変える「大人向け短編映画」のように、AIを通じて顔さえも偽造できるようになりました。

ネット上でdeepfakesという名前を持つプログラマーは、空き時間に自宅のパソコンとオープンソースのAIツールfakeappを使い、機械学習アルゴリズムを通じてワンダーウーマンのヒロイン、ガル・ガドットの顔を成人女優の顔に移植することに成功した。

ディープフェイクによるこの動きは大きな騒動を引き起こしました。Fakeappの使用敷居は極めて低いため、PythonやTensorflowなどのプログラミング言語やオープンソースのソフトウェアライブラリをインストールすることなく実行できます。高性能なグラフィックカードさえも必要ありません。GoogleのクラウドGPUをレンタルするだけで完全に行えます。

一時期、欧米の有名女優による短編映画がコミュニティ全体に溢れ、Redditは緊急禁止措置を講じ、ベテランプレイヤーの一団は逃亡した。

顔を変える原理

アダルト映画よりもさらに恐ろしいのはフェイクニュースだ。今年4月、誰かがFakeappを使って偽の動画を作成したが、その動画ではバラク・オバマ前米大統領がカメラに向かって「トランプ大統領は完全な馬鹿だ」と衝撃的な発言をしている。

これは米国で瞬く間に大騒ぎとなった。この綿密に準備されたジョークで、誰もが恐ろしい事実に気づいた。我々は、敵がいつでも誰でも何でも言ったかのように見せかけることができる時代に入ったのだ。

Fakeapp と Lyrebird は、顔と声という 2 つの主な識別ポイントに基づいて、本物そっくりの素材を作成できる技術の組み合わせです。これら 2 つの技術にはまだ多くの問題がありますが、機械学習のサポートにより、ますます強力になっていることがわかります。

Fakeappはすでにバージョン2.2です

これら 2 つのテクノロジーを開発した当初の目的は、悪事を働くためではありませんでした。Lyrebird の創設者は、彼らのテクノロジーが発話に困難を抱える人々の助けとなることを望んでいると述べています。公式 API インターフェースを通じて、彼らはこれまで機械が作り出していた音声ではなく、よりリアルな音声を作り出すことができます。

Deepfakes氏はまた、 「どんな技術も悪意を持って使われる可能性があり、このようなことは禁止できない。誰もが機械学習の研究に参加するのは悪いことではないと思う」と述べた。この男の車は電光石火の速さでスタートしたが、これはむしろプログラマーの腕前を披露したものだと見ることができる。

この技術がうまく活用されれば、後の段階では映画やテレビ業界にとって大きな恩恵となるでしょう。例えば、スタン・リーのカメオ出演は今後も続くでしょう。

[[250447]]

ポール・ウォーカーは『ワイルド・スピード SKY MISSION』のいくつかのシーンで関連技術を使用した

ディープフェイクの発言は、Qvodの創設者である王欣が法廷で述べた「テクノロジーに罪はない」という言葉を彷彿とさせる。王欣は刑務所から釈放された今、ブロックチェーンに没頭している。

[[250448]]

おそらく何年も経ってから、王欣も、状況が緊迫しても「勇敢な」男であり続けると決心した午後のことを思い出すだろう。

メッセージを残してギフトをゲット

プログラマーとして、AI技術の長所と短所についてお話しいただけますか？下の QR コードをスキャンして、51CTO Technology Stack 公式アカウントをフォローしてください。ディスカッションのために、Technology Stack WeChat パブリックアカウントにメッセージを残してください。編集者は最も価値のあるコメント3件を選び、それぞれ50元、30元、20元の紅包報酬を贈呈します。この活動は11月30日12:00に終了します。

<<: 自動車業界における人工知能の5つの主要な応用

>>: 「今日の簡単な歴史」：今後 15 年間でほとんどの人が失業することになるのでしょうか?