AIによる改ざんサイバー攻撃が迫る

AIによる顔変えの余波はまだ消えず、AIによる声変え電話詐欺劇が現実のものとなりました！ディープフェイク技術を使って作られた偽のテキストや動画を見分けるのは、今や本当に難しいと言わざるを得ません。最近、この現象は偽音声の分野にも広がっているようで、ある企業は最近の音声詐欺事件で20万ポンド（約24万3000米ドル）の損失を被った。

ウォール・ストリート・ジャーナル紙によると、3月にサイバー犯罪者はAIベースのソフトウェアを使ってドイツの親会社のCEOの声を真似し、その会社が所有する英国のエネルギー会社のマネージャーを騙して、詐欺師らが管理する銀行口座に24万3000ドルを振り込ませたという。

[[276033]]

事件の経緯は次の通り。イギリスのエネルギー会社の上級役員が電話を受けた。電話の向こうの声は聞き覚えがあり、わずかにドイツなまりもあったため、役員はドイツの親会社の社長と話していると思った。相手はハンガリーのサプライヤーに一定額を送金するよう依頼し、非常に緊急な問題なので1時間以内に支払う必要があると告げた。また、資金はすぐに返済すると保証した。

担当者は電話の向こうから聞こえてきたのが上司の声だと確信し、依頼通りにハンガリーの供給業者に送金した。しかし、実際には送金は返金されなかっただけでなく、詐欺師はドイツ人の上司になりすまし、再度の緊急送金を要求した。

しかし、今回は、幹部は発信者の所在地がオーストリアであることに気づき、支払い要求を拒否し、事件の調査を開始した。

ウォール・ストリート・ジャーナルによると、英国人CEOがハンガリーの供給業者とされる企業に送金した資金は、最終的にメキシコやその他の地域に送金されたという。この事件は現在捜査中だが、このサイバー犯罪の犯人の身元はまだ明らかになっていない。

音声フィッシング（ビッシング）攻撃は目新しいものではないが、今回の事件はサイバー犯罪者がAIを使って音声詐欺攻撃を行った初の事例かもしれない。金融サービス会社オイラーヘルメスの詐欺専門家、リュディガー・キルシュ氏は、オイラーヘルメスは最終的に被害企業の請求額を全額負担したが、同保険会社はこれまでAI犯罪に関連する損失の回復を求める他の請求を扱ったことはなかったと述べた。

ESET のサイバーセキュリティ専門家、ジェイク・ムーア氏は、近い将来、機械学習を利用したサイバー犯罪が大幅に増加すると予測しています。すでに、有名人や公人になりすますためにディープフェイクがビデオ形式で使用されているのを目にしてきましたが、これらのリアルな映像を作成するには約 17 時間かかります。偽の声を作ることができれば、録音回数が少なくて済みます。コンピューティング能力が向上し続けるにつれて、これらを簡単に作成できるようになり始めており、将来は不安な状況になりそうです。

リスクを軽減するためには、模倣が可能になっていることを周知するだけでなく、譲渡前に検証技術を取り入れることも必要だ。 2 要素認証は、不正なアカウントに送金される資金を保護するためにセキュリティの層をさらに追加する、効果的で安価でシンプルなテクノロジーです。特に多額の送金を求められた場合は、必ず電話番号を確認し、折り返しの電話を依頼してください。通話履歴の「コールバック」オプションをクリックする代わりに、アドレス帳の番号を使用します。

コールセンター向けのセキュリティソフトウェアとプロトコルを開発する企業、ピンドロップは昨年発表した報告書で、主に銀行、信用組合、ファンド、保険会社、カード発行会社に影響する音声関連の詐欺事件が2013年から2017年の4年間で350%以上増加したことを明らかにした。

音声チャネル全体の詐欺も 2016 年から 2017 年にかけて 47% 増加しました。これは、638 件の詐欺通話のうち 1 件が合成詐欺であったことを意味します。

2017年、東フィンランド大学の研究者らによる研究では、さまざまな組織が生体認証の一形態として使用している音声認識システムは、なりすましに騙される可能性が非常に高いと警告された。

実際、AI を使って人の声を複製することは目新しいことではありません。昨年、百度は 4 秒以内に人の声を複製できる「Deep Voice」ソフトウェアを開発しました。この動きは、生体認証技術のセキュリティについても業界に懸念を引き起こしました。

さらに、Google が所有するカナダの企業 Lyrebird は、わずか 1 分間の音声で、ユーザーの声の特徴に非常によく似たデジタル音声を生成できます。

Google はまた、「話者検証からマルチスピーカーテキスト音声合成への転移学習」(SV2TTS) と題する論文も発表しました。この論文では、さまざまな話者の声で音声を生成できる、ニューラルネットワークベースのテキスト音声合成 (TTS) システムについて説明しています。

SV2TTS は、数秒のオーディオから音声のデジタル表現を作成し、それを使用して新しい音声に一般化するようにトレーニングされたテキスト読み上げモデルを調整する 3 段階のディープラーニングフレームワークです。つまり、たった 5 秒の音声サンプルで人の声を複製できるのです。

したがって、AI ベースのツールの台頭には利点と欠点の両方があります。一方で、テクノロジーの探求と創造の余地を提供しますが、他方では、犯罪、欺瞞、詐欺の可能性も提供します。

<<: 5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド

>>: 人工知能はどこにでもありますが、計画とコーディングは始めましたか?

ブログ

大連理工大学は、小規模サンプル認識にDeepBDCを提案し、6つのベンチマークで最高のパフォーマンスを達成した。

ブログ

AIによる改ざんサイバー攻撃が迫る

大連理工大学は、小規模サンプル認識にDeepBDCを提案し、6つのベンチマークで最高のパフォーマンスを達成した。

中山大学、AIGCの大規模応用を促進するためにソース拡散モデル統合コードフレームワークを公開

解読: ボストンダイナミクスがアルゴリズムを使用してアトラスロボットの感覚世界を構築する方法

興味深いアルゴリズムを知っていますか?

Python 機械学習チュートリアル

推薦する

空から地上へ、そしてついに無人機が海へ

作業効率を大幅に向上できるAIツール

IDC: 2024年までにIoTシステムの約20%が人工知能をサポートすると予想

人工知能がリスク管理分野に参入すると、生身の人間は職を失うことになるのでしょうか？

人工知能時代の機械の未来

単語の順序はGPT-4の読解力には影響しないが、他の大規模モデルでは影響しない。

AIを活用してデジタル資産管理ワークフローを効率化する方法

LLaMA のコアオリジナルクリエイターのほとんどが辞職し、Meta AI の内部事情が暴露されました!計算能力をめぐる争いが勃発し、大規模モデルチームのメンバーは3度も入れ替わった

メタヘッドセットが舌トラッキング機能を追加、ネットユーザー衝撃「理由は聞かないし、知りたくもない」