AIによる顔変えの余波はまだ消えず、AIによる声変え電話詐欺劇が現実のものとなりました!ディープフェイク技術を使って作られた偽のテキストや動画を見分けるのは、今や本当に難しいと言わざるを得ません。最近、この現象は偽音声の分野にも広がっているようで、ある企業は最近の音声詐欺事件で20万ポンド(約24万3000米ドル)の損失を被った。 ウォール・ストリート・ジャーナル紙によると、3月にサイバー犯罪者はAIベースのソフトウェアを使ってドイツの親会社のCEOの声を真似し、その会社が所有する英国のエネルギー会社のマネージャーを騙して、詐欺師らが管理する銀行口座に24万3000ドルを振り込ませたという。
事件の経緯は次の通り。イギリスのエネルギー会社の上級役員が電話を受けた。電話の向こうの声は聞き覚えがあり、わずかにドイツなまりもあったため、役員はドイツの親会社の社長と話していると思った。相手はハンガリーのサプライヤーに一定額を送金するよう依頼し、非常に緊急な問題なので1時間以内に支払う必要があると告げた。また、資金はすぐに返済すると保証した。 担当者は電話の向こうから聞こえてきたのが上司の声だと確信し、依頼通りにハンガリーの供給業者に送金した。しかし、実際には送金は返金されなかっただけでなく、詐欺師はドイツ人の上司になりすまし、再度の緊急送金を要求した。 しかし、今回は、幹部は発信者の所在地がオーストリアであることに気づき、支払い要求を拒否し、事件の調査を開始した。 ウォール・ストリート・ジャーナルによると、英国人CEOがハンガリーの供給業者とされる企業に送金した資金は、最終的にメキシコやその他の地域に送金されたという。この事件は現在捜査中だが、このサイバー犯罪の犯人の身元はまだ明らかになっていない。 音声フィッシング(ビッシング)攻撃は目新しいものではないが、今回の事件はサイバー犯罪者がAIを使って音声詐欺攻撃を行った初の事例かもしれない。金融サービス会社オイラーヘルメスの詐欺専門家、リュディガー・キルシュ氏は、オイラーヘルメスは最終的に被害企業の請求額を全額負担したが、同保険会社はこれまでAI犯罪に関連する損失の回復を求める他の請求を扱ったことはなかったと述べた。 ESET のサイバーセキュリティ専門家、ジェイク・ムーア氏は、近い将来、機械学習を利用したサイバー犯罪が大幅に増加すると予測しています。すでに、有名人や公人になりすますためにディープフェイクがビデオ形式で使用されているのを目にしてきましたが、これらのリアルな映像を作成するには約 17 時間かかります。偽の声を作ることができれば、録音回数が少なくて済みます。コンピューティング能力が向上し続けるにつれて、これらを簡単に作成できるようになり始めており、将来は不安な状況になりそうです。 リスクを軽減するためには、模倣が可能になっていることを周知するだけでなく、譲渡前に検証技術を取り入れることも必要だ。 2 要素認証は、不正なアカウントに送金される資金を保護するためにセキュリティの層をさらに追加する、効果的で安価でシンプルなテクノロジーです。特に多額の送金を求められた場合は、必ず電話番号を確認し、折り返しの電話を依頼してください。通話履歴の「コールバック」オプションをクリックする代わりに、アドレス帳の番号を使用します。 コールセンター向けのセキュリティソフトウェアとプロトコルを開発する企業、ピンドロップは昨年発表した報告書で、主に銀行、信用組合、ファンド、保険会社、カード発行会社に影響する音声関連の詐欺事件が2013年から2017年の4年間で350%以上増加したことを明らかにした。 音声チャネル全体の詐欺も 2016 年から 2017 年にかけて 47% 増加しました。これは、638 件の詐欺通話のうち 1 件が合成詐欺であったことを意味します。 2017年、東フィンランド大学の研究者らによる研究では、さまざまな組織が生体認証の一形態として使用している音声認識システムは、なりすましに騙される可能性が非常に高いと警告された。 実際、AI を使って人の声を複製することは目新しいことではありません。昨年、百度は 4 秒以内に人の声を複製できる「Deep Voice」ソフトウェアを開発しました。この動きは、生体認証技術のセキュリティについても業界に懸念を引き起こしました。 さらに、Google が所有するカナダの企業 Lyrebird は、わずか 1 分間の音声で、ユーザーの声の特徴に非常によく似たデジタル音声を生成できます。 Google はまた、「話者検証からマルチスピーカー テキスト音声合成への転移学習」(SV2TTS) と題する論文も発表しました。この論文では、さまざまな話者の声で音声を生成できる、ニューラル ネットワーク ベースのテキスト音声合成 (TTS) システムについて説明しています。 SV2TTS は、数秒のオーディオから音声のデジタル表現を作成し、それを使用して新しい音声に一般化するようにトレーニングされたテキスト読み上げモデルを調整する 3 段階のディープラーニング フレームワークです。つまり、たった 5 秒の音声サンプルで人の声を複製できるのです。 したがって、AI ベースのツールの台頭には利点と欠点の両方があります。一方で、テクノロジーの探求と創造の余地を提供しますが、他方では、犯罪、欺瞞、詐欺の可能性も提供します。 |
<<: 5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド
>>: 人工知能はどこにでもありますが、計画とコーディングは始めましたか?
2008 年の金融危機後、都市計画とサービス提供に対する新しいアプローチが世界中で定着し始めました。...
AI スタートアップのアイデアは、わずか 2 か月の作業で商品化できるのでしょうか?今年のイノベーシ...
映画では必ず蘇生のシーンが出てきますが、現実の世界でも人間を冷凍保存するプロジェクトがあります。その...
Microsoft は、Meta との AI パートナーシップをさらに拡大し、Meta が AI ...
わずか5年で、人工知能は急速に発展しました。最近、GPT-3が再び白熱した議論を巻き起こしています。...
海洋ゴミは世界的な問題となっている。たとえすべてのデータを収集できたとしても、海洋問題の専門家である...
インテリジェント化は将来の自動車発展の基本的な方向であり、自動運転技術は将来の自動車発展の重要な最先...
医療画像解析に機械学習 (ML) を実装することは新しいことではありません。放射線科医は、自動化ツー...
2020年という「長い」年が、あっという間に終わりを迎えようとしています。この時期を振り返ると、長い...
速報です!海外メディアは、OpenAIのCEOサム・アルトマン氏が、元Appleのチーフデザイナーの...
朝のラッシュアワーには交通量が多く、午後は非常に空いています。しかし、なぜ信号が変わる頻度は同じまま...
すべての RSA 暗号化システムでは、強力な暗号化キーまたは類似のキーを作成するために、ユーザーが予...
シナリオの観点から、音声認識はストリーミング音声認識と非ストリーミング音声認識に分けられます。非スト...