AIによる顔変えの余波はまだ消えず、AIによる声変え電話詐欺劇が現実のものとなりました!ディープフェイク技術を使って作られた偽のテキストや動画を見分けるのは、今や本当に難しいと言わざるを得ません。最近、この現象は偽音声の分野にも広がっているようで、ある企業は最近の音声詐欺事件で20万ポンド(約24万3000米ドル)の損失を被った。 ウォール・ストリート・ジャーナル紙によると、3月にサイバー犯罪者はAIベースのソフトウェアを使ってドイツの親会社のCEOの声を真似し、その会社が所有する英国のエネルギー会社のマネージャーを騙して、詐欺師らが管理する銀行口座に24万3000ドルを振り込ませたという。
事件の経緯は次の通り。イギリスのエネルギー会社の上級役員が電話を受けた。電話の向こうの声は聞き覚えがあり、わずかにドイツなまりもあったため、役員はドイツの親会社の社長と話していると思った。相手はハンガリーのサプライヤーに一定額を送金するよう依頼し、非常に緊急な問題なので1時間以内に支払う必要があると告げた。また、資金はすぐに返済すると保証した。 担当者は電話の向こうから聞こえてきたのが上司の声だと確信し、依頼通りにハンガリーの供給業者に送金した。しかし、実際には送金は返金されなかっただけでなく、詐欺師はドイツ人の上司になりすまし、再度の緊急送金を要求した。 しかし、今回は、幹部は発信者の所在地がオーストリアであることに気づき、支払い要求を拒否し、事件の調査を開始した。 ウォール・ストリート・ジャーナルによると、英国人CEOがハンガリーの供給業者とされる企業に送金した資金は、最終的にメキシコやその他の地域に送金されたという。この事件は現在捜査中だが、このサイバー犯罪の犯人の身元はまだ明らかになっていない。 音声フィッシング(ビッシング)攻撃は目新しいものではないが、今回の事件はサイバー犯罪者がAIを使って音声詐欺攻撃を行った初の事例かもしれない。金融サービス会社オイラーヘルメスの詐欺専門家、リュディガー・キルシュ氏は、オイラーヘルメスは最終的に被害企業の請求額を全額負担したが、同保険会社はこれまでAI犯罪に関連する損失の回復を求める他の請求を扱ったことはなかったと述べた。 ESET のサイバーセキュリティ専門家、ジェイク・ムーア氏は、近い将来、機械学習を利用したサイバー犯罪が大幅に増加すると予測しています。すでに、有名人や公人になりすますためにディープフェイクがビデオ形式で使用されているのを目にしてきましたが、これらのリアルな映像を作成するには約 17 時間かかります。偽の声を作ることができれば、録音回数が少なくて済みます。コンピューティング能力が向上し続けるにつれて、これらを簡単に作成できるようになり始めており、将来は不安な状況になりそうです。 リスクを軽減するためには、模倣が可能になっていることを周知するだけでなく、譲渡前に検証技術を取り入れることも必要だ。 2 要素認証は、不正なアカウントに送金される資金を保護するためにセキュリティの層をさらに追加する、効果的で安価でシンプルなテクノロジーです。特に多額の送金を求められた場合は、必ず電話番号を確認し、折り返しの電話を依頼してください。通話履歴の「コールバック」オプションをクリックする代わりに、アドレス帳の番号を使用します。 コールセンター向けのセキュリティソフトウェアとプロトコルを開発する企業、ピンドロップは昨年発表した報告書で、主に銀行、信用組合、ファンド、保険会社、カード発行会社に影響する音声関連の詐欺事件が2013年から2017年の4年間で350%以上増加したことを明らかにした。 音声チャネル全体の詐欺も 2016 年から 2017 年にかけて 47% 増加しました。これは、638 件の詐欺通話のうち 1 件が合成詐欺であったことを意味します。 2017年、東フィンランド大学の研究者らによる研究では、さまざまな組織が生体認証の一形態として使用している音声認識システムは、なりすましに騙される可能性が非常に高いと警告された。 実際、AI を使って人の声を複製することは目新しいことではありません。昨年、百度は 4 秒以内に人の声を複製できる「Deep Voice」ソフトウェアを開発しました。この動きは、生体認証技術のセキュリティについても業界に懸念を引き起こしました。 さらに、Google が所有するカナダの企業 Lyrebird は、わずか 1 分間の音声で、ユーザーの声の特徴に非常によく似たデジタル音声を生成できます。 Google はまた、「話者検証からマルチスピーカー テキスト音声合成への転移学習」(SV2TTS) と題する論文も発表しました。この論文では、さまざまな話者の声で音声を生成できる、ニューラル ネットワーク ベースのテキスト音声合成 (TTS) システムについて説明しています。 SV2TTS は、数秒のオーディオから音声のデジタル表現を作成し、それを使用して新しい音声に一般化するようにトレーニングされたテキスト読み上げモデルを調整する 3 段階のディープラーニング フレームワークです。つまり、たった 5 秒の音声サンプルで人の声を複製できるのです。 したがって、AI ベースのツールの台頭には利点と欠点の両方があります。一方で、テクノロジーの探求と創造の余地を提供しますが、他方では、犯罪、欺瞞、詐欺の可能性も提供します。 |
<<: 5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド
>>: 人工知能はどこにでもありますが、計画とコーディングは始めましたか?
機械学習 (ML) や人工知能 (AI) と聞くと、多くの人はロボットやターミネーターを想像します。...
周知のとおり、OpenAI は GPT-4 以降、技術的な詳細を完全に秘密にしてきました。当初は、ベ...
Gartner の調査によると、約 37% の組織が何らかの形で AI を実装しています。しかし、E...
[[198103]] 1. オンライン機能システム主流のインターネット製品では、古典的な計算広告、検...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[439504]]人間の適応力は恐ろしいですね!目の見えない人は目で世界を見ることはできませんが、...
科学者たちは、人間が常に人型ロボットに対して不可解な恐怖を抱いているという不可解な現象を発見した。 ...
2020年、中国のスマート音声市場規模は113.96億元に達し、前年比19.2%増加した。中国のスマ...
ブロックバスター社の映画には毎年人工知能が満載されており、昨年も例外ではありませんでした。 『ブレー...