AIによる改ざんサイバー攻撃が迫る

AIによる顔変えの余波はまだ消えず、AIによる声変え電話詐欺劇が現実のものとなりました！ディープフェイク技術を使って作られた偽のテキストや動画を見分けるのは、今や本当に難しいと言わざるを得ません。最近、この現象は偽音声の分野にも広がっているようで、ある企業は最近の音声詐欺事件で20万ポンド（約24万3000米ドル）の損失を被った。

ウォール・ストリート・ジャーナル紙によると、3月にサイバー犯罪者はAIベースのソフトウェアを使ってドイツの親会社のCEOの声を真似し、その会社が所有する英国のエネルギー会社のマネージャーを騙して、詐欺師らが管理する銀行口座に24万3000ドルを振り込ませたという。

[[276033]]

事件の経緯は次の通り。イギリスのエネルギー会社の上級役員が電話を受けた。電話の向こうの声は聞き覚えがあり、わずかにドイツなまりもあったため、役員はドイツの親会社の社長と話していると思った。相手はハンガリーのサプライヤーに一定額を送金するよう依頼し、非常に緊急な問題なので1時間以内に支払う必要があると告げた。また、資金はすぐに返済すると保証した。

担当者は電話の向こうから聞こえてきたのが上司の声だと確信し、依頼通りにハンガリーの供給業者に送金した。しかし、実際には送金は返金されなかっただけでなく、詐欺師はドイツ人の上司になりすまし、再度の緊急送金を要求した。

しかし、今回は、幹部は発信者の所在地がオーストリアであることに気づき、支払い要求を拒否し、事件の調査を開始した。

ウォール・ストリート・ジャーナルによると、英国人CEOがハンガリーの供給業者とされる企業に送金した資金は、最終的にメキシコやその他の地域に送金されたという。この事件は現在捜査中だが、このサイバー犯罪の犯人の身元はまだ明らかになっていない。

音声フィッシング（ビッシング）攻撃は目新しいものではないが、今回の事件はサイバー犯罪者がAIを使って音声詐欺攻撃を行った初の事例かもしれない。金融サービス会社オイラーヘルメスの詐欺専門家、リュディガー・キルシュ氏は、オイラーヘルメスは最終的に被害企業の請求額を全額負担したが、同保険会社はこれまでAI犯罪に関連する損失の回復を求める他の請求を扱ったことはなかったと述べた。

ESET のサイバーセキュリティ専門家、ジェイク・ムーア氏は、近い将来、機械学習を利用したサイバー犯罪が大幅に増加すると予測しています。すでに、有名人や公人になりすますためにディープフェイクがビデオ形式で使用されているのを目にしてきましたが、これらのリアルな映像を作成するには約 17 時間かかります。偽の声を作ることができれば、録音回数が少なくて済みます。コンピューティング能力が向上し続けるにつれて、これらを簡単に作成できるようになり始めており、将来は不安な状況になりそうです。

リスクを軽減するためには、模倣が可能になっていることを周知するだけでなく、譲渡前に検証技術を取り入れることも必要だ。 2 要素認証は、不正なアカウントに送金される資金を保護するためにセキュリティの層をさらに追加する、効果的で安価でシンプルなテクノロジーです。特に多額の送金を求められた場合は、必ず電話番号を確認し、折り返しの電話を依頼してください。通話履歴の「コールバック」オプションをクリックする代わりに、アドレス帳の番号を使用します。

コールセンター向けのセキュリティソフトウェアとプロトコルを開発する企業、ピンドロップは昨年発表した報告書で、主に銀行、信用組合、ファンド、保険会社、カード発行会社に影響する音声関連の詐欺事件が2013年から2017年の4年間で350%以上増加したことを明らかにした。

音声チャネル全体の詐欺も 2016 年から 2017 年にかけて 47% 増加しました。これは、638 件の詐欺通話のうち 1 件が合成詐欺であったことを意味します。

2017年、東フィンランド大学の研究者らによる研究では、さまざまな組織が生体認証の一形態として使用している音声認識システムは、なりすましに騙される可能性が非常に高いと警告された。

実際、AI を使って人の声を複製することは目新しいことではありません。昨年、百度は 4 秒以内に人の声を複製できる「Deep Voice」ソフトウェアを開発しました。この動きは、生体認証技術のセキュリティについても業界に懸念を引き起こしました。

さらに、Google が所有するカナダの企業 Lyrebird は、わずか 1 分間の音声で、ユーザーの声の特徴に非常によく似たデジタル音声を生成できます。

Google はまた、「話者検証からマルチスピーカーテキスト音声合成への転移学習」(SV2TTS) と題する論文も発表しました。この論文では、さまざまな話者の声で音声を生成できる、ニューラルネットワークベースのテキスト音声合成 (TTS) システムについて説明しています。

SV2TTS は、数秒のオーディオから音声のデジタル表現を作成し、それを使用して新しい音声に一般化するようにトレーニングされたテキスト読み上げモデルを調整する 3 段階のディープラーニングフレームワークです。つまり、たった 5 秒の音声サンプルで人の声を複製できるのです。

したがって、AI ベースのツールの台頭には利点と欠点の両方があります。一方で、テクノロジーの探求と創造の余地を提供しますが、他方では、犯罪、欺瞞、詐欺の可能性も提供します。

<<: 5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド

>>: 人工知能はどこにでもありますが、計画とコーディングは始めましたか?

AIによる改ざんサイバー攻撃が迫る

ChatGPT でより良いコードを書く方法

人工知能時代の未来の人材をどう育成するか？専門家や名門校の校長はこう言う

最強モデル育成チップH200発売！ 141Gの大容量メモリ、AI推論が最大90％向上、H100にも対応

海外メディアが最初にソラをテストしたが、ビデオはひどい失敗だった？彼らは物理学/動物の変化/非常に遅いことを理解していませんが、スタートアップはすでに衰退しています。

人工知能がフィットネス業界にもたらすイノベーション：AIパーソナルトレーナーの登場

GitHub ホットリストのトップ: オープンソースの GPT-4 コードインタープリター、任意の Python ライブラリをインストールでき、ローカルターミナルで実行可能

ディープマインド主任科学者：私は機械知能よりも人間の知能が引き起こす災害を心配している

ピュー研究所の報告：2025年までにAIのせいで7500万人が解雇される

推薦する

プログラマーに必要ないくつかの一般的なソートおよび検索アルゴリズムの概要

世界の通信業界の専門家が2024年を予測

5G技術と人工知能のインテリジェントな組み合わせ

超低消費電力センサーソリューションがスマートビルディングを実現する方法

映画に騙されないでください。人工知能はどうやって人間を殺すのでしょうか?

あなたのデータ戦略は GenAI に対応していますか?

チップ大手がCESで新年の幕開けを飾る戦いを繰り広げる！ AMD、インテル、NVIDIA、クアルコムの衝撃的な対決

未来のスマートシティ: 必須のテクノロジー 10 選

ディープラーニングを専門家以外の人に説明するにはどうすればよいでしょうか?

中国の人工知能都市競争で最も速いのはどの都市でしょうか？

Meta の「Split Everything AI」よりも多用途です。 HKUSTの画像セグメンテーションAIが登場: より強力な粒度とセマンティック機能を実現

アリババ副社長でDAMOアカデミーの自動運転部門責任者の王剛氏が辞任し、自身のビジネスを立ち上げる予定