データ汚染:次の大きな脅威

データ汚染:次の大きな脅威

人工知能 (AI) と機械学習 (ML) を使用したセキュリティ ソフトウェアを標的としたデータ ポイズニングは、次の大きなサイバー セキュリティ リスクとなる可能性があります。 SANS Technology Instituteの研究ディレクターであるヨハネス・ウルリッヒ氏は、RSA 2021の基調講演で、これは誰もが懸念すべき脅威であると述べました。

「機械学習における最も根本的な脅威の1つは、攻撃者がモデルのトレーニングに使用するサンプルに実際に影響を与えることができることだ」とウルリッヒ氏はRSAで語った。

この新たな脅威が急速に出現する中、防御者はデータ汚染攻撃の検出方法と防止方法を学ぶ必要があります。そうしないと、ビジネスやサイバーセキュリティに関する決定が誤ったデータに基づいて行われることになります。

データポイズニングとは何ですか?

攻撃者が AI モデルのトレーニングに使用されるデータを改ざんすると、そのデータは事実上「汚染」されます。 AI は正確な予測を行う方法を学習するためにこのデータに依存するため、アルゴリズムによって生成される予測は不正確になります。

脅威アクターは現在、サイバー攻撃に使用できる方法でデータを処理しています。たとえば、レコメンデーション エンジンのデータを変更することで、さまざまなことが可能になります。そこから、マルウェア アプリケーションをダウンロードさせたり、感染したリンクをクリックさせたりすることができます。

データ汚染は、人工知能を私たちに対して使用するため、非常に危険です。私たちは、私生活や仕事の多くの側面について AI の予測をますます信頼するようになっています。視聴する映画の選択から、サービスを解約する可能性が高い顧客を知らせることまで、あらゆることを行います。

COVID-19の影響でデジタルトランスフォーメーションが加速し、AIがより普及するようになりました。デジタル取引と接続は例外ではなく標準です。

データ汚染とサイバーセキュリティツール

脅威の攻撃者は、データ ポイズニングを使用して、防御側が脅威を検出するために使用するツールに侵入することもあります。まず、データを変更したり、データを追加したりして、誤った分類を作成する可能性があります。さらに、攻撃者はデータポイズニングを利用してバックドアを作成します。

AI ツールに対するデータ汚染攻撃が増加していることは、企業や機関がこれらのツールの導入を躊躇する可能性があることを意味します。また、防御側がどのデータを信頼すべきかを判断することがより困難になります。

基調講演の中で、ウルリッヒ氏は、解決策はAIサイバーセキュリティツールで使用されるモデルを包括的に理解することから始まると述べた。何がデータを保護しているかを理解していないと、これらのテクノロジーとツールが正確かどうかを判断するのは困難です。

データポイズニング攻撃の特定

データ汚染攻撃を検出するのは困難で時間がかかります。そのため、被害者は問題に気付いたときには、すでに被害が甚大になっていることに気づくことが多いのです。

さらに、どのデータが本物で、どのデータが操作されたのか全く分かりません。データ ポイズニング攻撃は通常、内部で行われ、非常にゆっくりとしたペースで進行します。どちらの場合も、データの変更を見逃しやすくなります。

RSA カンファレンスのセッション「回避、ポイズニング、抽出、推論: 防御と評価のためのツール」で、IBM リサーチの Abigail Goldsteen 氏は、サイバーセキュリティの専門家が Adversarial Robustness 360 Toolbox (ART) を使用してデータ ポイズニング攻撃を識別、ブロック、防止することを推奨しました。このオープンソース ツールキットを使用すると、開発者は機械学習モデルを迅速に作成、分析、攻撃し、適切な防御方法を迅速に選択できます。

私たちが持っているツールを使って

では、AI を使うべきではないでしょうか? 現時点では、AI を完全に放棄するのは非現実的です。そうすると、脅威の主体は AI と ML を単純に使用して、防御できない攻撃を作成することになります。

逆に、防御側として、私たちが持っているツールやデータを盲目的に信頼することはできません。アルゴリズムの仕組みをより深く理解し、データ内の異常を定期的にチェックすることで、攻撃に先手を打つことができます。

<<:  学者がインテリジェンス、モデルとデータAI、デジタルトランスフォーメーションについて語る。このAIイベントには技術的な内容が含まれている。

>>:  NLP がヘルスケアにおける AI の価値を実現する方法

ブログ    

推薦する

...

[インフォグラフィック] Google アルゴリズムの大幅な改善記録

Google 検索アルゴリズムは、歴史上最も先進的な数学工学アプリケーションです。毎日数十億件の検索...

米国商務省は、生成型人工知能の潜在的なリスクに対処するために、公開AIワーキンググループを設立した。

6月25日、ジーナ・ライモンド米国商務長官は、国立標準技術研究所(NIST)が人工知能(AI)に関...

検索拡張生成による AI 幻覚問題の解決

ラフル・プラダン出典| https://www.infoworld.com/article/3708...

人工知能: インダストリー4.0の原動力

製造業における AI に関する誇大宣伝の多くは産業オートメーションに焦点を当てていますが、これはスマ...

...

...

データ分析とAIのミスが原因の注目度の高い事件9件

2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...

IDCは、米国の人工知能への支出が2025年までに倍増すると予測している

米国のAIへの支出は2025年までに1,200億ドルに増加するだろう。 2021年から2025年の予...

AIに置き換えられる最後のグループも失業するだろう

[[262639]]これまで、データラベラーは常に「AI に置き換えられる最初のグループ」と呼ばれて...

我が国の独自開発OS micROSがリリースされました!このロボットの「心と脳」は単純ではない

9月10日、2019年世界コンピューター会議が湖南省で開催されました。中国科学院院士の楊学軍氏は、我...

...

エッジ人工知能とは?エッジ人工知能の実装方法

エッジ AI はエッジ人工知能の略称です。IoT システムの次の開発フロンティアです。では、エッジ人...

...

大規模な商用利用が間近に迫り、自動運転には明るい未来がある

自動運転は現在、自動車産業の主要な発展方向の一つとなり、社会全体が注目する技術テーマとなっています。...