AIによって書かれたコードは「手書きのコード」よりもはるかに安全性が低い

AIによって書かれたコードは「手書きのコード」よりもはるかに安全性が低い

Github Copilot のような人工知能コードアシスタントは、開発者の開発効率と生産性を大幅に向上させ、開発の技術的ハードルを下げることができます (言語や概念に精通していないプログラマーの参入)。しかし、経験の浅い開発者は AI アシスタントの出力を安易に信頼してしまい、セキュリティ上の脆弱性が生じるリスクがあります。

最近、スタンフォード大学の研究により、人工知能アシスタントを使用して書かれたコードは「手動でコード化された」コードよりもはるかに安全性が低いことが判明しました。また、人工知能ツールは、ユーザーがコードのセキュリティについて過信する原因にもなります。

また、調査では、AIアシスタントが出力するコードは「正確性」を満たしていることが多いものの、パスワードが持つべきセキュリティ特性を理解することはほとんどなく、場合によってはユーザーをうっかり混乱させるコードを作成することもあることが判明した。

この調査では、47 人の参加者が 3 つの異なるプログラミング言語 (Python、JavaScript、C) を使用して 5 つのセキュリティ関連のプログラミング タスクを実行する包括的なユーザー調査プロジェクトを設計しました。 3 つの中心的な研究質問は次のとおりです。

  • AI プログラミング アシスタントを使用すると、ユーザーは安全でないコードをより多く記述するのでしょうか?
  • ユーザーは AI アシスタントが安全なコードを書くことを信頼していますか?
  • AI アシスタントと対話する際のユーザーの言語と動作は、そのコードのセキュリティ脆弱性のレベルにどのように影響しますか?

複数の国の開発者が調査に参加しましたが、その大部分は次の 3 か国から来ています。

  • アメリカ 57%
  • 中国 15%
  • インド 13%

調査の主な結果は次のとおりです。

AIコードは5つのテストで一般的に人間のコードよりもパフォーマンスが悪い

5 種類のセキュリティ エラー テストすべて (以下を参照) において、AI アシスタントは手動コーディングよりも多くのコーディング エラーを起こし、AI アシスタントを使用する開発者の 67% が正しい解決策を提供したのに対し、「手動コーディング」コントロール グループでは 79% でした。これは、AI 支援開発への依存がセキュリティ上のミスの増加につながる可能性があることを示唆しています。

AI実験グループ(青)と手動制御グループ(黄)の5つのテストにおけるコードセキュリティエラーの割合

たとえば、SQL インジェクション脆弱性テストでは、AI アシスタントを使用した参加者は、安全性が大幅に低いソリューションを提供しました (36% 対 50%)。 AI アシスタントを使用した参加者の 36% が SQL インジェクション攻撃に対して脆弱なソリューションを作成しましたが、AI アシスタントを使用しなかったコントロール グループではわずか 7% でした。

開発者が最もよく使うプロンプトワード

開発者は通常、さまざまな戦略を使用して AI アシスタントにプロンプ​​トを出すことを選択します。開発者の 64% は直接タスク指定を試みます。開発者の 21% は AI アシスタントに関数宣言の指示を提供することを選択します (「関数を記述してください...」など)。開発者の 49% はプログラミング言語を指定します。開発者の 61% は以前のモデルによって生成されたプロンプト ワードを使用してコード アシスタントにプロンプ​​トを出します (これにより、モデルによって提供される脆弱性が強化される可能性があります)。開発者の 53% は特定の API 呼び出しに特定のライブラリを指定します。Python 開発者が関数宣言を提供することはより一般的ですが、参加者は SQL および C の質問に対してプログラミング言語を指定する可能性が高くなります。

修正提案

1. プロンプトワードを最適化します。調査では、AI を使用する開発者ユーザーの間で、言語とプロンプト パラメータの選択に大きな違いがあることがわかりました。将来のシステムでは、全体的なパフォーマンスを最適化するために、ユーザーのヒントをシステムへの入力として使用する前に、ユーザーのヒントの改善(タイプミスの修正、設計者が実装しやすいセキュリティに関する言語の組み込みなど)を検討することをお勧めします。

別のアプローチとしては、機械学習ベースの方法を検討して、ユーザープロンプトの意図(またはタスクによって生成される可能性のある特定のクラスのセキュリティ問題)を予測し、プロンプトを変更して既知の脆弱性や AI 出力から保護することが考えられます。

2. AIの主体性を減らす。安全でないコードを提供する開発者が AI アシスタントの出力を積極的に変更したり、パラメータを調整したりする可能性は低いため、AI アシスタントに過度の権限 (自動パラメータ選択など) を与えるべきではありません。そうしないと、セキュリティの脆弱性に対するユーザーの警戒が弱まる可能性があります。 AI コード アシスタントが一般的になるにつれて、これらは検討すべき重要なソリューションになります。たとえば、GitHub Copilot と統合された VS Code などの IDE では、AI アシスタントが提案したライブラリに基づいて、デフォルトの動作を調整して、ライブラリのドキュメントや使用上の警告をリアルタイムで明確に表示できます。

3. トレーニングデータを精製します。多くの AI プログラミング アシスタントは、モデルのトレーニングに GitHub 上のセキュリティ保護されていないコードを使用します。開発者は、これらの入力 (オープンソース コード) に対して静的分析ツールを実行し、トレーニングにはセキュリティ チェックに合格した入力 (コード) のみを使用し、ライブラリ ドキュメントと「エキスパート」コード例を使用してトレーニング前にデータセット全体の重み付けを再調整するよりスマートな方法を設計する必要があります。これにより、データのセキュリティが大幅に向上します。

結論は

AI アシスタントを使用してコードを作成する開発者は、ほとんどのプログラミング タスクでセキュリティ上の脆弱性を導入する可能性が高くなります。さらに、AI アシスタントに問い合わせる際に使用するクエリワードが具体的であればあるほど (ヘルプ機能の提供やパラメータの調整など)、生成されるコードはより安全になります。


<<:  AIが労働力に与える影響について考えられる3つのシナリオ

>>:  清華大学系のスタートアップが、実際のシーンからアニメーションへのワンクリック変換、パーソナライズされたキャラクターも生成できる世界初の4Dスケルトンアニメーションフレームワークを発表

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

爆発力で動く昆虫ロボットは、自重の22倍を運ぶことができ、垂直に59cmジャンプできる。

この小さなロボットはエネルギーに溢れています。体は昆虫ほどの大きさですが、自分の体重の22倍の重さの...

マスクの後ろに隠れて沈黙しないでください。AIはあなたが誰であるかを知っています

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ビッグデータと機械学習を駆使して12星座の素顔を明らかにする!

[[201919]] 「なぜ論文が出版されないのでしょうか?私は研究に向いていないのでしょうか?」...

早く見て! 2022年の建設業界の7つの大きな発展トレンド!

建設業界の市場競争はますます激しくなっています。建設会社は生き残りと発展のために大きなプレッシャーに...

Huggingfaceの機械学習科学者が、ホットなラマ2を特集する分析記事を執筆

Meta は無料の商用バージョンである Llama 2 をリリースし、ネットワーク全体を席巻しました...

人工知能による影の検出と除去、反射に基づく影の検出と除去方法を実現

AI による影の検出と除去、反射ベースの影の検出と除去方法に向けて、概要: 影は画像によく見られる要...

Baidu PaddlePaddle EasyDL リテール版シェルフステッチングサービスのアーキテクチャとアルゴリズムの詳細な説明

日用消費財業界の商品識別需要シナリオでは、日用消費財ブランドの営業担当者は、販売のために端末店舗を訪...

GPT-4Vを試した後、マイクロソフトは166ページに及ぶ評価レポートを作成した。業界関係者:上級ユーザー必読

1週間前、ChatGPTはメジャーアップデートを受けました。GPT-4とGPT-3.5の両モデルは、...

Google が Mirasol をリリース: 30 億のパラメータで、マルチモーダル理解を長時間動画にまで拡張

11月16日、Googleは、動画に関する質問に答えたり、新たな記録を樹立したりできる小型人工知能モ...

すべてのトップオブジェクト検出アルゴリズムを統合: FAIRオープンソースDetectron

昨日、Facebook AI Research (FAIR) は、業界で最も先進的な物体検出プラット...

銀行の二重生体認証実験:二重のトラブルか二重のセキュリティか?

2つの生体認証技術は顔認証と指紋認証です。実験では、両方ともモバイルデバイスを通じて実装され、2つ...

...

人間と機械のインターフェースは一貫性があり、音声と触覚によるフィードバックを提供する必要がある。

[[187855]]仮想環境を体験し、対話する機能は、仮想現実 (VR) メディアの独自の機能です...

従来の連合学習が異種混在の課題に直面したときは、これらのパーソナライズされた連合学習アルゴリズムを試してみてください。

この記事では、パーソナライズされた連合学習に関する 3 つの記事を厳選して詳細に分析します。従来の機...

2020年にAIアルゴリズム市場は普及するでしょうか?

2019年も残り1か月余りとなり、各種年間総括も迫ってまいりました。今年の AI の発展を振り返る...