マイクロソフト、生成AIシステムのリスクを特定するためのPyRITをリリース

マイクロソフト、生成AIシステムのリスクを特定するためのPyRITをリリース

海外メディアの報道によると、マイクロソフトは2月26日、生成AIシステムのリスクを積極的に特定するためのオープンアクセス自動化フレームワーク「PyRIT」をリリースした。

マイクロソフトのAIレッドチームの責任者であるラム・シャンカール・シヴァ・クマール氏は、レッドチームのツールは「世界中のあらゆる組織が最新のAI技術を活用して責任を持って革新できるように」設計されていると語った。

同社によれば、PyRITは、捏造されたコンテンツ、虐待的コンテンツ、禁止されたコンテンツなど、さまざまな危害カテゴリーに対する大規模言語モデル(LLM)エンドポイントの堅牢性を評価するために使用できるという。また、マルウェア生成からジェイルブレイクまでのセキュリティ上の脅威や、個人情報の盗難などのプライバシーの脅威を特定するためにも使用できます。

PyRIT には、ターゲット、データセット、スコアリング エンジン、複数の攻撃戦略をサポートする機能の 5 つのインターフェイスがあり、中間入力と出力のやり取りを保存するための JSON またはデータベースの形式をとることができるメモリ コンポーネントが含まれています。

スコアリング エンジンには、対象の AI システムの出力をスコアリングするための 2 つの異なるオプションも用意されており、レッド チームは従来の機械学習分類器を使用したり、LLM エンドポイントを活用して自己評価を行ったりすることができます。

「目標は、研究者がモデルと推論パイプライン全体がさまざまな傷害カテゴリーでどのように機能するかのベースラインを持ち、そのベースラインをモデルの将来の反復と比較できるようにすることです」とマイクロソフトは述べています。

「これにより、モデルが現在どの程度うまく機能しているかに関する実証データを取得し、将来の改善に基づいてパフォーマンスの低下を検出できます。」言い換えれば、このツールは、AI システムを評価し、さらに調査する必要がある領域にフラグを立てるために使用できるプロンプトを生成することで、リスクの「ホットスポット」を強調するように設計されています。

さらに、マイクロソフトは、レッドチームの生成 AI システムは、セキュリティと責任ある AI のリスクの両方を検出する必要があり、これはより確率的な作業であると認める一方で、生成 AI アーキテクチャの大きな違いも指摘しています。

<<:  ガートナー:世界の AI PC と生成 AI スマートフォンの出荷台数は 2024 年に 2 億 9,500 万台に達すると予測

>>:  IBM CEOがパートナーに「一緒にAIで大儲けしましょう」

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

普通のプログラマーがAIを活用する方法

[[187452]]現在、人工知能はますます人気が高まっている分野となっています。普通のプログラマー...

交通分野における人工知能、ビッグデータ、その他の技術の応用に関する簡単な議論

人工知能、ビッグデータ、モノのインターネット、クラウドコンピューティングなどの技術の台頭と発展に伴い...

...

Σco Time | AIセキュリティ、インテリジェンスの新時代における双方にメリット

[原文は51CTO.comより]先日、#Σcotimebetween#ライブブロードキャストプラット...

人工知能を活用して顧客サービス体験を向上させる 5 つの方法

人々がデジタルの世界に移行するにつれて、組織と顧客の関係はここ数年で変化してきました。顧客の期待はか...

...

安全なパスワード保存の業界標準: bcrypt アルゴリズム

パスワードを安全に保護するための標準アルゴリズムである bcrypt アルゴリズムについて説明します...

[Dry Goods] グラフニューラルネットワークの学習リソーストップ10の共有

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

我が国は人工知能などの主要な技術標準に関する研究を強化します

標準は経済活動や社会の発展を技術的に支えるものであり、人々の生活に深く関わっています。最近、中国共産...

組み込みおよびベクターデータベースの実践ガイド

翻訳者 |ブガッティレビュー | Chonglouこの革命の中心にあるのは、ベクター データベースの...

テレンス・タオが新プロジェクトを立ち上げ:リーンで素数定理を証明、研究計画は完成

「アレックス・コントロヴィッチと私が率いる新しいリーン形式化プロジェクトが正式に発表されました。この...

ディープラーニングモデルを本番環境に簡単に導入

[51CTO.com クイック翻訳] データから学習し、パターンを識別し、人間の介入を最小限に抑えて...

...

BAIRは、3種類のモデルフリー強化学習アルゴリズムを組み合わせたRLコードライブラリrlpytをオープンソース化しました。

最近、BAIR は強化学習研究コードライブラリ rlpyt をオープンソース化しました。このライブラ...