マイクロソフト、生成AIシステムのリスクを特定するためのPyRITをリリース

マイクロソフト、生成AIシステムのリスクを特定するためのPyRITをリリース

海外メディアの報道によると、マイクロソフトは2月26日、生成AIシステムのリスクを積極的に特定するためのオープンアクセス自動化フレームワーク「PyRIT」をリリースした。

マイクロソフトのAIレッドチームの責任者であるラム・シャンカール・シヴァ・クマール氏は、レッドチームのツールは「世界中のあらゆる組織が最新のAI技術を活用して責任を持って革新できるように」設計されていると語った。

同社によれば、PyRITは、捏造されたコンテンツ、虐待的コンテンツ、禁止されたコンテンツなど、さまざまな危害カテゴリーに対する大規模言語モデル(LLM)エンドポイントの堅牢性を評価するために使用できるという。また、マルウェア生成からジェイルブレイクまでのセキュリティ上の脅威や、個人情報の盗難などのプライバシーの脅威を特定するためにも使用できます。

PyRIT には、ターゲット、データセット、スコアリング エンジン、複数の攻撃戦略をサポートする機能の 5 つのインターフェイスがあり、中間入力と出力のやり取りを保存するための JSON またはデータベースの形式をとることができるメモリ コンポーネントが含まれています。

スコアリング エンジンには、対象の AI システムの出力をスコアリングするための 2 つの異なるオプションも用意されており、レッド チームは従来の機械学習分類器を使用したり、LLM エンドポイントを活用して自己評価を行ったりすることができます。

「目標は、研究者がモデルと推論パイプライン全体がさまざまな傷害カテゴリーでどのように機能するかのベースラインを持ち、そのベースラインをモデルの将来の反復と比較できるようにすることです」とマイクロソフトは述べています。

「これにより、モデルが現在どの程度うまく機能しているかに関する実証データを取得し、将来の改善に基づいてパフォーマンスの低下を検出できます。」言い換えれば、このツールは、AI システムを評価し、さらに調査する必要がある領域にフラグを立てるために使用できるプロンプトを生成することで、リスクの「ホットスポット」を強調するように設計されています。

さらに、マイクロソフトは、レッドチームの生成 AI システムは、セキュリティと責任ある AI のリスクの両方を検出する必要があり、これはより確率的な作業であると認める一方で、生成 AI アーキテクチャの大きな違いも指摘しています。

<<:  ガートナー:世界の AI PC と生成 AI スマートフォンの出荷台数は 2024 年に 2 億 9,500 万台に達すると予測

>>:  IBM CEOがパートナーに「一緒にAIで大儲けしましょう」

ブログ    
ブログ    

推薦する

Alibaba Cloud がバッチおよびストリーム機械学習プラットフォーム Alink をオープンソース化し、アルゴリズム開発のハードルを下げる

11月28日、アリババクラウドは、世界初の統合バッチ・ストリームアルゴリズムプラットフォームでもある...

...

未来のサイバー攻撃の原型: ChatGPT の 7 つの「邪悪な双子」

あらゆる技術革新と同様に、生成 AI ツールにも暗い側面があり、人命を害するために悪用される可能性も...

マイクロソフト、OpenAI、グーグルなどの大手企業が共同でフロンティアモデルフォーラムを設立し、責任ある人工知能の開発を推進している。

人工知能の発展は日々変化しており、特に生成型人工知能はテクノロジー業界で話題になっています。しかし、...

人工知能が再び大学入試に挑戦:AIはエッセイの書き手と比べて何点取れるのか?

今年も大学入試の季節がやってきました。現在、大学入試は受験生にとっての一大イベントであるだけでなく、...

トイレに座ってアルゴリズムを読む: わずか5行のフロイドの最短経路アルゴリズム

[[110550]]夏休みの間、シャオ・ヘンはいくつかの都市を旅行する予定です。下の図に示すように、...

人工知能の主要技術:強化学習(RL)

人工知能技術はますます急速に進歩しており、それぞれのサブテクノロジーが生み出す価値もますます顕著にな...

ホライゾン・ロボティクス、中国初のオープンで使いやすいソフトウェアとハ​​ードウェアの統合ロボット開発プラットフォームを発表

2022年6月14日、エッジ人工知能コンピューティングプラットフォームの世界的リーダーであるHori...

...

ディープラーニングアルゴリズムの全貌:その正しさを理論的に証明する

論文アドレス: https://arxiv.org/abs/1705.07038この論文では、ディー...

...

インテリジェントオートメーションが現代の職場に与える影響

インテリジェントオートメーションは現代の職場をさまざまな形で変えていますCOVID-19パンデミック...

2021 年の人工知能、データ サイエンス、機械学習のトレンドの概要

人工知能とデータサイエンス、機械学習のトレンドとデータ分析AIはますますあらゆるビジネス戦略の一部に...

人工知能は、大規模なビデオ操作における CDN ハードディスクの障害をどのように予測するのでしょうか?

現在の大規模なビデオ運用および保守プロセスでは、CDN の故障したハード ドライブの交換が大きな問題...

...