MITチームの新しいテストはAIの推論と人間の思考を比較する

MITチームの新しいテストはAIの推論と人間の思考を比較する

AI が洞察を導き出し、意思決定を行う方法は謎に包まれていることが多く、機械学習の信頼性について懸念が生じています。現在、新たな研究で、研究者らは、人工知能ソフトウェアの推論が人間の推論とどの程度一致しているかを比較し、その動作を迅速に分析するための新たな方法を明らかにした。

機械学習が現実世界でますます使用されるようになるにつれて、機械学習がどのように結論に達するのか、そしてそれが正しいかどうかを理解することが重要になります。たとえば、AI プログラムは皮膚病変が癌であると正確に予測しているように見えるかもしれませんが、臨床画像のコンテキストでは無関係な特徴に焦点を当てて予測している可能性があります。

「機械学習モデルは理解するのが非常に難しいことで有名です」と、MITのコンピューターサイエンス研究者で、AIの信頼性に関する新しい研究の主執筆者であるアンジー・ボガスト氏は言う。「モデルが何を決定したかを知るのは簡単ですが、モデルがなぜその決定を下したかを知るのは難しいのです。」

文献リンク: http://shared-interest.csail.mit.edu/

AI の推論を理解するための一般的な戦略は、プログラムが決定を下すために焦点を当てるデータ (画像や文章など) の特徴を調べることです。ただし、このようないわゆる顕著性手法では、通常、一度に 1 つの決定に対する洞察しか生成できず、各決定を手動で検査する必要があります。 AI ソフトウェアは通常、何百万ものデータ インスタンスを使用してトレーニングされるため、人間が十分な決定を分析して正しい動作または間違った動作のパターンを識別することはほぼ不可能です。

「機械学習モデルを調査および理解するためのツールを人間のユーザーに提供することは、機械学習モデルを現実世界に安全に展開するために不可欠です。」—アンジー・ボガスト

現在、MITとIBMリサーチの科学者たちは、AIの決定に対する説明を収集して調査する方法を考案し、AIの行動を迅速に分析できるようにした。 「Shared Interest」と呼ばれるこの新しい技術は、AI の決定の顕著性分析を人間が注釈を付けたデータベースと比較します。

たとえば、画像認識プログラムは写真を犬の写真として分類し、顕著性アプローチでは、プログラムが決定を下すために犬の頭と体のピクセルを強調表示したことを示す場合があります。対照的に、共通の関心に基づくアプローチでは、これらの顕著性手法の結果を、写真のどの部分が犬の一部であるかを人々が注釈付けした画像のデータベースと比較する可能性があります。

これらの比較に基づいて、共通関心アプローチでは、AI の決定と人間の推論の一貫性を計算し、8 ​​つのパターンのいずれかに分類する必要があります。一方では、プログラムが正しい予測を行い、人間と同じようにデータ内の同じ特徴を強調することで、AI が完全に人間のようなものであることが示されるかもしれません。一方、AIは完全に気を散らされ、誤った予測を行い、人間が強調した特徴を何も強調しませんでした。

AI の決定が陥る可能性のあるその他のパタ​​ーンは、機械学習モデルがデータの詳細を正しくまたは誤って解釈する方法を強調します。たとえば、共通の関心によって、AI は人間のように車両全体を識別するのではなく、タイヤなどトラクターの一部分だけに基づいて画像内のトラクターを正しく識別できることや、写真にスノーモービルが写っている場合にのみ AI が画像内のスノーモービルのヘルメットを識別できることが発見されるかもしれません。

実験では、共通の関心事は AI プログラムがどのように機能し、信頼できるかどうかを明らかにするのに役立ちます。たとえば、Shared Interest は、皮膚科医が皮膚病変の写真から癌の診断に関するプログラムの正しい予測と誤った予測の例をすぐに確認するのに役立ちます。結局、皮膚科医は、実際の病変ではなく無関係な詳細に基づいて予測をしすぎたため、プログラムを信頼できないと判断しました。

別の実験では、機械学習の研究者が Shared Interest を使用して、BeerAdvocate データセットに適用した顕著性手法をテストし、従来の手動の方法に必要な時間のほんの一部で、何千もの正しい決定と間違った決定を分析することができました。共通の関心は、顕著性手法が一般的にうまく機能することを示すのに役立ちますが、レビュー内の特定の単語を過大評価して誤った予測につながるなど、これまで知られていなかった欠陥も明らかにします。

「機械学習モデルを調査および理解するためのツールを人間のユーザーに提供することは、機械学習モデルを現実世界で安全に展開するために重要です」とボガスト氏は述べた。

研究者らは、共通の関心は彼らが採用する顕著性手法と同じくらいしか役に立たないと警告している。 Boggust 氏は、それぞれの顕著性手法には独自の制限があり、Shared Interest はこれらの制限を継承していると指摘しています。

将来、科学者たちは、医療記録で使用される表形式のデータなど、より多くの種類のデータに共通の関心を適用したいと考えています。ボガスト氏は、もう一つの潜在的な研究分野として、AIの結果の不確実性を自動的に推定する可能性があると付け加えた。

科学者たちは共通の利益のためにソースコードを公開した。

ソースコード: https://github.com/mitvis/shared-interest

関連レポート: https://spectrum.ieee.org/-2657216063

<<:  建設技術におけるAIは潜在性があるが、まだ現実にはなっていない

>>:  周志華:「データ、アルゴリズム、計算力」は人工知能の3つの要素であり、今後は「知識」が加わる必要があります。

ブログ    

推薦する

...

...

...

教師あり学習、教師なし学習、半教師あり学習、強化学習の 4 つのディープラーニング手法を 1 つの記事で理解する

一般的に、ディープラーニング ネットワークをトレーニングする方法には、教師あり学習、教師なし学習、半...

リザーブプールコンピューティングにおける新たなブレークスルー:ニューロン数が少なくなり、コンピューティング速度が最大100万倍に高速化

複雑なシステムを予測するには、より多くのニューロンを使用する必要がありますか?ネイチャー・コミュニケ...

アマゾンとファーウェイの機械学習面接を経験すると、試験官はこれらの答えを聞きたがっていることが判明

[[245589]]ジョージ・セイフ氏はこれまで、主にデータサイエンスや機械学習関連の職種を対象に、...

シンガポール国立大学と清華大学は、決定木向けに特別に設計され、高速かつ安全な新しい連合学習システムを共同で提案した。

フェデレーテッド ラーニングは機械学習において非常に注目されている分野であり、複数の当事者がデータを...

マスク氏はSpaceXの有能なインターンを称賛した。彼は放課後にAIを使ってElder Scrollsを解読し、Nature誌の表紙を飾った。

ネイチャーの公式サイトのトップページには、世界に衝撃を与えた最新の考古学的発見が掲載された。 200...

マトリックスシミュレーション! Transformer の大型モデルの 3D 視覚化。GPT-3 と Nano-GPT の各層がはっきりと見える

「マトリックスシミュレーション」の世界は本当に存在するかもしれない。人間のニューロンをシミュレートし...

27,303件のホットなコメントを調べた結果、なぜ「紅炎火水」は未だに世間から嘲笑されているのか?

AI開発者会議でスピーチをしている最中に、ロビン・リーは見知らぬ人から頭に水の入ったボトルをかけら...

AIとIoT:共生関係

Transforma Insights では、2020 年の大半を、最も優れた詳細な IoT 予測の...

...

...

欧州のAI法案がまもなく導入され、世界の技術規制に影響を及ぼす可能性がある

AI法案は、AIの開発方法、企業がAIを使ってできること、要件に従わなかった場合の法的結果など、A...