ブラックボックス問題が依然としてディープラーニングの普及を妨げている

ブラックボックス問題が依然としてディープラーニングの普及を妨げている

[[211063]]

現在、ディープラーニングは人工知能の旗印を掲げており、将来、インテリジェントマシンが何ができるようになるかを垣間見ることができます。しかし、ディープラーニングには大きな問題があります。それがどのように機能するか誰も知らないのです。

私たちがディープラーニングについてすべてを知っているわけではないのです。今日のニューラル ネットワークの中核をなす機械学習アルゴリズムは、数十年にわたって開発されており、明確に定義され、文書化されています。銀行や保険などの規制が厳しい業界では、これらのアルゴリズムは大きな問題を引き起こすことなく長年にわたって使用されてきました。

「機械学習は基本的に線形数学であり、説明するのは非常に簡単です」と、データ企業テラデータの最高技術責任者、スティーブン・ブロブスト氏はテラデータ・パートナー・カンファレンスのパネルディスカッションで語った。 「しかし、多層ニューラルネットワークになると、問題は非線形数学になります。異なる変数間の関係が複雑になります。」

ニューラル ネットワークの明瞭性の問題は、本質的に複雑な基本アーキテクチャに起因しています。多くの隠し層を積み重ねることで、ネットワークをトレーニングするときにデータが通過するパスがほぼ無限に作成されます。次に、これらのパスにデータを何度も通し、各サイクルでマシンに変数の重みを決定させることで、従来の機械学習方法よりも優れた回答を提供するより優れたマシンを構築できることが分かりました。

これは人間の脳の粗い描写です。まだその仕組みが完全には理解されていないため、「粗い」という点に重点が置かれています。しかし、人間の脳が機能することはわかっていますし、ニューラル ネットワークがどのように機能するかは完全には理解していなくても、それが機能することはわかっています。ある意味では、ニューラル ネットワークの不透明性はバグではなく機能です。

複雑さは、ディープラーニングを機能させる秘密のソースです。

これも大きな研究分野です。金融サービスなどの業界はニューラルネットワークに熱心に取り組んでいますが、その仕組みを規制当局に適切に説明できないため、現在は使用がブロックされています。 「これは、リスク評価など規制が厳しい分野で機械学習を導入する上で大きな障壁となっている」とブロブスト氏は述べた。 「詐欺検出と推奨エンジンだけなら、それで済むかもしれません。しかし、規制が厳しい分野ではそうはいきません。」

これは、DataRobot がそれらの使用の自動化に役立つにもかかわらず、これらの分野の DataRobot の顧客が Tensorflow などのディープラーニング フレームワークを敬遠するのに十分な理由です。 「こうしたモデルは検証できないために却下されることもあります」と、DataRobot の CIO である Chris Devaney 氏は言います。 「防御するのは簡単ではありません。たとえブラックボックスでなくても、ニューラルネットワークアルゴリズムの奥深くで起こっていることをすべて記録することはできないため、ブラックボックスのように動作します。」

TensorFlow は大規模なデータセットに対して高速な予測を行うことができますが、DataRobot の顧客はそれを使用することを躊躇しています。 DataRobot は現在、Immuta と協力して機械学習におけるバイアスを見つけて削減する作業を行っており、この作業は最終的には成果を上げることになるでしょうが、まだ道のりは長いです。 「規制が厳しい顧客の中には、政府機関の前でこのモデルを擁護しなければならない場合、検討しない人もいるだろう」と彼は語った。

調査会社フォレスター・リサーチの副社長兼上級アナリスト、マイク・グアルティエリ氏は、一部の企業はある程度の懐疑心を持ってディープラーニングを活用していると述べた。 「こうしたモデルを使用している企業でさえ、それを信頼していない」と彼は最近のパートナー会議で語った。

ディープラーニングを使い始めている企業には、人間の介入やルールの導入など、不確実性に対処する方法があると彼は述べた。

「モデルは予測を立てることができるが、それは常に確率だ。だが、もしそれが間違っていたらどうなるだろうか?」と彼は言う。 「ルールを定めることができます。『これは詐欺だ』と伝えても、モデルは『これは詐欺ではない』と言うかもしれません。あるいは、『モデルが何を言おうと、私にとってこれは詐欺だ』のように、人間に有利なルールを定めることもできます。」

ニューラル ネットワークの透明性を高めるためのいくつかの作業が行われています。その 1 つは、ワシントン大学のコンピューター サイエンス教授である Marco Tulio Ribeiro 氏と、その同僚である Sameer Singh 氏および Carlos Guestrin 氏によって提案された、Locally Interpretable Model-Agnostic Explanations (LIME) フレームワークです。

LIME フレームワークは、理解可能性を向上させ、さまざまな不透明なアルゴリズムによって生成された予測をより簡単に解釈できるように設計されています。これには、ランダム フォレストやサポート ベクター マシン (SVM) などの従来の機械学習手法や、ますます普及しているニューラル ネットワーク手法が含まれます。

GitHub 上のオープンソース ソフトウェアである LIME フレームワークは、ニューラル ネットワークの外層を層ごとに剥がしていくことが期待されています。 「LIMEは機械学習の実践者に自信を与え、ツールポートフォリオに追加できる効果的なツールです」と、リベイロ教授、シン教授、ゲストリン教授は、コンピューターニュースサイト「オライリー」に2016年に掲載された記事に書いている。

しかし、LIME が業界の信頼を獲得するには、まだやるべきことがたくさんあります。テラデータのブロブスト氏はこう語った。 「上で述べたフレームワークであるLIMEはまだ完成していません」と彼は言う。「これは活発な研究領域ですが、私はこれを『大学院コード』と呼んでいます。使用例は非常に限られています。特殊な使用例には特殊なカスタマイズが必要です。」

<<:  Madlib を使用して「機械学習」で KNN を学習する

>>:  自分で作成したデータセット、TensorFlow を使用した株価予測チュートリアル

ブログ    

推薦する

...

人工知能技術は人間の生活にどのような影響を与えるのでしょうか?

[[349271]]人工知能と産業の組み合わせは、中国市場の爆発的な成長を促進し、中国のモバイルイ...

エッジAI: インテリジェンスをソースに近づける

人工知能の発展により、データをアルゴリズムに渡すのではなく、アルゴリズムがデータを処理するようになり...

...

テクノロジーは未来を変えます。将来、配達員も失業するでしょう。配達員のいない郵便局だけが残るでしょう。

信じますか?近い将来に配達員が失業するなどとは信じられない人もいるかもしれないが、これは紛れもない事...

2022QSリスト公開! MITがコンピュータサイエンスランキングでトップ、清華大学は15位、北京大学はトップ20から脱落

2022年QS世界大学分野別ランキングが発表されました!全体的には、21年前と比べて大きな変化はあり...

...

マイクロソフトリサーチアジア、ウェイ・フル氏:人工知能における基礎イノベーションの第2次成長曲線

人工知能の発展の観点から見ると、GPT シリーズのモデル (ChatGPT や GPT-4 など) ...

...

「ロボット交通警察」が登場!最先端技術が輸送業界に力を与える

現在、科学技術の継続的な進歩により、ロボットは徐々にさまざまな産業の変革のための重要なツールとなり、...

「トランスフォーマー」は5年でクレイジーなCNNに取って代わりました!トランスフォーマーは人工知能を支配するのでしょうか?

AI業界では今や誰もが知る名前となったTransformerが、これほど短期間でなぜこれほど人気を...

自動化と人工知能の違いをご存知ですか?

自動化の一般的な定義は、機械化と電動化の最高レベルであり、つまり、機械、設備、機器はすべて、指定され...

モンローとドラゴンマザーがあなたと話すことを学びましょう。静止画とビデオだけです

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

間違い:2017 年に人工知能分野で何が起こったか

今年、AIプロジェクトのAlphaGoとLibratusが、それぞれ人間の最強の囲碁プレイヤーとポー...

AI 音声ジェネレーターとは何ですか? どのように機能しますか?

近年、AI 音声ジェネレーターは、人々が機械と対話し、デジタル コンテンツを受け取る方法を変える強力...