ブラックボックスの一角を明らかにしよう! OpenAI、ニューラルネットワークの内部構造を視覚化する「顕微鏡」をリリース

ブラックボックスの一角を明らかにしよう! OpenAI、ニューラルネットワークの内部構造を視覚化する「顕微鏡」をリリース

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

3か月近く休眠状態にあったOpenAIブログがついに更新されました。今回、AI研究者に届けられた作品は「OpenAI Microscope」で、中国語ではOpenAI顕微鏡と翻訳されています。

これは、実験室の顕微鏡のように機能し、AI 研究者がニューラル ネットワークの構造と特性をより深く理解するのに役立つことを意味します。

ブログアドレス: https://openai.com/blog/microscope/


結局のところ、この顕微鏡は、2012 年の ImageNet チャレンジの優勝者である AlexNet、GoogleNet (Inception V1 とも呼ばれる)、2014 年の ImageNet チャレンジの優勝者である ResNet v2 など、歴史的に重要で一般的に研究されているコンピューター ビジョン モデルを含むニューロン視覚化ライブラリのようなものです。

OpenAI 顕微鏡

顕微鏡アドレス: https://microscope.openai.com/models

上図に示すように、初期バージョンにはコンピューター ビジョン分野のニューラル ネットワーク モデルが 8 つ含まれています。各ニューラル ネットワークは、いくつかの重要なニューロンの内部構造を視覚的に表示します。

OpenAI は研究の中で次のように述べています。「現代のニューラル ネットワーク モデルの強力な能力は、何千ものニューロンの相互作用から生まれます。」

しかし、ニューロン間の「協力」はこれまでずっと謎だった。OpenAI が公開した顕微鏡は、こうしたニューロンを素早く調査するのに役立つだろう。

たとえば、研究者は、InceptionV1 4c:447 が、車輪検出器 (4b:373) と窓検出器 (4b:237) から構築された車検出器であると推測する場合があります。
InceptionV1 4c:447 は、ホイール検出器 (4b:373) とウィンドウ検出器 (4b:237) で構成される車両検出器です。そして、OpenAI 顕微鏡を使用して、その推測を評価し、新しいものを発見することができます。

たとえば、上のアニメーションに示されているように、OpenAI 顕微鏡による AlexNet の観察は、完全な画像から始まり、ニューラル ネットワークによる特徴抽出を経て、最終的に画像がいくつかの色付きの線に「ぼかし」られます。

(Leiphone.com(公式アカウント:Leiphone.com))

その間に何が起こったのですか?明らかに、ニューラル ネットワークの途中で何が起こっているかを理解することは非常に重要です。

上図のように、ニューラルネットワークの各層をクリックすると、OpenAI Microscope は画像を処理するプロセスを視覚化し、各ニューロンが処理された画像に対応します。各画像の「進行」プロセスが非常に明確に示されています。

OpenAI によれば、ニューロンを探索するこのプロセスは、別のニューラル ネットワークの解釈可能性の研究「ズームイン: 回路入門」に予想外の助けとなったという。

「顕微鏡」技術は、モデル内の位置と技術という 2 つの概念に基づいています。もっとわかりやすく言えば、位置とは顕微鏡をどこに向けるか、技術とは顕微鏡にどのようなレンズを取り付けるかということです。

このモデルは、「エッジ」を介して相互に接続された「ノード」(ニューラル ネットワーク レイヤー)のグラフで構成されます。各操作は、ニューロンにほぼ類似した数百の「ユニット」で構成されます。

使用されるテクニックのほとんどは、特定の解像度でのみ有効であることに注意してください。たとえば、機能の視覚化では「セル」のみを指すことができ、その親の「ノード」を指すことはできません。
さらに、OpenAI はこのツールを提供しながら、解釈可能性の研究にもいくつかの貢献をしました。
1. すべてのモデルと視覚化はオープンソースであり、「Microscope」のすべての視覚化は lucid ライブラリを使用して生成されます。
2. モデルとニューロンを相互に接続し、ニューロンをすぐに確認してさらに調査できるようにする機能。
3. アクセシビリティ: 視覚的な調査を共有することで、高いアクセシビリティを維持します。
生物学者が少数の「モデル生物」の研究に重点を置くのと同様に、「顕微鏡」も少数のモデルを詳細に調査することに重点を置いています。 OpenAI の最初のリリースには、一般的に使用される 9 つのビジョン モデルが含まれており、今後数か月以内に追加のモデルが追加される予定です。
つまり、現在は DeepDream と関数可視化機能のみが提供されており、カスタマイズされたモデルの可視化探索はまだサポートされていません。

説明可能性研究: DeepDreamより

解釈可能性と決定論は機械学習システムの観点からは幅広いトピックであり、ニューラル ネットワークがそれらのレイヤーの機能で正確に何を実行しているかを理解することは困難です。

しかし、初期化パラメータの選択方法などの問題を解決するには、ニューラル ネットワークの性質を理解する必要があります。

AI研究者もこの方向に取り組んでいます。顕微鏡によるニューロンの可視化に加えて、近年のいくつかの研究では機械学習モデルの可視化も試みられています。

(Leiphone.com)

たとえば、Facebook が昨年春に立ち上げた Captum は、機械学習モデルによる決定を説明するために視覚化技術を使用する実験を行っています。 Pytorch に基づくモデル解釈ライブラリとして、強力で柔軟性があり、使いやすく、すべての最新アルゴリズムの解釈可能性を提供します。これにより、研究者や開発者は、モデルの予測結果に影響を与える特定の機能、ニューロン、ニューラル ネットワーク レイヤーをより深く理解できるようになります。

当時、Facebook は Captum をベースに構築され、説明的な視覚化機能を提供する Captum Insight の試用版もリリースしました。

2019 年 3 月には、OpenAI と Google も機械学習アルゴリズムによる決定を視覚化するための Activation Atlases をリリースしました。

(Leiphone.com)

これまでの研究が、視覚的なアルファベットの個々の文字をアルゴリズムに示すようなものであるとすれば、アクティベーション アトラスは辞書全体を提供し、文字がどのように組み合わさって実際の単語を形成するかを示します。

アクティベーション アトラスは、個々のニューロンから、これらのニューロンが集合的に表す空間の視覚化に焦点を移すことによって、機能の視覚化を構築します。

明らかに、今日の「顕微鏡」の作品も、以前の活性化マップ技術を統合し、それに依存しています。

こうした視覚化研究のすべては、2015 年にリリースされたコンピューター ビジョン プログラムである DeepDream と呼ばれる初期の実験にそのルーツがあると考えられます。このプログラムは、あらゆる画像をその画像の「幻覚」バージョンに変換することを目的としていました。

DeepDream は、Google のニューラル ネットワーク モデルが入力画像を理解する様子を「Deep Inception」と同様に示しています。その奇妙なスタイルにより、ある面ではいわゆる人工知能の美学を定義していると考えられています。

おそらく、その頃から AI 研究者たちはニューラル ネットワーク モデルから見た世界に興味を持ち、説明可能性の探求の道を歩み始めたのでしょう。

OpenAI の Chris OlahOlah 氏はかつてこう言っています。「ある意味で、すべては DeepDream から始まったのです。」

<<:  RL エージェントはオンラインでしかトレーニングできないと誰が言ったのでしょうか? Google がオフライン強化学習の新しいパラダイムを発表

>>:  Googleが謝罪:Vision AIが人種差別的な結果を生成

推薦する

Baidu CTO 王海峰氏:PaddlePaddle ディープラーニング プラットフォームは新しいインフラストラクチャの重要な部分です

産業インテリジェンスの急速かつ徹底的な進歩に伴い、人工知能インフラの構築は不可欠となっています。 5...

今後5年間のAI技術の発展と影響を展望する

人工知能 (AI) テクノロジーは、ビジネス プロセスの合理化、運用コストの削減、面倒なタスクの自動...

中国の機械工、黄永剛氏のチームの新しい研究:脳への光遺伝学インプラントがマウスを一瞬でゲイの友達に変える

研究者らはマウスの頭蓋骨に神経インプラントを埋め込み、インプラントを作動させるとマウスはすぐに交流し...

アリババ機械知能チームの3年間の取り組みの概要

[[266129]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

IoTとAIを活用した依存症治療

IoT によって促進される相互接続性と AI の学習機能は、幅広い問題を解決する可能性を示しています...

ビデオメモリを節約する新しい方法: 2 ビット活性化圧縮を使用して PyTorch でニューラル ネットワークをトレーニングする

[[410937]]この記事では、カリフォルニア大学バークレー校の PyTorch をベースにしたア...

百度の張亜琴社長:AIは現代の最も変革的な力である

[[205882]]北京時間10月10日朝のニュースによると、中国の検索大手、百度はシアトル地域にオ...

TensorFlow 2.0 中国語オープンソースブックプロジェクト: 1 日あたり 700 件の「いいね!」を獲得、GitHub のホットリストに

TensorFlow2.0の正式版がリリースされてからしばらく経ちますが、それに関連する体系的なチュ...

30年の沈黙と60年の経験を経て、「人工知能」の過去と現在とは?

30年以上沈黙していた「人工知能」という言葉は、ここ2年で非常に人気が高まり、テクノロジー企業の主...

強く連結されたコンポーネントを解決するための Tarjan アルゴリズムを実装する 20 行のコード

今日紹介するアルゴリズムは Tarjan と呼ばれていますが、これも非常に奇妙な名前です。奇妙なのは...

...

サイバーセキュリティにおける人工知能の動向

[[429763]]今日の世界はデータ主導であり、手動のプロセスだけではすべてのデータを監視または保...

大規模言語モデルの量子化手法の比較: GPTQ、GGUF、AWQ

大規模言語モデル (LLM) は過去 1 年間で急速に進化しており、この記事では (量子化) へのい...

人工知能専攻にはどのような専攻が含まれますか?見通しはどうですか?

人工知能にはどのような専攻が含まれますか?人工知能に関連する研究方向には、パターン認識とインテリジェ...