中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

CNNとは何ですか? CNNですか?

AI に興味を持つ初心者は誰でも、最初に CNN (畳み込みニューラル ネットワーク) という用語に遭遇するでしょう。

しかし、初心者が CNN が一体何なのか、なぜインテリジェントに顔を認識し、声を区別できるのかを理解しようとすると、毎回混乱してしまい、形而上学としてしか理解できません。

さて、Wikipedia が解決できなかった問題を誰かが解決しました。

CNN Explainerと呼ばれるこのオンラインのインタラクティブな視覚化ツールは、CNN を解説し、初心者に CNN とは何か、なぜオブジェクトを識別できるのかを説明します。

TensorFlow.js を使用して 10 層の事前トレーニング済みモデルをロードします。これは、ブラウザで CNN モデルを実行するのと同じです。コンピューターを起動するだけで、CNN がどのようなものかを理解できます。

さらに、この Web ツールはインタラクティブです。グリッド (CNN の「ニューロン」) のいずれかをクリックするだけで、入力内容と、どのような微妙な変化が生じたかが表示されます。

それぞれの畳み込み演算も明確に確認できます。

畳み込みをはっきりと見る

CNN インタープリターも非常に使いやすく、マウスでタップするだけです。

ニューロンをクリックして弾性解釈ビューに入り、畳み込みカーネルのスライディング プロセスのアニメーション シミュレーションを確認します。

畳み込みプロセス図をクリックすると、より詳細なプロセスが表示されます。

基礎となる畳み込み演算プロセスと、演算後に 3×3 畳み込みカーネルが 1 つの数値に変換される様子を確認できます。

ReLUと最大プーリング層をはっきりと見る

特定のプロセスを確認するには、ReLU レイヤーのニューロンをクリックします。ReLU 関数は次のように動作します。

プーリング ニューロンをクリックすると、最大プーリング層がどのように機能するかを確認できます。

CNNがどのように予測を出力するかを見る

右端の出力ニューロンをクリックすると、弾性解釈ビューに入ります。

Softmax 関数の詳細を表示できます。

「ニック」を特定してみますか?

CNN インタープリターにはデフォルトで 10 枚の画像が付属していますが、独自のカスタム画像を追加することもできます。

たとえば、次のようになります。

[[324608]]

チーズ入り焼きピーマン?ピーマンのピザ?それとも一体何なの?

画像リンクをコピーするか画像をアップロードすると、10 段階の処理を経て、次の結果が得られます。

それはピーマンですが、カメムシである可能性もあります。

ただし、トム・ヌークを配置するなど、右側にある元の 10 個のカテゴリにのみ分類できます。

[[324609]]

エスプレッソとして認識されます。

ジョージア工科大学の中国人博士課程学生が制作

最後に、この CNN インタープリターの作者は、ジョージア工科大学の中国人 Zijie Wang です。彼は昨年、機械学習の博士課程を始めたばかりです。彼はウィスコンシン大学マディソン校を 3.95/4.00 の GPA で卒業しました。

[[324611]]

彼はまた、ウィスコンシン大学マディソン校の中国人学部生がどこから来たのかを調べるなど、他の興味深いデータ視覚化プロジェクトも行っています。

ポータル

CNN解説

https://poloclub.github.io/cnn-explainer/

GitHub

https://github.com/poloclub/cnn-explainer

https://arxiv.org/abs/2004.15004

​​



<<:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

>>:  私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ    
ブログ    

推薦する

...

...

...

機械学習に必要な確率論の基礎

この記事を読んでいただければ、確率の基本原理を機械学習に応用できる可能性が 100% あります。機械...

インドは、大規模言語モデルの開発を強化するためにAI分野に1037億ルピーの投資を発表した。

インド政府は3月8日、「インドにAIを根付かせる」と「AIをインドのために役立てる」という2大目標の...

GPT-4 モデル アーキテクチャが漏洩: 1.8 兆個のパラメータを含み、混合エキスパート モデルを使用

7月13日、海外メディアSemianalysisは最近、今年3月にOpenAIが発表したGPT-4モ...

...

...

AI導入を成功させるために最も重要なスキル

実践により、人工知能 (AI) が適切に導入されなければ多くのリスクをもたらすことがわかっているため...

機械学習について昨日、今日、そして明日に語りましょう

機械学習今日、機械学習は、そのアルゴリズムの1つであるディープラーニングの優れたパフォーマンスを誇っ...

DrivingGaussian: リアルなサラウンドビューデータ、運転シーンの再構成SOTA

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

PyTorch を軽量化します。このディープラーニング フレームワークは価値があります。 GitHub 6.6k スター

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

1行のコードでsklearnの操作が数千倍高速化

1 はじめにみなさんこんにちは、フェイ先生です。機械学習の定番フレームワークであるscikit-l...

9つの一般的な畳み込みニューラルネットワークの紹介

畳み込みの目的は、入力から有用な特徴を抽出することです。画像処理では、さまざまなフィルターを選択でき...

AIのおかげで売上が24%増加しました。このようなAI人材はどこで見つけられるのでしょうか?

[[429444]]この記事はWeChatの公開アカウント「Computer World」から転載...