中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

中国の博士がCNN全体を視覚化し、各畳み込みとプーリングが明確になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

CNNとは何ですか? CNNですか?

AI に興味を持つ初心者は誰でも、最初に CNN (畳み込みニューラル ネットワーク) という用語に遭遇するでしょう。

しかし、初心者が CNN が一体何なのか、なぜインテリジェントに顔を認識し、声を区別できるのかを理解しようとすると、毎回混乱してしまい、形而上学としてしか理解できません。

さて、Wikipedia が解決できなかった問題を誰かが解決しました。

CNN Explainerと呼ばれるこのオンラインのインタラクティブな視覚化ツールは、CNN を解説し、初心者に CNN とは何か、なぜオブジェクトを識別できるのかを説明します。

TensorFlow.js を使用して 10 層の事前トレーニング済みモデルをロードします。これは、ブラウザで CNN モデルを実行するのと同じです。コンピューターを起動するだけで、CNN がどのようなものかを理解できます。

さらに、この Web ツールはインタラクティブです。グリッド (CNN の「ニューロン」) のいずれかをクリックするだけで、入力内容と、どのような微妙な変化が生じたかが表示されます。

それぞれの畳み込み演算も明確に確認できます。

畳み込みをはっきりと見る

CNN インタープリターも非常に使いやすく、マウスでタップするだけです。

ニューロンをクリックして弾性解釈ビューに入り、畳み込みカーネルのスライディング プロセスのアニメーション シミュレーションを確認します。

畳み込みプロセス図をクリックすると、より詳細なプロセスが表示されます。

基礎となる畳み込み演算プロセスと、演算後に 3×3 畳み込みカーネルが 1 つの数値に変換される様子を確認できます。

ReLUと最大プーリング層をはっきりと見る

特定のプロセスを確認するには、ReLU レイヤーのニューロンをクリックします。ReLU 関数は次のように動作します。

プーリング ニューロンをクリックすると、最大プーリング層がどのように機能するかを確認できます。

CNNがどのように予測を出力するかを見る

右端の出力ニューロンをクリックすると、弾性解釈ビューに入ります。

Softmax 関数の詳細を表示できます。

「ニック」を特定してみますか?

CNN インタープリターにはデフォルトで 10 枚の画像が付属していますが、独自のカスタム画像を追加することもできます。

たとえば、次のようになります。

[[324608]]

チーズ入り焼きピーマン?ピーマンのピザ?それとも一体何なの?

画像リンクをコピーするか画像をアップロードすると、10 段階の処理を経て、次の結果が得られます。

それはピーマンですが、カメムシである可能性もあります。

ただし、トム・ヌークを配置するなど、右側にある元の 10 個のカテゴリにのみ分類できます。

[[324609]]

エスプレッソとして認識されます。

ジョージア工科大学の中国人博士課程学生が制作

最後に、この CNN インタープリターの作者は、ジョージア工科大学の中国人 Zijie Wang です。彼は昨年、機械学習の博士課程を始めたばかりです。彼はウィスコンシン大学マディソン校を 3.95/4.00 の GPA で卒業しました。

[[324611]]

彼はまた、ウィスコンシン大学マディソン校の中国人学部生がどこから来たのかを調べるなど、他の興味深いデータ視覚化プロジェクトも行っています。

ポータル

CNN解説

https://poloclub.github.io/cnn-explainer/

GitHub

https://github.com/poloclub/cnn-explainer

https://arxiv.org/abs/2004.15004

​​



<<:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

>>:  私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

公共の場での顔認識は全面的に禁止される可能性があります。ちょうど今、欧州議会はAI規制を強化することを決定した

[[427521]]昨日、欧州議会はAI生体認証技術に基づく大規模な監視の全面禁止を求める決議を可決...

DeepFakeはもう人々を騙せません!米国の大手テクノロジー企業7社が共同でAI生成コンテンツに透かしを追加

最近、OpenAIとGoogleが率いるアメリカのテクノロジー大手7社が共同で次のような発表を行った...

人工知能は「大きい」と「小さい」に分けられる

大規模な多国籍産業企業は、進行中のデジタル産業革命で効果的に競争できるように、機械をよりスマートにす...

スマートフォンアプリケーションにおける人工知能の役割

人工知能がスマートフォンアプリとユーザーエクスペリエンスをどのように変えているのか。進化し続けるテク...

...

OpenAIの競合InflectAIがマイクロソフトとビル・ゲイツの支援を受けて13億ドルを調達

OpenAIの競合企業Inflection AIは最近、Microsoft、リード・ホフマン、ビル・...

機械学習とディープラーニングの違いは何ですか? なぜ機械学習を選択する人が増えるのでしょうか?

機械学習とディープラーニングの違いは何でしょうか?この記事から答えを見つけてみましょう。ターゲットこ...

...

...

プレミアリーグの試合にファンを呼び戻すために AI は何ができるでしょうか?

COVID-19の影はまだ消えていないが、今年のプレミアリーグの試合の最初の週末は珍しい「好天」を...

北京市海淀区に世界初のAIパークがオープン、自宅のすぐそばで自動運転車を体験できる

自動運転車に乗って公園を訪れ、休憩中にパビリオンとおしゃべりし、ランニング後に顔をスキャンして運動デ...

...

Google がオールラウンドな音楽転写 AI を発表: 曲を一度聴くだけでピアノとバイオリンの楽譜がすべて手に入る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ディープラーニングを使用してコンピュータービジョンのすべての作業を完了するにはどうすればよいですか?

コンピュータービジョンをやってみたいですか?最近では、ディープラーニングが主流となっています。大規模...