この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 最近、ニューラルネットワーク可視化ツールが人気になってきました。 このツールは「nn_vis」と呼ばれ、新しい 3D 視覚化テクノロジを使用して次の結果を生成します。 作者らは、ニューラルネットワークの透明性が欠如しているため、さまざまなタスクに効果的なアーキテクチャを選択することが困難であるため、このツールを作成したと述べた。 nn_vis の違いは何ですか?一緒に調べてみましょう。 ニューラル ネットワーク モデルを作成し、パラメータ設定を通じてさまざまな表示形式を取得できます。 さらに、パラメータの重要度の評価結果に基づいて、ニューラル ネットワークが剪定され、モデルが簡素化されます。 同時に、ニューラルネットワークの結合プロセスも視覚化できます。 では、これらの機能はどのように実現されるのでしょうか? nn_vis は、バッチ正規化、微調整、特徴抽出など、ニューラル ネットワーク最適化の分野における既存の方法を使用して、トレーニングされたニューラル ネットワークのさまざまな部分の重要性を評価します。 エッジバインディング、レイトレーシング、3Dインポスター、特殊な透明化技術を組み合わせることで、ニューラルネットワークの3Dモデルが得られ、評価結果の有効性が証明されます。 詳しく見てみましょう〜 パラメータの準備まず、次のように、configs/processing.json を通じてニューラル ネットワーク処理のパラメータを準備します。
グラフィカル ユーザー インターフェイスで設定することもできます。 ニューラルネットワークモデルの作成視覚化ツール start_tool.py を使用して、ニューラル ネットワークの Load Processed Network を選択します。 既存のネットワークに加え、ランダムネットワークを生成したり、さまざまなサイズのネットワークを扱ったりすることも可能です。 視覚化により、トレーニング パラメータを、最も一般的に使用されるパラメータよりも構造化することができます。 さまざまなトレーニングを行った後、回転、カメラの位置の切り替え、スクリーンショットの撮影を行うことで、次のような効果が得られます。
• 左側のニューラル ネットワークは、ランダムに割り当てられた値でトレーニングされていません。ノードとエッジは中心から離れたところに広がっています。 • 中間層の参加者は、基本的なトレーニングを受けた後、90% を超える精度を達成しました。 • 右側のニューラル ネットワークも同様にトレーニングされ、過剰適合を防ぐために L1 正則化が使用され、同様の精度を持つ最も狭いモデルが生成されます。 各ノードの重要性を評価するノードとエッジは重要度に応じて色分けされ、異なる色はニューラル ネットワークの各部分を表し、関連性を予測します。 左の図からわかるように、重要でないパラメータを削除しても、重要なパラメータほどモデルの予測精度には影響しません。 右の図は、ニューラル ネットワークがクラスの重要度に基づいて剪定された場合、重要なクラスは精度を維持できることを示しています。重要なカテゴリの精度は、全体の精度と比較して常に高くなります。 ニューラル ネットワークを刈り込む、つまり重要でない冗長なパラメータを切り捨てることで、モデルの複雑さと過剰適合のリスクが軽減され、一般化の度合いが向上し、トレーニング コストが低く、より効率的なニューラル ネットワークが得られます。 これは重要度評価の有効性を証明しています。 バインディングプロセスの可視化ニューラル ネットワークの結合は、継続的な反復によって実現されます。一般的なプロセスは次のとおりです。 ニューラル ネットワーク結合プロセスの視覚化: ニューラルネットワークの各層の処理には一定の時間がかかり、計算はリアルタイムではないことに注意してください。 さまざまな視覚効果GUI または configs/rendering.json 経由で、次のシェーダー パラメータを変更します。 サイズ、オブジェクトの基本的な不透明度、つまり重要度と不透明度の比率、カメラからの距離と不透明度の比率、オブジェクト上のさまざまなポイントの密度と不透明度の比率、および重要度に基づいてオブジェクトのレンダリングを定義するためのしきい値。 さまざまな視覚化効果を得ることができます: このツールに興味のある友人は、記事の最後にあるリンクから入手できます〜 GitHub プロジェクト アドレス: |
<<: Aurora の 1 億ドルの買収の背後にあるもの: RISC-V の創始者が「中国製チップ」を開発するという野望
現代の数値天気予報 (NWP) は 1920 年代にまで遡ります。今日では、数値天気予報はいたるとこ...
Java の文字の組み合わせソートは、特に難しい問題ではありません。ブルートフォースとグラフ理論 (...
[[380335]]新華網、北京、2月3日(記者:孫雲龍)新たなインフラの重要な部分として、人工知能...
[[335623]]暗号化アルゴリズムは、一般的に、可逆暗号化と不可逆暗号化に分けられます。可逆暗...
北京時間2月15日朝のニュース、ブルームバーグ通信によると、マスク氏が提唱するAI研究機関OpenA...
[[413820]]グラフは、ソーシャル ネットワークからバイオインフォマティクス、ロボット工学の...
より強力な AI エージェントを構築するにはどうすればよいでしょうか?答えは、彼らに完全で現実的な世...
データの問題は、企業の AI プロジェクトが意図した目標を達成できない主な理由です。しかし、企業が失...
データ駆動型進化的最適化とは何ですか? それは単なるデータ + 最適化アルゴリズムですか? データ駆...
LLM の機能と従来のアルゴリズムを組み合わせることで、どのような火花が生まれるのでしょうか?清華大...
大規模モデルに向けて、テクノロジー大手はより大規模なモデルをトレーニングしており、学界はそれらを最適...
感情認識技術は、人工知能を使用して人の表情から感情を検出する、数十億ドル規模の新興産業です。しかし、...
OpenAI ChatGPT Plus サブスクリプション支払いには強力な機能があり、高度な「データ...