MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

特定のタスクを実行するためにニューラル ネットワークを調整したいですか?この問題は想像したほど単純ではありません。

ディープ ニューラル ネットワーク (DNN) は優れたブロックですが、その移動には計算リソースと時間の面で非常にコストがかかる可能性があります。

現在、Google AI は MorphNet をリリースしました。人気の画像分類ニューラル ネットワーク Inception V2 でテストしたところ、精度を犠牲にすることなく、ニューラル ネットワークが高速化および小型化され、計算電力の消費が削減されることが分かりました。

MorphNetとは

MorphNet は、既存のアーキテクチャを使用して特定のタスクを最適化するニューラル ネットワーク モデルの最適化 (改良) テクノロジです。

言い換えれば、これは転移学習の問題です。転移学習の難しさは、不変量を見つけることにあります。モデルは、以前にトレーニングされたタスクの目的と似ているものの、まったく同じではない多くのタスクを処理する必要があり、これによりモデルのパフォーマンスが大幅に低下したり、クラッシュしたりすることがあります。

MorphNet の成功は、同様の問題向けに構築されたニューラル ネットワークを入力として使用する限り、より小型で高速で、新しいタスクに適した新しいアーキテクチャを作成できるという点にあります。

MorphNet は、ループの収縮と拡張という 2 つの段階を通じてニューラル ネットワークを最適化します。

収縮期

縮小フェーズでは、MorphNet は非効率的なニューロンを識別し、スパース正則化を適用してそれらを削減します。

MorphNet は、ターゲット リソースを考慮しながらニューロンの損失を計算することに注意してください。そのため、トレーニング プロセス中に、オプティマイザーはリソースの損失を認識し、どのニューロンが効率的で、どのニューロンを削除できるかを認識できます。

わからない? MorphNet がニューラル ネットワークの計算コスト (FLOP、つまり 1 秒あたりの浮動小数点演算など) をどのように計算するかを確認するには、次の例をご覧ください。

2 つの入力 (Xn)、6 つの重み (a、b、…、f)、および 3 つの出力 (Yn、ニューロン) を持つ行列乗算として表されるニューラル ネットワーク層を考えます。つまり、このレイヤーを評価するには 6 回の乗算が必要になります。

MorphNet では、乗算回数を入力数と出力数の積として扱います。左側の例では、2 つの重みが 0 であっても、評価時にすべての乗算を実行する必要があります。しかし、中央の例では構造のスパース性を示しており、MorphNet は出力数が 2 であることを認識でき、このレイヤーの乗算回数は 6 から 4 に削減されます。この考え方に従って、MorphNet はネットワーク内の各ニューロンの増分コストを決定し、右側のようなより効率的なモデルを生成できます。

拡大フェーズ

拡張フェーズでは、MorphNet は幅乗数を使用してすべてのレイヤーのサイズを均一に拡張します。

たとえば、拡張が 50% の場合、非効率なレイヤーではニューロンが 100 から 10 に縮小し、その後 15 にのみ再度拡張されます。一方、重要なレイヤーではニューロンが 100 から 80 にのみ縮小し、再拡張後に 120 に達し、より多くの使い捨てリソースを取得する可能性があります。

つまり、MorphNet の最終的な効果は、ネットワークの非効率的な部分から効率的な部分にコンピューティング リソースを再割り当てすることです。

MorphNetはAIモデルを最適化します

効果はどうですか

Google AI チームは、MorphNet を使用して Inception V2 ネットワーク モデルをトレーニングしました。

写真はMorphNet論文より

ベースライン方式では、幅乗数を使用して各畳み込みの出力数を均一に減らすことで、精度と計算能力のバランスをとります (赤)。

MorphNet アプローチは計算電力消費を直接ターゲットにし、モデルを縮小するときにより優れたトレードオフ曲線 (青) を生成します。

同じ精度で、MorphNet メソッドは計算電力消費を 11% ~ 15% 削減します。

MorphNet は Inception V2 の最適化に優れており、他のネットワーク モデルにも役立ちます。

写真はMorphNet論文より

モデルのサイズ/FLOPS を圧縮することに成功しただけでなく、品質の低下もほとんどありません。予想どおり、Google が作成したものはすべて高品質であるに違いありません。

Google はすでにこの便利なものを使い始めています。 Google AIチームは、MorphNetがGoogleの複数の量産規模の画像処理モデルに適用されていると述べた。

ポータル

MorphNet はオープンソースになりました。

GitHub アドレス:

https://github.com/google-research/morph-net

論文の宛先:

出典: http://arxiv.org/pdf/1711.06798.pdf

<<:  知覚AIオペレーティングシステム

>>:  Yirendai - Yiren Hive Fintech AI 実践: Hive Robot

ブログ    

推薦する

PageRank、最小全域木: ML 開発者が知っておくべき 5 つのグラフ アルゴリズム

接続された世界では、ユーザーを独立したエンティティとして考えることはできません。機械学習モデルを構築...

病院が救急科で人工知能を使用する場合、何を考慮すべきでしょうか?

RapidAI の Mary Hardcastle がヘルスケア技術の進歩を検討し、病院が救急治療...

...

トピックモデルに適した定量評価指標を見つけるにはどうすればよいでしょうか?これは人気のある方法の要約です

LDA (潜在的ディリクレ分布) や Biterm などの統計トピック モデルを適用することで、大量...

Jetson - Nano Opencv の基本的な使用方法

序文:前回のJetson Nanoの記事では、学習のためのアイデアや教材を紹介しました。今日は、引き...

AIが本当に成功する方法

[[412385]]人工知能は現在、特に自動運転車でより広く深く活用されています。人工知能を使用して...

IoTとAIを活用して価値を加速させる4つの効果的な方法

Twitter、LinkedIn、そして多くの IoT 関連の Web サイトを見ると、モノのインタ...

AI および機械学習プロジェクトはどの程度安全ですか?

人工知能と機械学習は私たちに利益をもたらしますが、そのセキュリティには注意が必要です。どれくらい安全...

2011 コンピュータソフトウェア試験プログラマー: アルゴリズム分析の基礎学習

コンピュータの問題解決のプロセスにおいて、データ構造とアルゴリズムはプログラムの 2 つの主要要素で...

ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

[[407147]]画像認識といえば、皆さんすでによくご存知だと思います。この技術は、顔認証、決済...

数千億単位の数学専用大規模モデルMathGPTが公開テストを開始

国内の大型模型市場に新たな「プレーヤー」が誕生しました。今回は数学に特化した大型模型です。 Sync...

...

...

...