最近、「少量のデータによるニューラル ネットワークのトレーニング - ドラフト」と題された IEEE の論文では、少量のデータを使用してニューラル ネットワークをトレーニングする新しい方法、つまり極座標空間での放射状変換による画像強化を実現する方法が提案されました。データの情報内容は変わりませんが、データの多様性が向上し、最終的にはニューラル ネットワークの一般化パフォーマンスが向上します。 論文アドレス: https://arxiv.org/pdf/1708.04347.pdf 概要: ディープ ニューラル ネットワークは、多数のノード層で構成される複雑なアーキテクチャであり、トレーニング中に評価する必要がある重み、バイアスなどの多数のパラメーターが生成されます。より大規模で複雑なニューラル ネットワークでは、より単純なアーキテクチャよりも適切な収束を実現するために、より多くのトレーニング データが必要になります。ただし、ネットワークのトレーニングに使用できるデータは限られているか、不均衡です。より少ないデータでニューラル ネットワークをトレーニングできるように、画像拡張のための極座標空間でのラジアル変換を提案します。ピクセル単位の座標変換により、元の画像と拡張されたデータが極座標系で表現され、弱い表現による画像カテゴリの多様性が向上します。私たちが提案した方法を使用して、MNIST と、AlxNet および GoogLeNet ニューラル ネットワーク モデルを使用した一連のマルチモーダル医療画像に対する実験では、非常に高い分類精度が示されました。 図 1: ラジアル変換サンプリング。 a) ラジアル変換を使用して、サンプルを直交座標 (左) から極座標 (右) にマッピングします。 b) 極座標系における放射状変換。 c) ラジアル変換を使用して、256 × 256 画像 (2D 平面) 内の離散サンプルをフィルタリングします。任意に選択された極はピクセル (170, 50) にあります。 d) c) で選択したサンプルを極座標系から直交座標系にマッピングします。赤いサンプルは、サンプル c) から d) へのマッピング方向を示しています。 図2: MNISTデータセットからのサンプルと、極座標でのラジアル変換RT(·)を使用した対応する表現。 図 3: マルチモーダル医療データセットのサンプルと、極座標系での放射状変換を使用した対応する表現。 表 4: MNIST および Medical Multimodal データセットからのオリジナル画像と放射状変換画像を使用してトレーニングされた AlexNet モデルと GoogLeNet モデルの収束動作。 「RT」という用語は放射状に変換された画像を指し、「オリジナル」という用語は非常に少ないオリジナル画像でトレーニングされたモデルを指します。 x 軸はトレーニングの反復を表し、左の y 軸はトレーニング中のモデル損失を表し、右の y 軸は検証データセットを使用してトレーニングしたときのモデルの精度を表します。 表 1: オリジナルおよび放射状変換されたマルチモーダル医療画像でトレーニングされた AlexNet と GoogLeNet の精度 (「Acc.」 %) と信頼度 (「Conf.」 %) の値。 「Abd」は腹部MRI、「Std」は標準偏差を表します。太字部分は***の結果です。 表 2: 元の MNIST 画像と放射状変換された MNIST 画像でトレーニングされた AlexNet と GoogLeNet の精度 (「Acc.」 %) と信頼度 (「Conf.」 %) の値。 「Std」は標準偏差です。太字部分は***の結果です。 結論は ディープ ニューラル ネットワークを正常にトレーニングするには、バランスの取れた大量のデータが必要です。実際には、ほとんどのデータセットは不均衡であるか、特定のクラスで利用できるデータが限られています。本稿では、データセット内のサンプル数を増やし、ニューラル ネットワークのトレーニングを支援するために、極座標系の放射状変換を提案します。提案されたデータ拡張方法は、データの情報内容を変更するのではなく、データの多様性を向上させます。私たちの結果は、このアプローチによりニューラル ネットワークの一般化パフォーマンス、つまり機械学習モデルが未知のデータの出力値を予測できる精度が向上することを示しています。最先端の AlexNet および GooLeNet ニューラル ネットワーク モデルを非常に少ないデータでトレーニングすると、この方法では学習プロセス全体を通じてトレーニング損失と検証精度に大きな変動があることがわかります。 |
<<: 顔の特徴を検出するシンプルなディープラーニング手法を教えます
>>: Google の社内機械学習プロジェクト「Project Ninja」の秘密を解明します。
12月2日、マイクロソフトと周迅のAI音声紅丹丹慈善プロジェクトの発起人である魯音源文化伝承社は、...
写真は思い出を保存するための最も便利なツールの一つです。テクノロジーのおかげで、ある意味カメラとも言...
2021年最後の法定休日に別れを告げ、皆が仕事に戻り、仕事帰りの通勤のリズムが戻りました。北京、上海...
中国・北京(2019年11月21日) – 世界的に有名な知能ロボット企業であるGeek+は、今年...
生成 AI は、特にビジネスの世界でますます人気が高まっています。ウォルマートはつい最近、店舗外の従...
[[426039]]かつて人々は、技術の進歩が労働者に大きな解放をもたらし、人類が牧歌的な生活を送れ...
以前、「【インタビュー】 - 低速反応再帰」で 3 つの再帰アルゴリズムを読みました。フィボナッチ数...
[[226860]]タイトル画像提供:Visual China最近、海外の多くの企業で興味深い変化が...
現代の小売業は第二次世界大戦後に始まりました。カルフールによるハイパーマーケット モデルの先駆的導入...
この記事はWeChatパブリックアカウント「Compass Krypton Gold Entranc...
ハーバード・ビジネス・レビューが実施した調査によると、販売に人工知能技術を活用する企業は、潜在顧客を...
[[351784]]ビッグデータダイジェスト制作著者: miggyようやく気に入った家が見つかり、...