IEEEの論文では、画像強調を実現するための放射状変換を提案している

IEEEの論文では、画像強調を実現するための放射状変換を提案している

[[202259]]

最近、「少量のデータによるニューラル ネットワークのトレーニング - ドラフト」と題された IEEE の論文では、少量のデータを使用してニューラル ネットワークをトレーニングする新しい方法、つまり極座標空間での放射状変換による画像強化を実現する方法が提案されました。データの情報内容は変わりませんが、データの多様性が向上し、最終的にはニューラル ネットワークの一般化パフォーマンスが向上します。

論文アドレス: https://arxiv.org/pdf/1708.04347.pdf

概要: ディープ ニューラル ネットワークは、多数のノード層で構成される複雑なアーキテクチャであり、トレーニング中に評価する必要がある重み、バイアスなどの多数のパラメーターが生成されます。より大規模で複雑なニューラル ネットワークでは、より単純なアーキテクチャよりも適切な収束を実現するために、より多くのトレーニング データが必要になります。ただし、ネットワークのトレーニングに使用できるデータは限られているか、不均衡です。より少ないデータでニューラル ネットワークをトレーニングできるように、画像拡張のための極座標空間でのラジアル変換を提案します。ピクセル単位の座標変換により、元の画像と拡張されたデータが極座標系で表現され、弱い表現による画像カテゴリの多様性が向上します。私たちが提案した方法を使用して、MNIST と、AlxNet および GoogLeNet ニューラル ネットワーク モデルを使用した一連のマルチモーダル医療画像に対する実験では、非常に高い分類精度が示されました。

図 1: ラジアル変換サンプリング。 a) ラジアル変換を使用して、サンプルを直交座標 (左) から極座標 (右) にマッピングします。 b) 極座標系における放射状変換。 c) ラジアル変換を使用して、256 × 256 画像 (2D 平面) 内の離散サンプルをフィルタリングします。任意に選択された極はピクセル (170, 50) にあります。 d) c) で選択したサンプルを極座標系から直交座標系にマッピングします。赤いサンプルは、サンプル c) から d) へのマッピング方向を示しています。

図2: MNISTデータセットからのサンプルと、極座標でのラジアル変換RT(·)を使用した対応する表現。

図 3: マルチモーダル医療データセットのサンプルと、極座標系での放射状変換を使用した対応する表現。

表 4: MNIST および Medical Multimodal データセットからのオリジナル画像と放射状変換画像を使用してトレーニングされた AlexNet モデルと GoogLeNet モデルの収束動作。 「RT」という用語は放射状に変換された画像を指し、「オリジナル」という用語は非常に少ないオリジナル画像でトレーニングされたモデルを指します。 x 軸はトレーニングの反復を表し、左の y 軸はトレーニング中のモデル損失を表し、右の y 軸は検証データセットを使用してトレーニングしたときのモデルの精度を表します。

表 1: オリジナルおよび放射状変換されたマルチモーダル医療画像でトレーニングされた AlexNet と GoogLeNet の精度 (「Acc.」 %) と信頼度 (「Conf.」 %) の値。 「Abd」は腹部MRI、「Std」は標準偏差を表します。太字部分は***の結果です。

表 2: 元の MNIST 画像と放射状変換された MNIST 画像でトレーニングされた AlexNet と GoogLeNet の精度 (「Acc.」 %) と信頼度 (「Conf.」 %) の値。 「Std」は標準偏差です。太字部分は***の結果です。

結論は

ディープ ニューラル ネットワークを正常にトレーニングするには、バランスの取れた大量のデータが必要です。実際には、ほとんどのデータセットは不均衡であるか、特定のクラスで利用できるデータが限られています。本稿では、データセット内のサンプル数を増やし、ニューラル ネットワークのトレーニングを支援するために、極座標系の放射状変換を提案します。提案されたデータ拡張方法は、データの情報内容を変更するのではなく、データの多様性を向上させます。私たちの結果は、このアプローチによりニューラル ネットワークの一般化パフォーマンス、つまり機械学習モデルが未知のデータの出力値を予測できる精度が向上することを示しています。最先端の AlexNet および GooLeNet ニューラル ネットワーク モデルを非常に少ないデータでトレーニングすると、この方法では学習プロセス全体を通じてトレーニング損失と検証精度に大きな変動があることがわかります。

<<:  顔の特徴を検出するシンプルなディープラーニング手法を教えます

>>:  Google の社内機械学習プロジェクト「Project Ninja」の秘密を解明します。

ブログ    
ブログ    
ブログ    

推薦する

製薬業界を覆すAIは「仕掛け」か「希望」か?

人工知能 (AI) は、過去 10 年ほどの間に SF の世界から現実の世界へと移行し、地球上のほぼ...

Google の社内機械学習プロジェクト「Project Ninja」の秘密を解明します。

すべての製品に人工知能を統合したい場合は、強力な機械学習チームを育成する必要があります。 Googl...

...

...

無料の Python 機械学習コース パート 2: 多重線形回帰

Python で任意の数の変数に対する多重線形回帰をゼロから開発する方法を学びます。線形回帰はおそら...

AI、機械学習、ディープラーニングの謎を解く

ディープラーニング、機械学習、人工知能 — これらの流行語は分析の未来を表しています。この記事では、...

CES 2024 AIスマートホームのハイライト

ChatGPT が AI を話題にしてから 1 年以上経ちましたが、今年の Consumer Ele...

新型コロナウイルスはどのように変異するのでしょうか?機械学習が答えを教えてくれる

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

企業が人工知能を応用する際に直面する課題

[[340820]] [51CTO.com クイック翻訳] 過去10年間、人工知能をめぐって大きな議...

人工知能はどのような革新と影響をもたらすのでしょうか?

現在、我が国の政策の推進と各方面の支援により、人工知能の発展は急速に進んでいます。人々が最も関心を持...

...

人工知能と機械学習の違いと影響は何ですか?

人工知能と機械学習は、意思決定を行うコンピューターが部署や課全体に取って代わる世界を思い起こさせます...

なぜスマートグリッドはエネルギーの未来なのでしょうか?

要約すると、集中型電力ネットワークは、一日のどの時間でも過負荷にならない安定性を確保するために、特定...

この世界的に有名な旅行ウェブサイトは、150の独自の機械学習モデルを分析し、6つの教訓を学びました。

多くのメディア記事では、「機械学習がXX業界に力を与える」という言葉を目にしますが、この「エネルギー...