Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature Communications に最近発表された新しい研究によると、高度な視覚認知機能は訓練されていないニューラル ネットワークでも自然に発生する可能性があり、顔画像に対する視覚選択性は完全に訓練されていないディープ ニューラル ネットワークでも発生する可能性があることがわかりました。

顔を検出して認識する能力は、動物の社会的行動(集団生活を維持するために集団内の異なるメンバーが協力して行う行動)にとって非常に重要です。この能力は、単一ニューロンまたは複数ニューロンレベルでのニューロンチューニング(感覚、協調、運動、認知などの情報を選択的に表現するニューロンの特性)に由来すると考えられています。

科学者たちは、さまざまな種の若い動物の顔に選択的に反応するニューロンを観察し、白熱した議論を巻き起こしている。顔選択性ニューロンは脳に組み込まれているのか、それとも視覚的な経験に依存しているのか?

最近、韓国科学技術院(KAIST)バイオ脳工学科のペク・セボム教授率いる研究チームが、この問題に関して非常に参考になる成果を発表しました。彼らは、まったく訓練されていないディープニューラルネットワークでも顔の画像に対して視覚的な選択性を生み出すことができることを発見した。具体的には、学習がまったく行われていない状態で、ランダムに初期化されたディープニューラルネットワークにおけるニューロン活動が観察され、顔画像が選択され、生物学的脳で観察されるものと同様の特徴が示されました。

この新たな研究はネイチャー・コミュニケーションズ誌の12月号に掲載された。これは、生物学的および人工的なニューラル ネットワークにおける認知機能の発達の基盤となるメカニズムについて明快な洞察を提供するとともに、初期脳機能 (感覚経験以前) の起源についての理解にも大きな影響を与えます。

論文リンク: https://www.nature.com/articles/s41467-021-27606-9.pdf

研究チームは、視覚皮質の腹側ストリームの特性を捉えたモデルニューラルネットワークである AlexNet45 を使用して、ランダムに初期化された DNN のさまざまな条件下で顔の選択性が確実に現れることを発見しました。さらに、顔選択指数(FSI)は、脳内で観察される顔選択性ニューロンのものと同等でした。

逆相関 (RC) 法と生成的敵対ネットワークの助けを借りて得られた優先特徴画像は、顔選択ユニットが非選択ユニットとは異なり、顔のような構成に対して選択的であることを示しています。さらに、顔選択ユニットにより、ネットワークは顔検出を実行できるようになります。

興味深いことに、研究者らは、顔以外のさまざまなオブジェクトに対するユニット選択性が、訓練されていないニューラル ネットワークでも自然に発生する可能性があることも発見しました。つまり、顔選択性は特別な種類の視覚調整ではないかもしれませんが、さまざまなオブジェクト カテゴリに対する選択性は、訓練されていない DNN でも自然に発生し、ランダムなフィードフォワード接続によって自発的に生成される可能性があります。

これらの結果は、初期の未訓練ネットワークで開発されたランダムなフィードフォワード接続が、原始的な視覚認知機能を初期化するのに十分である可能性があるシナリオを示唆しています。

パイク教授は次のように述べた。「私たちの研究結果は、学習がまったく行われていない場合でも、階層的なフィードフォワード投影回路に埋め込まれた統計的複雑性から、生来の認知機能が自発的に出現する可能性があることを示唆しています。私たちの研究結果は、生物学的および人工的なニューラル ネットワークにおける生来の機能の発達の背後にあるメカニズムについて、幅広い概念的進歩と洞察をもたらし、知能の出現と進化の謎を解明するのに役立つ可能性があります。」

<<:  科学研究ビッグデータにおける人工知能技術の応用

>>:  自動運転事故を回避するために、CV 分野では物理的な攻撃をどのように検出できるでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

中国でApp Storeのランキング操作を禁止しアルゴリズムを調整

国内アプリプロモーション機関APPYINGはこのほど、アップルのApp Store Chinaランキ...

大規模言語モデルに基づくインテリジェントエージェントのモデリングとシミュレーション:レビューと展望

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

海洋工学における生成AI:独自のデータセットが不十分なため、実用化が制限されている

現代のコンピューティングは造船や海洋工学における設計および建設プロセスを大幅に改善していますが、限ら...

人工知能と5Gの組み合わせは医療業界の診断と治療のモデルとプロセスを変えるだろう

COVID-19の世界的パンデミックにより、医療におけるテクノロジーの活用が加速しました。 2021...

Daguan Data: 推奨システムアルゴリズムの再ランキングの実践

インターネットの出現と普及は、大量の情報をユーザーにもたらし、情報化時代の情報需要を満たしました。し...

機械学習は計算化学研究の発展にどのように役立つのでしょうか?

過去数年間、化学研究は、個人の経験と文献から得られた過去の研究結果を使用する実験方法のみに焦点を当て...

「ロボットが私にそうさせた」:ロボットは人々にリスクを取るよう促すことができると研究で判明

[[404036]] 「仲間からのプレッシャーがリスクの高い行動につながることはわかっています。オン...

...

Ma Yi、LeCun、Xie Saining がマルチモーダル LLM の重大な欠陥を明らかにしました。画期的な研究により視覚的理解が大幅に向上

サム・アルトマンは、将来の AI テクノロジーが人類に利益をもたらすためには、大規模言語モデルのマル...

肖陽華:数千の産業に対応する大規模モデルに向けて

現在、私たちは大型モデル技術と産業発展の中期思考段階にあります。この段階は、広範囲かつ深い注目を集め...

Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

有用か無害かLlama-2-chat は、セキュリティ フィルターに関して過度に敏感な動作を示すこと...

...

市場レポートの予測: 2027年には世界の生体認証市場は1,000億ドルに近づく

近年、人工知能の継続的な成熟に伴い、生体認証技術は生活のあらゆる分野に浸透し、コストが削減され、効率...

Python は R を抜いて、データ サイエンスと機械学習プラットフォームで最も人気のある言語になるのでしょうか?

最近、kdnuggets はデータ サイエンスと機械学習言語の使用に関するアンケート調査を実施しまし...

7つの変革的技術トレンド:第4次産業革命をリードする

テクノロジーは常に進化し、私たちの未来を形作っています。第四次産業革命は、さまざまな産業に革命をもた...