中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

DeepMindと中国科学院神経科学研究所が協力した。

彼らは教師なしディープラーニングを用いて、脳が顔を認識するメカニズムを明らかにした。

具体的には、脳は顔の特徴を、年齢、性別、笑っているかどうかなどの意味的特徴に分解し、1 つのニューロンが特定の特徴に対応します。

さらに、彼らが構築したモデルは、少数のニューロンからの信号を使用して顔全体の画像を復元することができます。関連論文は、 Nature Communicationsの最新号に掲載されました。

論文の共著者は、ディープマインド社の研究者イリーナ・ヒギンズ氏と中国科学院神経科学研究所の研究者チャン・レ氏である。

他の参加者には、DeepMindの創設者ハサビス氏やカリフォルニア工科大学神経科学研究所所長のカオ・イン氏などが含まれる。

彼らの実験結果は、脳の視覚を単一ニューロンの規模で理解することが可能であることを示唆している。

この結果は、単一のニューロンはほとんど解釈不可能であり、意味のある情報は多数のニューロンの相互作用的な組み合わせの中に存在するという従来の認識を打ち破るものであると言えます。

関連分野の学者も、この記事を注意深く研究すると述べました。なぜなら、この記事を読む前に「教師なしのディープラーニングで脳のあらゆるメカニズムを説明できるか？」と尋ねられたら、ためらうことなく「望みはない」と答えるだろうからです。

人工ニューロンはマカクザルのニューロンと強い相関関係がある

霊長類の脳は視覚情報を処理する驚くべき能力を備えており、数ミリ秒以内に複雑なシーンを認識して反応することができます。

しかし、この能力の具体的な動作メカニズムは十分に研究されていません。

中国科学院のチャン・レ氏とカリフォルニア工科大学のカオ・イン氏はこれまでにマカクザルの視覚メカニズムを研究し、マカクザルの脳にある下側頭葉皮質の部分が顔の認識を担っていることを発見した。

DeepMind との今回のコラボレーションでは、顔認識を担う脳のモジュールをシミュレートするために、自己教師ありのβ-VAE (β 変分オートエンコーダ) を選択しました。

研究者らは、β-VAE モデルの動作をマカクザルの神経活動データと比較したところ、実際のニューロンと人工ニューロンの間に強い一対一のマッピングがあることを発見した。

現在、脳のメカニズムを研究するのは簡単ではありませんが、VAE の原理は非常に明確です。

エンコーダーは、入力データを潜在空間内のオブジェクトのサイズ、色、位置などのさまざまな特徴にエンコードし、デコーダーによって再構築します。

この能力は「デカップリング」または「分離」と呼ばれ、β-VAE はより強力なデカップリング能力を備えた VAE の変種です。

顔認識についても同様です。

年齢や性別から、目と目の距離や眉毛の太さなどのより具体的な詳細まで、すべてが個々の特徴に細分化されます。

β-VAE とマカクザルのニューロンの間に強い相関関係があることは、生物学的脳が顔をこのように認識する可能性が高いことを意味します。

これを検証するために、研究者らはマカクザルのニューロンからの測定データを用いてβ-VAEを訓練し、人間の顔を再構築することに成功した。

最終的に、研究チームは、機械学習から得られた最新の知見が神経科学にフィードバックされ、顔認識以外のタスク、特に抽象的推論や一般的なタスク学習に一般化されることを期待しています。

著者について

この記事の共同筆頭著者兼責任著者であるイリーナ・ヒギンズは、DeepMind の研究者であり、β-VAE モデル論文の筆頭著者です。

共同筆頭著者のChang Le氏は、中国科学院神経科学研究所の研究者です。彼の研究分野は、機能的 MRI、電気生理学的記録、数学的モデリングを組み合わせて、さまざまな種類の物体がマカクザルの下側頭葉皮質でどのように表現されるかを研究することです。

Chang Le 氏は、Caltech のポスドク研究員時代にCao Ying 氏とともに研究を行っていました。

曹英氏は2017年より、カリフォルニア工科大学の陳天橋・羅千千神経科学研究所の所長を務めています。2018年にはマッカーサー・ジーニアス・グラントを受賞し、2020年には米国科学アカデミーの会員に選出されました。

紙の住所
https://www.nature.com/articles/s41467-021-26751-5

<<: 何開明は2年ぶりに新たな論文を発表した。大規模な視覚モデルへの道を開くこの論文には、1つの数式も含まれていない。

>>: 機械学習のトレーニングをより安価かつ効率的にする方法

中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

人工ニューロンはマカクザルのニューロンと強い相関関係がある

著者について

人工知能は伝染病との戦いにおいてどのような役割を果たすのでしょうか?

自動運転の安全性の問題をどう解決するのか？まずは名前を変えてみましょう。

Googleの検索アルゴリズムがユーザーをより深く理解する方法

柔らかいロボットの進化：優しくて怖い

Python ディープラーニング: なぜディープラーニングを学ぶのか?

AI モデルの 3 種類のバイアスとその修正方法

世界最大の公開顔データセット | 清華大学と信義科技が共同リリース

充電の問題にさよなら。ロボットが新しいアイデアをもたらし、新しいトレンドを生み出す

この履歴書はAIの助けを借りて作成されたことが判明しました。！

推薦する

2021年の人工知能業界の予測

一般的な顔認識システムの端末設置と配線の包括的なレビュー

開始から中止まで: ディープラーニングにおけるモデル蒸留技術

LeCun が予測した自己教師モデルはここにあります: 最初のマルチモーダル高性能自己教師アルゴリズム

スマートなモノのインターネットを導入する時が来た

すべてを支配する 1 つのアルゴリズム! DeepMind はニューラルアルゴリズム推論を提案しています。ディープラーニングと従来のアルゴリズムの融合により、再び奇跡が起こるでしょうか?

NRS2019 インタビュー | テンセントの上級アルゴリズム研究者、唐宇堯氏: 新たな小売業のシナリオにおける人工知能の効率革命

2020 年の DevOps の 7 つのトレンド

機械学習業界の発展はなぜ「オープンソース」から切り離せないのか

「現時点で最高のヴィンセント動画AI」が登場！広告や映画に使っても問題ない。ネットユーザー：とてもスムーズ

サーバーレスコンピューティングによる機械学習の解決策は何でしょうか?