中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

DeepMind中国科学院神経科学研究所が協力した。

彼らは教師なしディープラーニングを用いて、脳が顔を認識するメカニズムを明らかにした。

具体的には、脳は顔の特徴を、年齢、性別、笑っているかどうかなどの意味的特徴に分解し、1 つのニューロンが特定の特徴に対応します。

さらに、彼らが構築したモデルは、少数のニューロンからの信号を使用して顔全体の画像を復元することができます。関連論文は、 Nature Communicationsの最新号に掲載されました。

論文の共著者は、ディープマインド社の研究者イリーナ・ヒギンズ氏と中国科学院神経科学研究所の研究者チャン・レ氏である。

他の参加者には、DeepMindの創設者ハサビス氏やカリフォルニア工科大学神経科学研究所所長のカオ・イン氏などが含まれる。

彼らの実験結果は、脳の視覚を単一ニューロンの規模で理解することが可能であることを示唆している。

この結果は、単一のニューロンはほとんど解釈不可能であり、意味のある情報は多数のニューロンの相互作用的な組み合わせの中に存在するという従来の認識を打ち破るものであると言えます。

関連分野の学者も、この記事を注意深く研究すると述べました。なぜなら、この記事を読む前に「教師なしのディープラーニングで脳のあらゆるメカニズムを説明できるか?」と尋ねられたら、ためらうことなく「望みはない」と答えるだろうからです。

人工ニューロンはマカクザルのニューロンと強い相関関係がある

霊長類の脳は視覚情報を処理する驚くべき能力を備えており、数ミリ秒以内に複雑なシーンを認識して反応することができます。

しかし、この能力の具体的な動作メカニズムは十分に研究されていません。

中国科学院のチャン・レ氏とカリフォルニア工科大学のカオ・イン氏はこれまでにマカクザルの視覚メカニズムを研究し、マカクザルの脳にある下側頭葉皮質の部分が顔の認識を担っていることを発見した。

DeepMind との今回のコラボレーションでは、顔認識を担う脳のモジュールをシミュレートするために、自己教師ありのβ-VAE (β 変分オートエンコーダ) を選択しました。

研究者らは、β-VAE モデルの動作をマカクザルの神経活動データと比較したところ、実際のニューロンと人工ニューロンの間に強い一対一のマッピングがあることを発見した。

現在、脳のメカニズムを研究するのは簡単ではありませんが、VAE の原理は非常に明確です。

エンコーダーは、入力データを潜在空間内のオブジェクトのサイズ、色、位置などのさまざまな特徴にエンコードし、デコーダーによって再構築します。

この能力は「デカップリング」または「分離」と呼ばれ、β-VAE はより強力なデカップリング能力を備えた VAE の変種です。

顔認識についても同様です。

年齢や性別から、目と目の距離や眉毛の太さなどのより具体的な詳細まで、すべてが個々の特徴に細分化されます。

β-VAE とマカクザルのニューロンの間に強い相関関係があることは、生物学的脳が顔をこのように認識する可能性が高いことを意味します。

これを検証するために、研究者らはマカクザルのニューロンからの測定データを用いてβ-VAEを訓練し、人間の顔を再構築することに成功した。

最終的に、研究チームは、機械学習から得られた最新の知見が神経科学にフィードバックされ、顔認識以外のタスク、特に抽象的推論や一般的なタスク学習に一般化されることを期待しています。

著者について

この記事の共同筆頭著者兼責任著者であるイリーナ・ヒギンズは、DeepMind の研究者であり、β-VAE モデル論文の筆頭著者です。

[[435003]]

共同筆頭著者のChang Le氏は、中国科学院神経科学研究所の研究者です。彼の研究分野は、機能的 MRI、電気生理学的記録、数学的モデリングを組み合わせて、さまざまな種類の物体がマカクザルの下側頭葉皮質でどのように表現されるかを研究することです。

[[435004]]

Chang Le 氏は、Caltech のポスドク研究員時代にCao Ying 氏とともに研究を行っていました。

[[435005]]

曹英氏は2017年より、カリフォルニア工科大学の陳天橋・羅千千神経科学研究所の所長を務めています。2018年にはマッカーサー・ジーニアス・グラントを受賞し、2020年には米国科学アカデミーの会員に選出されました。

紙の住所
https://www.nature.com/articles/s41467-021-26751-5

<<:  何開明は2年ぶりに新たな論文を発表した。大規模な視覚モデルへの道を開くこの論文には、1つの数式も含まれていない。

>>:  機械学習のトレーニングをより安価かつ効率的にする方法

ブログ    
ブログ    

推薦する

...

CIIE 2019 サノフィと朱江知能が共同で医療のデジタル未来を創造

第2回中国国際輸入博覧会が11月10日に成功裏に終了した。医療機器と医薬健康展示エリアでは、世界有数...

量産型マスターコントロールチップのネットワークセキュリティ設計

「サイバーセキュリティ」という用語は、ネットワークシステムにおけるハードウェア、ソフトウェア、データ...

「Singularity」AIコンピューティングプラットフォームの詳細を公開!それは4年前のマイクロソフトの古いプロジェクトの復活であることが判明した

AI サービス プラットフォームのコストと効率の問題は、大手サービス プロバイダーが解決と改善に懸命...

ネットで熱い議論:感染拡大から半年でディープラーニングの求人数が激減

[[340795]]ビッグデータダイジェスト制作近年、ディープラーニング エンジニアは市場で最も人気...

Java はなぜ機械学習やディープラーニングを実際にサポートできないのでしょうか?何が欠けている?

チームに ML を導入させるにはどうすればよいのでしょうか。また、実行している既存のシステムと ML...

IoTロボットが製造業と医療現場の危険を防止

IoT とロボティクスはそれぞれ単独でもビジネス組織に多くの利点をもたらしますが、組み合わせて使用​...

世界的なAI人材不足により、各国間の協力とトレーニングが増加

文/張燕現在、世界で人工知能教育が発達している国や地域では、人工知能人材の育成を徐々に国のトップレベ...

...

AIがデータセンターの設計をどう変えるか

AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており...

Transformer 機械学習モデルとは何ですか?

翻訳者 | 李睿校正:孫淑娟近年、Transformer 機械学習モデルは、ディープラーニングとディ...

ChatGPT の残念な欠点 10 選: チャットボットの限界を探る

ChatGPT は、翻訳、作詞作曲、リサーチ、コーディングなど、さまざまなスキルに優れています。しか...

ナレッジグラフとディープラーニングが「出会う」とき

著者: Xiao Yanghua、復旦大学コンピュータ科学技術学院准教授、博士課程指導教員、上海イン...

ボストンダイナミクスのスポットが工場に入り、作業を開始しました!現代自動車はそれを夜間警備に配備し、工場の安全管理官に変身させる

ボストン・ダイナミクスのロボットは見た目はかっこいいのですが、使い道がないので、好評は得られても人気...

AIOpsの構築と導入を成功させるための3つの要素

今日、ビッグデータ アプリケーションがビジネスのあらゆる側面で急増しているため、IT チームは膨大な...