GAN が「思考を偽装」してネイチャー誌に登場: 初の合成神経活動データ

[[436236]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

今回、GAN は大きく進化し、「人間の脳の思考」にまで到達しました。

そうです、それはまさに「総合的思考」であり、脳コンピューターインターフェースに送られる種類の脳活動データを生成するのです。

著者らによると、この分野でAIが使用されるのは今回が初めてだという。

さらに、この技術により、脳信号を抽出して分析するための脳コンピューターインターフェースシステムのトレーニングに必要な時間が20 倍に増加しました。

この研究は、南カリフォルニア大学の中国人博士、ウェン・シシアン氏のチームによるものです。

この論文はネイチャー誌に掲載されました。

著者の温世賢氏との詳細な会話の中で、彼は関連する研究を今後も進めていくと述べました。

この研究成果は、今後多くの神経解読問題に活用できるものであり、不眠症、自閉症、ADHD、アルツハイマー病などの疾患に対する個別介入やブロックに関する研究を継続して行っていきます。

AIを使った初の合成「思考」

しかし、疑問は、なぜ AI を使って神経活動データを「偽造」するのかということです。

人間のものをそのまま使った方が良いのではないでしょうか？

それは良いことではないかもしれません。

たとえば、今年 5 月に Nature の表紙を飾ったマインドタイピング研究では、コード名 T5 と呼ばれるこの麻痺した老人が唯一の被験者でした。

モデルに必要なトレーニングデータは、老人が心の中で一筆一筆「書いた」文字です。

頭の中でテキストの軌跡を想像することは、手で書くこととは異なり、モデルには数文字だけでなく、大量の繰り返し書き込みデータが必要です。

障害のある人に、1 日に数時間かけて反復的な作業を行うように求めるのは、疲れるだけでなく、データ収集の速度や最終的なデータセットのサイズも当然非常に限られてしまいます。

神経活動信号を解釈するためのアルゴリズムを必要とする脳コンピューターインターフェース自体が機械学習の問題です。

したがって、アルゴリズムの有効性は、当然ながら膨大な量のトレーニングデータのサポートに依存することになりますが、実際の実験では、それほど多くのデータを取得できない可能性があります。

十分なデータが利用可能であっても、被験者ごとに神経信号に違いがあります。

ある人のデータでトレーニングされたデコードアルゴリズムを別の人に適用する場合は、最初からやり直す必要があります。

さらに、同じ主題のデコードアルゴリズムであっても、時間の経過とともに劣化するため、定期的な再調整が必要になります。

さらに、脳コンピューターインターフェースの助けを最も必要とする障害者の中には、神経系の損傷のために対応する信号を送信できない人もいます。

では、上記の問題をどのように解決または改善すればよいのでしょうか?

温世賢博士は次のように述べた。

GANが完了しました。

猿に蛇の遊びをさせる

この研究の対象は2匹の小さなサルで、彼らに課された課題は非常に単純なものでした。

オブジェクトは画面上のランダムな位置に表示され、小さなサルはジョイスティックを使用して画面上のカーソルを制御し、オブジェクトに触れる必要があります。

論文に添付された写真から判断すると、それは大食蛇に似ているようですね？

サルの腕に埋め込まれた電極アレイは、神経の運動制御信号を収集します。

一次運動野のニューロンは、1～2 ミリ秒間隔で約 100 ミリボルトの断続的なパルスを放出し、ニューロンが発火するたびにピークが発生します。

この活動パターンはスパイクトレインと呼ばれます。

△実際のニューロンのスパイク電位シーケンス

研究者らはまず双方向 LSTM ネットワークを使用して GAN のジェネレーターと識別器を設計し、収集したニューラルデータとランダムなガウスノイズを使用して新しいデータを合成しました。

この研究で解決すべき重要な問題は、実際に収集された少量のデータのみを使用して、使用可能な合成データをどのように生成するかということです。

△合成スパイクトレイン

神経信号の場合、合成データの可用性には 2 つの問題があります。

個人によって生成される信号パターンは異なり、同じ個人でも神経信号が時間によって異なる場合があります。

前の手順は事前トレーニングに相当し、次のステップはこれらの状況に合わせて微調整することです。

微調整は、別のサルまたは同じサルの異なる時間のデータを組み合わせることによって行われ、最終的にはさまざまな状況に適用できる多数のスパイク列が生成されます。

最後のステップは、少量の実データと大量の合成データを使用して脳コンピューターインターフェースデコーダーをトレーニングし、効果を検証することです。

最終的に、実際のデータ20 分を使用するために、実際のデータ1 分未満と合成データのみを使用しました。

論文の最後には、この研究ではサルの運動制御信号のみを実験したが、研究で使用された方法は純粋にデータ駆動型であり、運動制御問題に対する追加の設計は行われなかったと述べられています。

言い換えれば、この論文で提案された方法は普遍的であり、他のニューラルエンコードおよびデコードの問題に使用する場合でも最小限の変更のみが必要です。

論文の筆頭著者であるデューク大学の脳コンピューターインターフェースの専門家ミゲル・ニコレリス氏と共同で行われた別の研究で、温世賢氏はサルをトレッドミルで遊ばせる実験も行った。

温世賢氏は、AIを使って思考や動作の信号を合成するのは初めてのことであり、脳コンピューターインターフェース技術のさらなる応用を促進できると述べた。

しかし、最後の疑問が一つあります。サルを実験対象として開発された方法は、人間に応用できるのでしょうか?

温世賢氏はQuantumBitとのやり取りの中で、復号アルゴリズムの観点からのみ大きな問題はないと考えており、研究においてはこの点が考慮されていると述べた。

より多くの問題は、機器と人間の生体細胞との適合性や、取得チップを正しい位置に迅速かつ安全に埋め込む方法など、脳コンピューターインターフェースのハードウェアと材料の設計に関するものです。

「脳コンピューターインターフェースの焦点は依然として科学である」

論文の筆頭著者であるウェン・シーシェン氏は、北京交通大学で学士号を取得し、現在は南カリフォルニア大学ビタビ工学部コンピュータサイエンス学科の博士課程に在籍しています。彼の主な研究分野は、AIと神経科学です。

彼の指導者は、南カリフォルニア大学のコンピューターサイエンス、心理学、神経科学の教授であり、コンピューターサイエンス学部の副学部長であるローラン・イッティです。

Laurent Itti は、主に視覚的注意、シーン理解、眼球運動制御などの分野を研究しています。また、複数のオープンソースのニューロモルフィックビジョンソフトウェアツールキットの開発者でもあります。

脳コンピューターインターフェースは、実は指導者のイッティ氏の主な研究分野ではありません。神経科学は、当初はウェン・シシアン氏自身の関心事に過ぎませんでした。

大学院在学中、彼はデューク大学の脳コンピューターインターフェースの専門家であるミゲル・ニコレリス教授の有名なTEDトークを再び見ました。そのトークでは、脳コンピューターインターフェースを使って、麻痺した若者がブラジルワールドカップで最初のゴールを心で蹴るのを助けた方法が紹介されていました。

その後、私はニコレリス教授の研究室でインターンシップをする機会を得ました。

これが私にとっての脳コンピューターインターフェースとの初めての出会いでした。

今回、この論文は、温世賢氏自身がジュネーブ大学と米国ノースウェスタン大学の研究者と共同で完成させた。

現在、ウェン・シーシェン氏は博士号を取得しようとしており、AI + 神経科学の分野で研究を続けることを選択しました。

彼はすでに国内のいくつかの大学や研究機関、また有名な脳コンピューターインターフェース企業と面接を行っており、いくつかの良いオファーを受け取っている。

脳コンピューターインターフェースと神経科学の現状と動向について、温世賢氏は次のように述べた。

脳科学市場自体には、Neuralink の脳疾患治療、Apple のメンタルヘルス評価、メタバースにおける人間とコンピューターの相互作用を改善するための Meta の Ctrl ラボハードウェアなど、大きな需要があります。
したがって、焦点は依然として科学にあり、誰が市場化に優れているかということではない。
したがって、このビジネスモデルは私たちのような科学研究者が独自のビジネスを始めるのに最も有益です。

論文の宛先:
https://www.nature.com/articles/s41551-021-00811-z

<<: Meta が 128 言語をサポートする新しい音声モデルをリリース: Metaverse での言語間コミュニケーションを示唆

>>: AIとIoT技術を活用したスマートホームの開発