AI によるマインドリーディング: コンピューターはどのようにして脳波を復元するのか?

[[255490]]

画像出典: Visual China

「私の体は潜水鐘のように重いが、私の心は蝶のように自由に飛びたいと願っている。」

このセリフは映画『潜水鐘と蝶』からの引用ですが、雑誌『ELLE』の元編集長でジャーナリストのジャン・ドミニク氏の実体験でもあります。

ジャン＝ドミニクは脳卒中を起こして麻痺し、身体の言語機能と運動機能を失いました。自力で話すことも呼吸することもできませんでした。自由に動かせるのは片方の目と意識だけでした。そのような状況下でも、彼はエッセイ集を「執筆」した。

この本は、アシスタントがジャン＝ドミニクに各文字を順番に読み上げ、彼が瞬きしてその文字を書き留めるまで、次のようにして完成しました。このサイクルは、文字が単語、文章、断片を形成し、最終的に本に印刷されるまで続きました。

明らかに、思考を回復するこのプロセスは非常に困難で原始的ですが、少なくとも彼の魂に自由に歩き回る可能性の光を残します。

脳卒中患者や植物人間など、話す能力のない普通の人々にとっては、普通の人々とコミュニケーションをとることができないため、彼らの生活はすでに停滞しています。

テクノロジーは、彼らが「言えないことを言う」のを助け、生活の質を向上させることができるでしょうか?

答えはイエスです。科学者たちは、目に見えず、触れることのできない精神活動を自動的に「見える化」しようとしている。

コンピューターを通じて、脳内の思考を言葉に変換することができます。このような「心を読む」ことは、現実からどれほど遠いのでしょうか?

[[255491]]

『潜水鐘と蝶』（2007年）の静止画

AI によるマインドリーディング: コンピューターはどのようにして脳波を復元するのか?

まず、冷や水を浴びせましょう。想像上の単語や文章を音声に変換するという点では、現在のコンピューターはまだそのような奇跡的な能力を発揮できません。

しかし、一部の研究者は、AI を使って、人が非常に静かに聞いたり話したりした文章を復元することに成功しています。

この技術の実装原理は複雑ではありません。人間の発声運動は、脳の神経細胞からの電気信号が顎、唇、声帯などの部分を刺激することによって生み出されます。

したがって、関連する脳領域の神経運動信号が AI システムに送信される限り、ディープラーニングネットワークは、信号を対応する言語または口の動きと層ごとに照合して、具体的に何が言われたかを推測し、その後、音声合成装置がこれらの信号を可聴な音声に変換します。

それで、この技術はどれほど信頼できるのでしょうか?

コロンビア大学のコンピューター科学者ニマ・メスガラニ氏は、物語と数字に関連する聴覚皮質のデータセットを聞き手に「聞かせる」という実験を行ったところ、75%の人が数字を正しく識別することができた。

同様の実験は、カリフォルニア大学サンフランシスコ校の研究グループによっても成功しました。てんかん患者が文章を声に出して読んでいる間の脳の活動を記録し、ディープラーニングネットワークを使用して文章に再構築しました。結果、AI によって再現された文章の 80% が正しいことが示されました。

神経信号を文字言語に変換することが実現可能であることが証明された今、次のステップは研究室の枠を超え、声なき人々が「自分の考えを話す」ことを本当に支援することです。

MIT の研究者たちは、ウェアラブルデバイスと関連するコンピューティングシステムで構成される埋め込み型知能強化デバイスを開発しました。

装置内の電極は、内部の発話によって引き起こされる顎と顔の筋肉の動きの信号を拾い、その信号は神経信号を特定の単語と関連付ける機械学習システムにフィードバックされます。

骨伝導ヘッドホンを使用すると、会話を中断することなく、顔の振動を通じて外部情報を内耳に伝達することもできます。

現在、聞き手自身に合わせてカスタマイズされるこのウェアラブルデバイスの平均文字起こし認識精度は92％以上に達しています！

前の部分が依然として補助医療の範疇に属する場合、ここには不正行為の兆候があります。たとえば、チェスのゲームで、プレイヤーがこのようなヘッドフォンを着用すると、気づかれずにコンピューターの指示を「聞く」ことができるのではないでしょうか。

[[255492]]

MIT メディアラボの流体インターフェースグループの研究者 Arnav Kapur 氏が、AlterEgo プロジェクトを紹介します。

「心を読む」ことができる脳コンピュータ：脳同士のコミュニケーションは現実になるか？

AI を使って脳波を読み取るというのは、クールな技術であるだけでなく、さらに重要なことに、その応用範囲は広大です。

理論的な観点からは、生物学的な発声器官に頼らずにコミュニケーションを実現できるため、医療、産業、犯罪捜査などの分野での相互作用に新たな可能性が生まれます。例えば：

1. 声を上げられない患者に声を与える。不幸にも、人間が脳卒中、脳外傷、脊髄損傷、または ASL 運動ニューロン疾患 (スティーブン・ホーキングは ASL 患者です) を患うと、脳は直接発話の生成を刺激することができなくなり、患者は沈黙のうちに亡くなるしかありません。将来、脳音声合成装置が失声症患者の言語機能回復に役立てば、患者の治療と生活に大きな助けとなるだろう。

2. 特殊な環境下での作業支援。空港のジェット機の騒音、航空母艦のコックピット、発電所や印刷工場の作業場、保護具を着用する研究室など、すべての作業環境で通常のデシベルでの言語コミュニケーションが保証されるわけではありません。これらの環境は、騒がしすぎたり静かすぎたりして、重要な情報を聞き逃しがちです。この特殊な環境下では、脳音声転写技術によりコミュニケーション不足の問題を効果的に解決でき、聴覚障害や言語障害のある従業員も障害なく他者とコミュニケーションをとることができます。

3. 聴覚の再建から視覚の再建へ。同様の AI ニューラルネットワークは、テキストや音声の書き起こしだけでなく、記憶にある顔を復元するなど、ぼやけた画像を復元するようにトレーニングすることもでき、犯罪捜査や事件解決に非常に効果的です。

4. 心を使って義肢を操作します。音声転写装置を装着すると、切断者/下半身麻痺者は考えるだけで義肢を自由に操作できるようになります。これは、音声で指示を出すよりも受け入れやすいのは明らかです。

5. 高度に自動化されたインテリジェントアシスタント。この BCI デバイスの大きな役割は、照明の制御、読書メモの作成、VR ゲームの指示の発行、さらには車両の制御など、人の内なる思考に基づいてさまざまなタスクを直接実行できることです。

日産はすでに、ドライバーの脳波をモニターする同様のヘッドフォンを提供している。たとえば、ドライバーがブレーキをかけようとしていることを検出すると、デバイスはドライバーがブレーキをかける前にブレーキを開始し、手動操作よりも最大 0.5 秒速い反応時間を実現します。 Facebook でさえ、ユーザーが脳波を使って Facebook Messenger メッセージを送信できるようにする方法を研究する、心を読むプロジェクトを立ち上げました。

全体として、この想像力豊かな技術は、目に見えない意識を具体的な信号に変換し、人間の身体の「潜水鐘」の多くの制限から解放して呼吸できるようにするという長年の課題を解決します。

しかし現実的に考えると、テクノロジーはゆっくりと成熟しつつあるとはいえ、美しい理想が現実になるにはまだ長い道のりがあります。

止まることのないテクノロジーの翼

学界とビジネス界の両方がこの「心を読む」技術に熱心であるにもかかわらず、実際の応用においては、このタイプの言語転写脳コンピューターインターフェースには、一つずつ対処する必要がある多くの隠れた危険性がまだ残っています。

1. 移植が難しすぎる。この技術の推進に対する最も直接的な障害は、正確な実験データを得るために、被験者が頭蓋骨を切開して脳の関連領域に電極を埋め込む必要があることである。侵襲的な解決策は、実験に参加する意欲を大幅に低下させ、実際の適用においては、受信者に拒絶反応や感染などの予測できないリスクももたらします。

2. 語彙データが不十分です。 EEG から音声への転写の有効性は豊富な語彙に依存しますが、参加者ごとに同じ言語のニューロンへのマッピングが異なるため、AI システムによって学習および推論された結果を普遍的に適用することは困難です。転写の正確さは、さまざまな参加者向けに独自の思考コーパスを特別にカスタマイズすることによってのみ保証できるため、大規模に普及させることは困難です。

3. 商業化の難しさ。デバイスの埋め込みの難しさや、システムのカスタマイズによって生じる数多くの障壁により、このデバイスは、少数の重病患者や一部の熱狂的なオタクなど、非常にニッチなアプリケーショングループでのみその価値を発揮できることになります。

4. 倫理的なジレンマ。たとえ機器やシステムの欠陥がでっち上げられたとしても、そのような機器を公共の場で着用したいという人はほとんどいないだろうし、他人が不快に感じないようにするのは難しいだろう。

これは、Google Glass が初めて登場したときと少し似ています。デバイスはあったものの、それに対応する行動規範がなかったため、多くの人がプライバシーの侵害を心配し、疑問を抱きました。同様に、脳波による「心を読む」ことがプライバシーや別の種類の不公平をもたらすかどうかについては、それを裏付けるために多くの社会学的研究が必要になるだろう。

つまり、「AIによる心を読む」は、その社会的価値や商業的可能性を人々に容易に感じさせることができるが、その応用には明らかにまだ多くの問題がある。脳を通じてコミュニケーションをとろうとすれば、少なくとも数十年はかかるだろう。

それが私たちにもたらすのは、おそらく、問題を解決する非常に実現可能な方法だ。人間の体は潜水鐘のようにゆっくりと深海に沈んでいく運命にあるのだが、少なくとも「考える」という蝶に、もう少しの自由を与えることができるのだ。

<<: 数学者は解けないコンピュータの問題を発見した

>>: JD Digits JDDコンペティションが終了、「自動運転」と「人口動態国勢調査」の世界チャンピオンが発表