マインドタイピングがネイチャーの表紙に登場! 99%以上の正確さで1分間に90文字を書く

マインドタイピングがネイチャーの表紙に登場! 99%以上の正確さで1分間に90文字を書く

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

脳コンピューターインターフェースにおいてこれほど早く大きな進歩が起こるとは思ってもいませんでした。

『ネイ​​チャー』の表紙にもなりました。

下半身麻痺の患者は「心」を使って文章を入力し、約0.5秒で文字を出力することができます。

精度も驚異的で、 99.1%にも達します。

彼がしなければならないのは、頭の中で文字を「手書き」することだけです。すると、システムが自動的に文字を認識して生成し、彼は 1 分間に 90 文字を書くことができます。

書道はそれほど上手ではありませんが、少なくとも自然に「恵まれて」います。

注目すべきは、この前に患者は別のテスト プロジェクトで入力するために「心」でカーソルを移動しようとしたが、1 分間に正しく入力できた文字は 13.4 文字だけだったということです。

この研究は発表されるとすぐに、学界やネットユーザーから大きな注目を集めました。

ワシントン大学の教授は祝福の言葉に加えて、「私のタイピングはそれよりも遅いです」とさえ言いました。

RNNは変化をもたらした

コードネームT5のこの老人の脳には、それぞれ96個の電極を含むブレインゲート社の電極アレイが2つ埋め込まれている。

最初の困難は、実験の開始直後に遭遇しました。それは、ユーザーがいつ手紙を書き始めたかを認識する方法でした。

最終的に、もともと音声認識に使用されていたモデルがこのタスクを完了できることが発見されました。

この疑問に取り組んだ後、研究者たちは、1つの文字を書くときに観察される脳の活動は比較的固定されており、常に集中していることを発見しました。

また、「b」や「p」のような似た形の文字を書くときに使用する領域は近いです。

何年も麻痺が続いた後でも、運動皮質における手書きの神経表現は消えないようです。

手動で注釈を付けた後、これらのデータは元のデータセットとして使用できます。

次はアルゴリズムです。研究者はリカレントニューラルネットワーク(RNN) を選択しました。

一般的なフィードフォワードニューラルネットワークと比較すると、RNN はデータシーケンス内の各要素に対して同じタスクを実行し、計算結果は以前のすべての結果に依存するため、ループにちなんで名付けられています。

RNN は連続データの予測に優れているため、この研究では文章を連続的に記述するのに適しています。

RNN は強力ですが、大量のデータが必要で、そうでないと過剰適合が発生する可能性があるという欠点があります。

この研究に参加した唯一の被験者は老人であり、彼はデータを提供するために毎日数時間かけて大量の反復的な書き込みを行うことを望まなかった。

しかし、それは問題ではありません。データ拡張もあります。各画像データに回転、拡大縮小、反転などのわずかな変更を加え、データの多様性を高めることです。

[[399338]]

26文字の他に、英語を入力するときに必要な句読点がいくつかあります。例えば、研究者は老人にスペースを>に置き換えるように依頼しましたが、英語のピリオドにはドットが1つしかなく、区別がつきにくいため、老人は代わりに~を使用しました。カンマ、セミコロン、疑問符もあります。

しかし、この研究には数字が含まれていませんでした。おそらく研究者たちはzと2を区別するのが少し難しいと感じたため、次回の解決に残したのでしょう。

トレーニングデータは当初 242 文でしたが、毎日増加し、合計 572 文、31,472 文字になりました。

最後に、一部の英語の文字があまりにも似ているという問題を解決するために、研究者はテスト用の脳コンピューターインターフェース専用のアルファベットのセットも設計しました。精度ははるかに高くなりますが、学習コストがかかります。

文字精度は最大99.1%

次は、ボランティアによるテスト段階です。

画面上の指示に従って、ボランティアは脳内で文字を一文字ずつ書き写し、文字が認識されて画面上に生成されました。

テスト結果によると、脳が文字を「書く」時間と文字が画面に表示される時間の間に約 0.4 ~ 0.7 秒の遅延があることがわかりました。

全体として、ボランティアは 1 分間に平均 18 語、90 文字を入力でき、文字エラー率はわずか 5.9% です。

携帯電話の自動修正機能に似た予測言語モデルに通した後、文字の精度がさらに99.1%まで向上しました。

単語エラー率も 25.1% から 3.4% に低下しました。

さらに、ボランティアたちは自分で文章を「書き写す」という創作も行い、その結果、1分間に73.8文字を入力することができました。予測言語モデルによる修正後、正確率は97%を超えました。

最後に、限界に挑戦するために、研究者たちは、ユーザーの文章全体を中央で処理する前に処理する新しい RNN もトレーニングしました。この方法の精度は最大 99.83% ですが、ユーザーはリアルタイムのフィードバックを得ることができません。

実際のところ、これはBrainGateプロジェクトの一部です。これは、ブラウン大学やアメリカのバイオテクノロジー企業サイバーキネティクスを含む複数の機関によるコンソーシアムのプロジェクトであり、脳コンピューターインターフェース技術に焦点を当て、神経疾患、負傷、または四肢切断を患う人々のコミュニケーション、運動、自立の回復に取り組んでいます。

これまで、このプロジェクトでは、脳コンピューターインターフェース信号の無線伝送を実現し、患者が実験室環境を離れ、自宅で簡単にオンラインビデオを視聴できるようにしました。

スタンフォード大学ハワード・ヒューズ医学研究所(HHMI)の研究者で論文の著者の一人であるクリシュナ・シェノイ氏は、この研究の最大の革新は手書きのメモに関連する脳信号を解読し、下半身麻痺の患者が迅速かつ正確にタイピングできるようにしたことだと述べた。

論文の筆頭著者であるスタンフォード大学のフランク・ウィレット博士は、研究全体のコードと神経データをオープンソースにすると述べた。

現時点では、これは完全な臨床商用システムではなく、1 人の人間に対してのみテストされています。

今後は、テストグループの拡大、入力機能の拡張(編集、削除)、文字セットの拡張(大文字や他の言語など)などの領域で改善を行っていきます。

中国語を夢見ることは可能でしょうか?

[[399339]]

それ以外にも、コストやリスクなど、議論する価値のある要素が他にもあります。

ワシントン大学バイオエンジニアリング学部のパヴィトラ・ラジェスワラン研究員と電気・コンピュータエンジニアリング学部のエイミー・オーズボーン研究員は、脳に電極を埋め込むコストとリスクが妥当であるかどうかを証明するには、この研究はまだテストする必要があると述べた。

恩恵を受けるのは麻痺患者だけではない

麻痺した患者だけでなく、タイピングが困難な他の怪我を負った人々も興奮の表情を見せました。

たとえば、閉じ込め症候群は、一部の神経が損傷し、その結果、一部の身体機能が退化または消失する状態です。患者は意識があるものの、言語によるコミュニケーションができません。

マウスやタイピングの不適切な使用によって引き起こされるマウスハンドや腱鞘炎などの反復性ストレス障害(RSI) もあります。

あるRSI患者は「マウスホイールを模倣できる機能も必要だ」と述べた。しかし、ネットユーザーは、フットペダルや視線追跡を使用する方が、侵襲的な脳コンピューターインターフェースよりもはるかに簡単だと答えた。

このニュースを見て、ネットユーザーたちも感動した。

手で書くことを想像することと、心の中で直接軌跡を想像することは異なる感覚であり、どちらが認識しやすいのかわからない人もいます。

心の中で書いてみてはいかがでしょうか? (手動犬頭)

論文リンク:
[1] https://www.nature.com/articles/s41586-021-03506-2

<<:  電子顧客サービスの管理不足は問題を解決することはできず、トラブルを増やすだけです

>>:  著者の半数以上が中国人です! Google Researchの画像表現モデルALIGNがImageNetを支配

推薦する

...

中国人工知能産業発展連盟メディアプロジェクトグループが設立され、51CTOは連盟の最初の専門メディアの1つになりました。

中国人工知能産業発展連盟メディアプロジェクトグループの設立会議が2018年1月25日に北京で開催され...

シングルテナント AI ファクトリーは最新のデータセンタートレンドでしょうか?

コロケーション データ センターの標準的な構造は、数十または数百の顧客が同時に異なるアプリケーション...

2026年までにIoT分野のAIサービス収益は36億ドルに達する

iottechnewsによると、IoT分野の人工知能(AI)と機械学習(ML)サービスは年間40%成...

アメリカ人教授がAI会議での不正行為を暴露:著者は査読者と共謀し、ゴミ論文も査読を通過

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIOps で IT 運用にインテリジェンスを組み込む方法

クラウド プラットフォーム、マネージド サービス プロバイダー、デジタル変革を進めている組織は、AI...

...

人工知能時代のセキュリティ専門職とは?

人工知能の時代におけるセキュリティ専門職は何かという問題は、徐々に人々が直面しなければならない問題に...

...

GPT-3は創造性に欠けるにもかかわらず、わずか20分で合格できる大学論文を書いた。

GPT-3で書かれた論文は通過したのでしょうか?教育リソースウェブサイトEduRefがこれに関する...

...

顔認識はより便利で安全になるべきだ

[[348313]]ノースウェスタン工科大学の学生は顔をスキャンして図書館に出入りします。新華社通信...

AIは英語のエッセイを添削できますか? IELTS、CET-4、CET-6の採点、コメント、エラー修正が必要です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ザッカーバーグは7億ドルの配当金を受け取り、Metaの株価は14%急騰、オープンソース計画は成功したのか?

メタの株価は木曜日の時間外取引で14%近く上昇し、史上最高値に達したが、同社は初の配当を発表した。最...

駐車問題を解決する 3 つの最善の方法をご存知ですか?

近年、都市部の駐車場の問題はますます顕著になっており、混乱した駐車が頻繁に発生し、人々の移動や生活に...