人間の目に匹敵する視覚:この画期的な光学センサーは人間の網膜を模倣し、AIに大きな進歩をもたらすことが期待されています。

人間の目に匹敵する視覚:この画期的な光学センサーは人間の網膜を模倣し、AIに大きな進歩をもたらすことが期待されています。

視覚、聴覚、嗅覚、味覚、触覚は、人間の最も基本的な五感です。その中でも、視覚は極めて重要です。結局のところ、種が進化するにつれて、人間の最も繊細で複雑な器官である目は、比類のない知覚能力を持っています。

神経科学と認知心理学の研究によると、外部情報の80%以上は視覚を通じて脳に入り込むことが分かっています。

世代から世代へと技術革新が進むにつれ、人間の目を模倣しようとする試みが次々と生まれています。

2015年、米国ミネソタ州に住むアレン・ズデラドという68歳の男性が、10年間の失明の後、「バイオニックアイ」によって視力を取り戻した。

2020年5月、香港科技大学のファン・チヨン氏のチームは、米国のカリフォルニア大学バークレー校およびローレンス・バークレー国立研究所の研究者グループと共同で、網膜の問題に対する最新の解決策を提案し、さらには人間の目を上回る複数の性能を備えたバイオニックアイを開発した。

[[357284]]

つい最近、米国の公立研究大学であるオレゴン州立大学は、光学センサーの分野で大きな進歩を遂げました。視野の変化を感知する人間の目の能力にさらに近いセンサーがついに登場したのです。

オレゴン州立大学は次のように述べた。

  • このセンサーは、画像認識、ロボット工学、人工知能の分野における大きな進歩です。人間の目のような画期的な光学センサーは、人工知能の発展における重要な一歩です。

新しい網膜センサーの構築

2020年12月8日、関連する研究成果が「ペロブスカイト網膜型センサー」と題してJournal of Applied Physics Expressに正式に掲載されました。論文の著者は、オレゴン州立大学工学部の研究員で電気・コンピュータ工学科助教授のジョン・ラブラム氏と大学院生のシンシア・トルヒージョ・ヘレラ氏です。


  • 最先端のスーパーコンピュータでさえ、人間の脳の複雑さに匹敵することはできません。

当初、この事実に基づいて、ニューロモルフィック コンピューティングの分野での研究が始まりました。その設計は、機械学習タスクを実行する際に従来のコンピューターを上回る性能を発揮することを目指しています。その原理は、一言でまとめると、人間の脳 (の一部) をハードウェアにコピーするということです。

この論文では、近年この分野で大きな進歩があったにもかかわらず、ニューロモルフィック プロセッサに提供されるほぼすべての入力信号が依然として従来のフォン ノイマン コンピュータ アーキテクチャ向けに設計されていることを紹介しています。

研究チームは、単純な光感応コンデンサを設計し、光刺激に対する反応を特徴づけました。

下の図 a に示すように、構造は二重層誘電体に基づいています。

  • 底部の二酸化ケイ素: 二酸化ケイ素は絶縁性が高く、基本的に光に反応しません。
  • 一番上にあるのはペロブスカイト、メチルアンモニウムヨウ化鉛 (MAPbI3) です。これは、光伝導応答が大きく、光を当てると誘電率が大きく変化する化合物で、光を当てると静電容量を変えることができる誘電体の理想的な候補となります。

電極:

  • 下部電極は高濃度にドープされたシリコンで、基板として機能します。
  • 上部電極は熱蒸着によって堆積された 15nm の金で、接触抵抗が高くても電気を伝導しながら光に対して半透明になるほど十分に薄くなるように設計されています。

ジョン・ラブラム氏はこう語った。

  • これまで、人間の目を模倣したデバイス(網膜視覚センサー)を作成する試みは、ソフトウェアまたはより複雑なハードウェアに依存していました。しかし、私たちが設計したこの新しいセンサーの動作には、基本設計にペロブスカイト半導体の極薄層が組み込まれています。ペロブスカイトは光にさらされると、強力な電気絶縁体から導体に変化します。太陽エネルギーを開発する可能性を秘めており、近年、学術界でもペロブスカイトに関する広範な研究が行われています。

上記の構造に基づいて、外部抵抗器と直列に接続すると、コンデンサが充電/放電されるときに抵抗器の両端の電圧降下(電位差とも呼ばれます)が一時的に急上昇し、その後平衡値に戻ります。つまり、照度が変化するとセンサーにスパイクが発生し、それ以外のときはゼロ電圧が出力されます (上の図 d を参照)。

研究チームが設計した感光性コンデンサは、設計と使用目的の両方において他の科学チームによって開発された従来のフォトコンデンサとは異なります。フォトコンデンサは太陽放射からのエネルギーを蓄えるように設計されているのに対し、上記のセンサーはニューロモルフィック コンピューティング用の光刺激の変化を検出するように設計されています。

人間の目の知覚を模倣することでよりリアルになる

では、上記のセンサーは実際に人間の目をどの程度模倣しているのでしょうか?

まず、研究者たちは、センサーに適用される光刺激としてビデオを再生することにより、大規模なアレイをシミュレートしました。

結果は次のことを示しています:

  • ビデオの静止部分に対応して、センサーはより暗いビデオを出力します。
  • センサーは、ビデオの動きのある部分に応じて明るいビデオを出力します。
  • 光がない状態でゆっくりと移動すると、センサー出力の明るい領域に「ゴースト」効果が発生します。

センサーが動画像に対して非常に明白な反応を示すことがわかります。

研究者らはその後、別のテストとして、特定の角度で配置された光刺激をセンサーに適用した。

この実験は、1950年代と1960年代に科学者が猫の特定のニューロンが特定の角度で配置された光刺激に強く反応することに気づいたという発見に触発されたものである。科学者たちは、網膜内の一部の細胞の特定の配置が光刺激に反応して過分極と脱分極を引き起こすと考えています。

そのため、研究者たちは、コンデンサ (C センサー) の電圧降下と抵抗器 (R センサー) の電圧降下という 2 つの値を測定することを選択しました。


結果は上の図に示されています。このセンサーは、特定の方向の刺激に対してより強く反応します。

上記の 2 つの実験は、このセンサーが人間の目の知覚を模倣する能力が確かに強力であることを示しています。

それだけでなく、研究者たちは、これはセンサーなので複雑な読み出しアルゴリズムや後処理を必要とせず、センサーが向けられている物体の方向に応じて電圧を直接出力できると考えています。

ジョン・ラブラム氏はこう語った。

  • 新しいセンサーはニューロモルフィック・コンピューターと完璧に連携し、自動運転車、ロボット工学、高度な画像認識などの次世代の人工知能アプリケーションを強化することになります。

<<:  安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

>>:  IoT セキュリティ: RSA 暗号化および復号化アルゴリズム

ブログ    

推薦する

コード生成のための文法ベースの構造化CNNデコーダー

まとめコード生成は、プログラム記述を実行可能なプログラミング言語のソース コードにマッピングします。...

2020年のディープラーニングに必要なGPUは?48Gのビデオメモリが推奨

ご存知のとおり、現在業界で最も強力な (SOTA) ディープラーニング モデルは、膨大な量のビデオ ...

Facebookは、さまざまな機械学習の問題に適用できる、勾配フリー最適化のためのオープンソースツール「Nevergrad」をリリースしました。

自然言語処理や画像分類から翻訳など、ほとんどの機械学習タスクは、モデル内のパラメータやハイパーパラメ...

シングルポイントのエンドツーエンドのテキスト検出および認識フレームワークは 19 倍高速です。華中科技大学、華南理工大学などが共同でSPTS v2をリリース

近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...

機械学習に基づく自動ネットワークトラフィック分析

1. 概要現在、機械学習はネットワーク トラフィック分析タスクで広く使用されています。特徴抽出、モデ...

TensorFlow と PyTorch: ディープラーニングに最適なフレームワークはどれですか?

この記事を読んでいるということは、おそらくすでにディープラーニングの旅を始めているということでしょう...

著作権侵害、盗作、人工知能技術はこれらすべてをどのように判断するのでしょうか?

機械学習 (ML) とディープラーニング (DL) の技術を包括する用語である人工知能 (AI) は...

米国はドローンに「ナンバープレート」を発行する

[[373346]]米国連邦航空局(FAA)は月曜日、小型ドローンの夜間飛行を許可すると発表した。新...

360、認知汎用大型モデル「360 Brain 4.0」をリリース、360ファミリーバケットに完全統合

「デジタルヒューマン『周紅一』を我が社のスポークスマンにしよう。彼が正しいことを言ったら、それは私の...

ロボットと触覚センシング技術の衝突、人間とロボットの触覚センシングを初めて探る記事

触覚は人間が相互作用を調整する主な方法の 1 つです。触覚を通じて知覚される触覚は、人間が物体の大き...

...

人工知能と機械学習における13の共通概念

[[422893]] 01 人工知能アラン・チューリングは人工知能を次のように定義しました。カーテン...

米空軍がAI技術を活用して「戦闘効率」を向上させる方法を明らかにする

データの規模を拡大し、関連するリテラシーを向上させることで、米空軍のさまざまな部門と人員は、意思決定...

Toutiaoに加えて、テキスト推奨の成功したアプリケーション事例は他に5つあります。

テキスト推奨は、推奨システムの応用シナリオとして、商業的に実装されて成功しています。最もよく知られて...

Zhiyuanは3億個のセマンティックベクトルモデルトレーニングデータを公開し、BGEモデルは反復と更新を続けています

大規模モデルの開発と応用が急速に発展するにつれ、大規模モデルの中核となる基本コンポーネントとしての埋...