Google、視覚障害者が世界を見るのを助けるAIメガネを開発

Google、視覚障害者が世界を見るのを助けるAIメガネを開発

海外メディアの報道によると、オランダの新興企業EnvisionはGoogle Glassと提携し、視覚障害者の視覚を助ける人工知能メガネを開発している。

このメガネは、人物、物体、公共交通機関の画像から情報を抽出し、それを言葉で着用者に伝えることができます。ページ上の単語を読んだり、友達の顔や名前を覚えたり、電車の標識や警告標識など周囲の環境を説明したりすることができます。視覚障害のある人は、メガネを使って料理本のレシピを読み、食料品店に行って材料を探し、家に帰って自分で料理をすることができます。

このデバイスは、オランダのハーグに拠点を置くEnvision社がGoogle Glassと提携して開発した。エンビジョンは、このソフトウェアが現在入手可能な光学式文字認識(OCR)ソフトウェアの中で最速かつ最も正確であり、食品ラベルから手書き文字まで、あらゆる種類の表面から60以上の言語のテキストを読み取ることができると主張している。

国際失明予防機関(IAPB)によれば、世界の人口73億人のうち、視覚障害者は2億5,300万人おり、そのうち3,600万人が失明しており、2億1,700万人が中度から重度の視覚障害を抱えている。

現在、このスマートグラスはEnvisionの公式サイトで予約注文できる。選べる仕様は2種類あり、価格は1,499ユーロと1,699ユーロ。 2020年8月に出荷が開始されると、公式小売価格は1899ユーロになります。

<<:  Google が TensorFlow Quantum をオープンソース化し、開発者が量子 AI モデルを構築できるように

>>:  顔認識は、セキュリティ市場におけるおやつか定番か?

ブログ    
ブログ    

推薦する

人工知能は、新たな技術と産業の変化のトレンドになりつつある

人工知能(AI)は、コンピュータサイエンスの一分野として、1970年代から世界の3大最先端技術の1つ...

コストを 95% 削減した ChatGPT の代替品を作成しましょう! OpenAIのハードコアアップデートが来月リリースされ、ビジュアルAPIが登場

世界中の開発者は長い間、OpenAI モデルの価格に悩まされてきました。ロイター通信は、11月6日に...

AIリップリーディング、騒音環境でも最大75%の音声認識精度

人は話者の唇の動きを聞いて観察することで会話を認識します。では、AI も同じことができるのでしょうか...

...

国内トップクラスのAIカンファレンスCPALに採択された論文の成果を公開!合計30件の口頭発表と60件のスポットライト記事

今年5月に発表され、国内の有力者である馬怡氏と沈向陽氏が主導する、まったく新しい初のAI学術会議CP...

ペアデータなしで学習!浙江大学らは、マルチモーダルコントラスト表現C-MCRの接続を提案した。

マルチモーダル対照表現 (MCR) の目標は、異なるモダリティからの入力を意味的に整合された共有空間...

専門家の議論:AIの冬は本当に来るのか?

数日前、コンピュータービジョンとAIの専門家であるフィリップ・ピエニエフスキー氏は自身のブログに「A...

認知と論理的思考の観点から自然言語理解を議論する

[[425002]]自然言語理解 (NLU) は難しい問題です。数十年前の AI の誕生から現在に至...

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

[[405016]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人工知能時代のITサービスを変える8つのテクノロジー

サービスは人間が行う仕事だということを否定する人はいないでしょう。しかし、テクノロジーはサービスを強...

Testin Cloud Testingは、ビッグモデル+ソフトウェアテストの業界リーダーの技術革新の道を模索し始めました。

情報技術が急速に発展する時代において、ソフトウェア業界は活況を呈しており、高品質のソフトウェアに対す...

...

GPT-4.5がリーク、3Dビデオをサポート、価格は6倍に上昇?ウルトラマンが自ら反応

GPT 4.5 に重大なリークの疑い: 1 つは、新しいモデルには新しいマルチモーダル機能が搭載され...

...

ハイリアンと手を携えてデジタル変革の道を議論する

モバイルインターネットの発展に伴い、企業の生産・運営プロセスで生成されるデータは、これまでにない爆発...