Google、視覚障害者が世界を見るのを助けるAIメガネを開発

Google、視覚障害者が世界を見るのを助けるAIメガネを開発

海外メディアの報道によると、オランダの新興企業EnvisionはGoogle Glassと提携し、視覚障害者の視覚を助ける人工知能メガネを開発している。

このメガネは、人物、物体、公共交通機関の画像から情報を抽出し、それを言葉で着用者に伝えることができます。ページ上の単語を読んだり、友達の顔や名前を覚えたり、電車の標識や警告標識など周囲の環境を説明したりすることができます。視覚障害のある人は、メガネを使って料理本のレシピを読み、食料品店に行って材料を探し、家に帰って自分で料理をすることができます。

このデバイスは、オランダのハーグに拠点を置くEnvision社がGoogle Glassと提携して開発した。エンビジョンは、このソフトウェアが現在入手可能な光学式文字認識(OCR)ソフトウェアの中で最速かつ最も正確であり、食品ラベルから手書き文字まで、あらゆる種類の表面から60以上の言語のテキストを読み取ることができると主張している。

国際失明予防機関(IAPB)によれば、世界の人口73億人のうち、視覚障害者は2億5,300万人おり、そのうち3,600万人が失明しており、2億1,700万人が中度から重度の視覚障害を抱えている。

現在、このスマートグラスはEnvisionの公式サイトで予約注文できる。選べる仕様は2種類あり、価格は1,499ユーロと1,699ユーロ。 2020年8月に出荷が開始されると、公式小売価格は1899ユーロになります。

<<:  Google が TensorFlow Quantum をオープンソース化し、開発者が量子 AI モデルを構築できるように

>>:  顔認識は、セキュリティ市場におけるおやつか定番か?

推薦する

自動運転車の実現はAIと人間のゲームである

「人間がテクノロジーを生み出すペースは加速しており、テクノロジーの力は指数関数的に成長しています。指...

Python で機械学習を簡単に

ナイーブ ベイズ分類器を使用して、現実世界の機械学習の問題を解決します。ナイーブベイズナイーブベイズ...

具現化された知能の新時代! VLAは、UIナビゲーションとロボット操作を備えた最強の基本モデルMagmaを歓迎します

既存の大規模言語モデル、画像生成モデルなどは、少数のモーダルデータに対してのみ動作し、人間のように物...

人工知能シナリオにおける HBase の使用

近年、人工知能は、特にビッグデータと組み合わせて使用​​されることで、ますます人気が高まっています。...

機械学習の問題に適した事前トレーニング済みモデルを選択する方法

[[264482]]この記事では転移学習とは何か、どのように使用するのかを簡単に紹介します。転移学習...

2021 年の自然言語処理 (NLP) のトレンド トップ 10

2020 年は、ディープラーニングベースの自然言語処理 (NLP) 研究にとって忙しい年でした。最...

ビッグデータとAIアプリケーションを成功させる4つの鍵

ビッグデータ技術が今や世界の主要なマーケティングツールの 1 つになっていることは周知の事実です。 ...

ビッグデータと人工知能の応用に関する7つのよくある誤解

大規模で高速かつ変化する情報資産を処理するためにビッグデータ テクノロジーを採用する組織が増えるにつ...

勉強!機械学習アルゴリズムの長所と短所の概要

目次正規化アルゴリズムアンサンブルアルゴリズム決定木アルゴリズム回帰人工ニューラルネットワークディー...

Diffie-Hellman 鍵交換は、一般的な暗号化アルゴリズムです。

公開されたばかりの Logjam 脆弱性 (FREAK 脆弱性のバリエーション) に関する情報はブラ...

Google がオールラウンドな音楽転写 AI を発表: 曲を一度聴くだけでピアノとバイオリンの楽譜がすべて手に入る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

推薦システムにおけるランキング学習のための独自のアルゴリズム: Schiram ランキング

著者 | 王昊レビュー | Chonglou近年、推奨システムにおけるランク付け学習の応用は非常に稀...

...

ナレッジグラフを使用して RAG 機能を改善し、大規模モデルの幻覚を軽減する

幻覚は、大規模言語モデル (LLM) を使用するときによく発生する問題です。 LLM は流暢で一貫性...