人工知能は過去1年間で大きな進歩を遂げ、人々にますます多くの利益をもたらしました。将来的には、マシンビジョンが人工知能の次のフロンティアとなるでしょう。この種の技術が発展するにつれ、来年には新しいタイプの AI 駆動型デバイスが登場するでしょう。 なぜ機械には視覚が必要なのでしょうか? 視覚は主要な感覚です。機械が人間を理解し、必要なサポートを提供するには、視覚領域で見て行動できなければなりません。これは、目の見えない人が周囲の世界を「見て」理解するのを助ける小型カメラや、野良猫、動く枝、泥棒を正確に区別できる家庭用監視システムといった形をとる可能性があります。 電子機器が人々の日常生活においてますます重要になるにつれ、ドローンが空中で衝突したり、ロボット掃除機が吸い込んではいけないものを吸い込んだりするなど、十分な視覚能力がないためデバイスアプリケーションが失敗するケースも増えています。
マシンビジョンは、人間と同等の視覚を機械に与えることを目指した、急速に発展している人工知能の分野です。研究者が特殊なニューラル ネットワークを適用して、機械が現実世界の画像を認識および理解できるようにしたことにより、マシン ビジョンはここ数年で大きな進歩を遂げました。今日のコンピューターは、インターネット上で猫を識別することから、大量の写真の中から特定の顔を見つけることまで、視覚認識によってさまざまなことを行うことができます。しかし、このタイプの技術には、まだ長い道のりが残っています。 現在、マシンビジョンはデータセンターの枠を超え、自律型ドローンから食品の選別まで、さまざまな目的で使用されています。 基本的な画像分類はすでにかなり単純化されていますが、機械は複雑なシーンから意味や情報を抽出する上で一連の新たな問題に直面しています。錯視の問題は、機械視覚がまだどれほど進歩しなければならないかを示す良い例です。 たとえば、向かい合った 2 つの顔のシルエットの画像を見ると、人々は単なる抽象的な形以上のものを見ます。彼らの脳はさらなる解釈を行い、画像の複数の部分を識別したり、2つの顔を見たり、花瓶を見たりすることができます。 しかし、機械にとって、そのような画像を理解するのは非常に困難です。基本的な分類器は、2 つの顔と花瓶の違いを区別できません。分類器は、手斧、フック、防弾チョッキ、さらにはギターのような物体を認識します。システムは画像内にどの物体があるのか判断できず、このような画像の認識は機械にとって非常に困難であることがわかります。 また、複雑な画像と同様に、現実の世界も非常に複雑です。正常なナビゲーションは、単にデータを分析するアルゴリズムを開発するだけでは実現できません。実際のシナリオを明確に理解し、それに応じたアクションを実行する必要があります。 ロボットやドローンはこうした多くの障害に直面しており、これらの課題を克服することが AI 革命に参加する者にとって最優先事項です。 ニューラル ネットワークや特殊なマシン ビジョン ハードウェアなどのテクノロジが普及するにつれて、マシン ビジョンと人間の視覚のギャップは急速に縮まっています。近い将来、人間よりも優れた視力を持ち、広範囲にわたる複雑なタスクを実行し、完全に自律的に動作できるロボットが登場するかもしれません。 |
<<: 人工知能が注目を集め、ロボットキャスターが生放送の「新参者」に
>>: Facebook の応用機械学習チームを訪問: 研究と応用の間に橋を架けるにはどうすればよいでしょうか?
[[403666]]ストラトキャスターとテレキャスターのギターを製造するカリフォルニア州コロナに本社...
人工知能 (AI) は、コンピューターや機械をインテリジェントに動作させる方法を研究する分野です。機...
この共有では主に以下の点が紹介されます。 AIOps ロードマップ異常検出プラットフォーム構築インテ...
[51CTO.com クイック翻訳] Facebook を利用する何十億もの人々にとって、私たちのサ...
2年前、イタリアのテノール歌手アンドレア・ボチェッリがイタリアのピサにあるヴェルディ劇場でルッカ・フ...
ChatGPTやGPT-4などの大型モデルの発表により、人工知能技術の進歩と応用が注目されるようにな...
[51CTO.com オリジナル記事] Baidu は 2019 年第 2 四半期の財務報告を発表し...
総じて、人工知能は世界の新世代の技術革命と産業転換の原動力となっており、その発展は我が国の産業構造の...
翻訳者 |ブガッティレビュー | Chonglou AgentGPT Web は、ユーザーがカスタマ...
今年が進むにつれて、持続可能な開発をめぐる話題はますます高まるばかりであり、気候変動が近づいていると...