アルゴリズムはあなたが次に何をするかを知っている

アルゴリズムはあなたが次に何をするかを知っている

[[113040]]

コンピューターがまだ十分に機能していない分野がいくつかあります。たとえば、顔認識(メディアを聞かないでください)や、巨大な数の素因数を見つけること(現在のほとんどの暗号化方法の基礎)などです。膨大な数の可能性と膨大なニュアンスに直面したコンピューターは、正しい答えに到達するためにあらゆる可能性を徹底的に列挙しなければなりません。しかし、コンピューターに鼻を認識するように頼む場合でも、数字を見つけるように頼む場合でも、本質的には処理と操作です。コンピューターは人間の動きを分析する能力がなく、現時点では人間の脳の方がこの能力に優れています。

顔認識と行動認識は、セキュリティ分野とソーシャルネットワークにおける重要な研究テーマです。現在多くの都市に広がっている監視カメラのネットワークは、人間の目から切り離すことはできません。世界中の治安機関があらゆるカメラを常時監視することにどれほど熱心であるかは想像に難くない。ロンドンは、街角ごとに監視装置(あるいは 2 つ、あるいは 3 つ)を設置したいと思っているはずです。

今年 6 月に開催されるコンピューター ビジョンおよび画像認識カンファレンスで、MIT とカリフォルニア大学の研究者が、従来の人間の目による監視を瞬時に上回る新しい動作認識アルゴリズムを実演する予定です。このアルゴリズムは自然言語処理アルゴリズムに基づいており、特定の主要分野では既存のテクノロジーを上回ることができます。

たとえば、このアルゴリズムはメモリをよりスマートに使用し(大量の仮想メモリを消費します)、メモリ使用量を一定に保つことができるため、大きなファイルやストリーミング ビデオの視聴/処理が可能になります。

ストリーミング メディアの処理はそれ自体が大きな技術的進歩であり、新しいアルゴリズムは完全に完了していないアクションを処理することさえ可能です。たとえば、路上で男性が突然他人のコートのポケットに手を伸ばした場合、アルゴリズムは男性の次の行動を予測できる。ある意味では、新しいアルゴリズムは未来を予測することができます。しかし、防犯と比較すると、その主な機能は依然として動作認識です。

[[113041]]

研究者たちは、「行動文法」と呼ばれる奇妙な考えを提唱した。彼らは、言葉は一定の規則に従って文章を構成できるため、行動にも対応する規則とサブアクションがあるはずだと考えた。

MITの博士研究員ハメド・ピルシアヴァシュ氏は、最も難しいのは動作を分類し、どれが主語で、どれが動詞で、どれが副詞かを判断することだと語った。ピルシアヴァシュ氏は、お茶を注ぐ、コーヒーを作るといった動作はいくつかのサブ動作で構成されており、自分の仕事はこれらのサブ動作を分解して分類することだと語った。

このアルゴリズムには機械学習のメカニズムがあります。コンピュータ プログラムは入力データ デバイスから学習します。一定期間の「トレーニング」の後、プログラムはより賢くなります。プログラムは、さまざまなアクションを含むビデオを観察し、各サブアクションをスキャンします。

特定のアクションの開始を観察することで、プログラムはそのアクションのすべての可能な終了を、最も可能性の高いものから最も可能性の低いものの順にランク付けして生成できます。ビデオが進むにつれて、新しく追加された情報によって、特定のアクションの可能性が排除されます。(たとえ人物のアクションが変わっていなくても、時間も情報であるため、それ自体が新しい情報です。) プログラムは、可能性のあるアクションの確率を再度整理します。プログラムは重要なアクションをスキャンすると、次のアクションを非常に正確に予測できます。

[王大発才、Vice経由]

<<:  物理学者は神の粒子を研究するためのアルゴリズムを開発するためにプログラマーを招待する

>>:  アルゴリズムの質問: 計算された π の値が正確かどうかをどのように判断するのでしょうか?

ブログ    
ブログ    

推薦する

AIは英語のエッセイを添削できますか? IELTS、CET-4、CET-6の採点、コメント、エラー修正が必要です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

セキュリティ業界における顔認証アクセス制御の発展展望

数年前までは、アクセス制御は鍵や IC アクセス カードによって行われていたことは誰もが知っています...

AIの次の目的地:リアルタイムサービス

リアルタイムサービスの波が徐々に私たちの日常生活に浸透するにつれ、コンピューティングインフラストラク...

OpenAIがテキストから動画を生成するAIジェネレーター「Sora」をリリース

OpenAI が Sora をリリースし、テキストからビデオへの AI コンテンツ生成競争に参入。 ...

幼少期から始める:AIを学ぶのに最適な時期は中学生

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

AIを使って株取引で不正行為をしよう!この世代のプログラマーは本当に楽しみ方を知っている

ディープラーニングを使用して株価を予測することは、以前は少し神秘的に思えたかもしれませんが、新しいこ...

...

...

...

...

単眼輝度画像を用いた顔深度マップ推定のための敵対的アーキテクチャによるディープラーニング

本論文では、単眼輝度画像から顔の深度マップを推定する敵対的アーキテクチャを提案する。 画像対画像のア...

人工知能トレーナーの秘密を明かす:新しい職業、AIの教師になるのは簡単ではない

[[322342]]現在、人工知能はさまざまな分野でその力を発揮しています。特に、電子商取引サービス...

ドバイが無人「空飛ぶ車」を試験:世界初のドローン旅客サービスとなる見込み

[[204952]]ボロコプター、ドバイで無人空飛ぶ車のテストを開始ロイター通信は北京時間9月26日...

...