畳み込みニューラルネットワークの父:人工知能が動画から常識を学ぶための次のステップ

畳み込みニューラルネットワークの父:人工知能が動画から常識を学ぶための次のステップ

志東西(公式アカウント:zhidxcom)

起源

ディープラーニング分野の大物として、ヤン・ルカン氏は近年Facebookの人工知能プロジェクトを急速に前進させており、その勢いはGoogleに劣らない。現在、Facebook の顔認識技術 DeepFace は 4 億人以上の顔を認識できますが、Yann LeCun 氏はこれに満足していません。彼は、機械視覚は写真からの認識に満足すべきではないと考えています。次のステップは、機械がビデオから「常識を学ぶ」ことです。

5年前、研究者たちは画像認識の精度において大きな進歩を遂げました。この背後にある技術、つまり人工ニューラル ネットワークが、最近の人工知能のブームを可能にしました。これにより、Google や Facebook で写真アルバムを検索できるようになり、顔認識を使用する多数のアプリも利用できるようになりました。

FacebookのAI研究チームの責任者であり、ニューヨーク大学の教授でもある彼は、機械視覚の分野におけるニューラルネットワークの応用の先駆者です。彼は、この分野にはまだ大きな発展の余地があり、この分野の進歩によって常識的なソフトウェア システムが実現できると考えています。

Q:現在のマシンビジョンのレベルはどの程度ですか?

YannLeCun : 画像に目立つ主題がある場合は、主題のカテゴリにラベルを付けるだけで済みます。十分なデータ(たとえば、カテゴリごとに 1,000 枚の画像)があれば、特定のブランドの車、特定の種類の植物、特定の血統の犬など、かなり具体的なものを認識することを学ぶことができます。風景、夕焼け、結婚式、誕生日パーティーなど、より抽象的なものも認識できます。わずか 5 年前には、この問題が解決可能であるかどうかは明らかではありませんでした。 (私たちは今それを克服しました) しかし、これは視覚の問題が解決されたことを意味するものではありません。

Q:まだ解決されていない重要な問題は何ですか?

YannLeCun : 画像や動画のキャプションや注釈を自動的に生成する取り組みは、長年行われてきました。有望に見えても、実際にはそれほど信頼できるものではないアプローチもいくつかありました。それらの適用範囲は、トレーニング方法によって大きく制限されます。ほとんどのシステムでは、他の種類のオブジェクトを含む画像や通常とは異なる状況の画像を与えると、認識パフォーマンスはひどく低下します。彼らには常識がない。

Q:視覚と常識の関係は何ですか?

ヤン・ルカン:それは誰に話すかによります。Facebook 内でも、この点については人によって意見が異なります。言語のみを使用してインテリジェント システムと通信できますが、問題は言語が非常に低い帯域幅の情報チャネルであることです。人々は情報を解釈するための豊富な背景知識を持っているため、言語を通じて多くの情報を伝達することができます。

AI システムに十分な情報を提供する唯一の方法は、言語よりもはるかに多くの情報を含む視覚認識に基づくことだと主張する人もいます。次に、機械に「これはスマートフォンです」「これはローラーです」「押せるものと押せないものがあります」と伝えると、機械は世界がどのように機能するかについて基本的な知識を学習するかもしれません。

それは赤ちゃんの学習方法に少し似ています。赤ちゃんは明確な指示がなくても、世界について信じられないほど多くのことを学びます。

私たちは、機械がビデオを見るなどして、現実世界の法則を反映した大量の事実を取得することを本当に望んでいます。これにより、最終的に彼らは常識を獲得できるようになります。幼い動物や赤ちゃんが生後数か月でどのように学習していくかを見るのは興味深いことです。彼らは、観察するだけで短期間のうちに世界に対する驚くべき理解を発達させます。そして、今日の機械は世界についてほとんど何も知らないため、さまざまな方法で簡単に騙されてしまう可能性があります。

Q:インテリジェントシステムが観察を通じて学習できるようにする上で、どのような進歩がありましたか?

YannLeCun:学習システムは未来を予測できるはずであり、私たちはこのアイデアに非常に興味を持っています。学習システムにビデオのいくつかのフレームを見せると、次に何が起こるかを予測します。この種の作業を行うようにシステムをトレーニングできれば、教師なし学習システムの基礎を構築できたことになると思います。これは、多くの興味深い可能性を開く転換点になると思います。その応用はマシンビジョンに限定されるものではなく、AI の継続的な進歩にとって重要な部分です。

<<:  AI が「脳で画像を完成させる」ことを学習: ニューラル ネットワークが 0 から 1 までの画像を完成させる

>>:  人工知能が注目を集め、ロボットキャスターが生放送の「新参者」に

推薦する

...

推薦システムの主なアルゴリズムの概要とYoutubeのディープラーニング推薦アルゴリズムの例

協調フィルタリング協調フィルタリング (CF) とそのバリエーションは、最も一般的に使用される推奨ア...

ChatGPTが危険にさらされています! 「Attention Formula」の8年前の謎のバグが初めて暴露、Transformerモデルに大きな影響が出る可能性

「注目の式」に8年間存在していたバグが外国人によって発見された?一瞬にして、この話題はインターネット...

...

2020年のAI開発の現状と展望の分析

中国政府は人工知能を国家戦略のレベルにまで高めた。 2017年7月、国務院は「次世代人工知能発展計画...

Alibaba Damo AcademyのJin Rong氏:テクノロジーから科学へ、中国のAIはどこへ向かうのか?

ダートマス会議から数えると、AIは65年の歴史を歩んできました。特に近年のディープラーニングの台頭に...

...

...

...

人工知能と医師が出会ったら何が起こるかを伝える7つの短編物語

[[187416]] Huxiu 注: この記事は、4 月 3 日に The New Yorker ...

Alibaba Cloud が Tongyi Qianwen 2.0 をリリース、パフォーマンスが加速して GPT-4 に追いつく

2023年杭州雲奇大会において、アリババクラウド最高技術責任者の周景仁氏は、数千億のパラメータを持つ...

RPAは人工知能の究極の発展方向でしょうか?

ロボティック・プロセス・オートメーション (RPA) は、単調で反復的なタスクを排除するのでしょうか...

...