すべては可能だ:コンピュータビジョンCVとNLPの分野はますます融合している

すべては可能だ:コンピュータビジョンCVとNLPの分野はますます融合している

[[347900]]

2020年10月、ディープラーニング分野のトップカンファレンスであるICLR 2021の論文投稿が終了しました。

このイベントでは、いくつかの著名人がディープラーニングの分野で新たな進歩を遂げました。この技術の変化はどのような影響をもたらすのでしょうか? Dongfang Linyu がお話しします。

CV コンピュータ ビジョンの分野における人工知能の応用では、CNN 畳み込みニューラル ネットワークが常に主流の地位を占めてきました。

Transformer アーキテクチャは、NLP 自然言語処理タスクで広く使用されています。

[[347901]]

両分野において、それぞれの技術は独自の強みを持ち、互いに干渉することはありません。

しかし、近年、専門家や学者はNLP分野でTransformerに関する国境を越えた研究に取り組んでおり、一定期間の実験を経て、いくつかの画像シナリオで非常に良い結果を達成しています。

ICLR 2021 には、標準的な Transformer アーキテクチャをコンピューター ビジョンの分野に直接適用し、新しい Vision Transformer モデルを提案し、複数の画像認識ベンチマークで現在の SOTA 方式に近いかそれ以上のパフォーマンスを実現する論文が掲載されています。

SOTA は state-of-the-art の略です。論文が SOTA と呼べるということは、提案されたアルゴリズム(モデル)の性能が現時点で最高であることを意味します。

この研究では、CNN への依存は必要ではなく、画像パッチのシーケンスに直接適用すると、トランスフォーマーが画像分類タスクで優れたパフォーマンスを発揮できることが示されています。

テスラAIの責任者であるアンドレイ・カルパシー氏は、この論文を具体的に転送し、次のように述べた。

コンピューター ビジョンと NLP の分野の統合が進んでいることを嬉しく思います。

技術の進歩により、すべてが可能になります。

NLP VS CV モデルのクロスボーダー学習が実行できれば、画像ビジョンの分野で Transformer は本来のリーダーである CNN の座を奪えるでしょうか?

これは非常に興味深い提案です。

ICLR 2021で注目に値する寄稿はありますか?Zhihuで、あるネットユーザーはこう言いました。

私たちは今、大きなモデルチェンジの前夜に立っており、ニューラル ネットワークの可能性はまだまだ無限大です。 CV と AI の世界全体を覆すのに十分な強力な新しいモデルが、氷山の一角を明らかにし、本格的に導入されようとしています。

人工知能は、基礎科学、ビジネスシナリオ、データ品質、エンジニアリング実践などの技術分野を密接に統合する必要がある総合的な分野であり、近年ではさらに多くの他の方向を統合しています。

人工知能のさまざまな分野は、技術的に統合したり、相互に置き換えたりすることができます。それはまた私たちにさらなるインスピレーションをもたらすかもしれません:

私たち人間は、自分の快適な領域から抜け出すことで、さまざまな分野を学び、統合し、変化する社会によりよく適応することができます。

デジタル化が徐々に世界を支配するにつれて、AI技術の統合と人間との国境を越えた統合は、社会の進歩にとってより強力な原動力となるでしょう。

あなたが思うこと?

AI の知識をさらに深めるには、Dongfang Linyu をフォローしてください。

<<:  ハードウェアとコードを分離し、APIを安定化したPyTorch Lightning 1.0.0が正式リリース

>>:  お金は人を幸せにできるのでしょうか?機械学習を使って答えを見つける方法を教えます

ブログ    

推薦する

馬懿、沈向陽、曹英の最新AIレビューが人気に!作成に3か月かかりました。ネットユーザー必読の論文です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

建設現場での死傷者を減らすには? 10のAI手法をご紹介します

この記事の結論から始めましょう。AI と機械学習は、ビデオ信号を 24 時間 365 日リアルタイム...

...

アルゴリズムのパフォーマンスを最適化するためにデータ品質を確保するための 6 つのヒント

今日、企業は、分析アルゴリズムの良し悪しは、そのアルゴリズムをトレーニングするデータの良し悪しによっ...

クアルコム副社長ライナー・クレメント氏:「5G+AI+クラウド」は将来の産業をどのように変えるのでしょうか?

2019年国際産業インターネット革新・開発フォーラムがこのほど、第2回中国国際輸入博覧会で開催され...

SAP の AI グローバル責任者、ウォルター・サン博士: ビジネスで AI を最大限に活用する

テクノロジーは私たちの世界を変えました。それは何十億もの人々に考え、アイデア、洞察を共有する機会を与...

Facebookは人工知能を使ってコンテンツレビューの優先順位を決める

海外メディアによると、フェイスブックは機械学習アルゴリズムの使用を増やし、AIを使ってコンテンツの重...

インターネットの理解からユーザーの理解へ、Google は今回何に賭けているのでしょうか?

Google I/O カンファレンスは予定通り開催されます。北京時間5月12日午前1時、Googl...

新しい調査によると、アメリカ人の48%は自動運転車に乗りたくないと考えている。

自動運転の開発は本当に難しいです。この困難は技術的な難しさだけでなく、人々の直感的な不信感によっても...

Google の大きな動き!検索結果からAIが生成したスパムをクリーンアップします

3月6日火曜日(米国時間)、Googleは、検索結果に蔓延するAI生成のスパムを排除し、ユーザーが検...

責任ある AI 導入: IT 共生の青写真

AI ツールが合法化され、職場に導入されるようになると、人々は当然、その使用例や AI ツールに依存...

最高裁判所は顔認識に関する新たな規制を発表:顔情報の収集には「個別の同意」が必要

[[414466]] 7月28日、最高人民法院は「顔認識技術を用いた個人情報処理に関する民事訴訟にお...

...

市場規模は約16.8億元に達しました!物流と配送がドローンと出会う

現在、ナビゲーションや通信などの技術が継続的に進歩し、ドローンの開発はより成熟し、業界の規模も拡大し...

人種問題で顔認識技術はどうなるのか?

米国では、白人警官による黒人市民に対する過剰な法執行が日常茶飯事である。最近、白人警官が黒人男性を膝...