Facebook AI Research は近年、ビデオ理解研究において多くの素晴らしい成果を上げています。最近、FAIRビデオチームは、ICCV関連のセミナーでビデオ認識検出コードライブラリPySlowFastをオープンソース化し、事前学習済みモデルライブラリも公開しました。同時に、チームは最先端の研究成果をこのコードベースにリアルタイムで追加していくとも述べた。
ビデオとモーションの理解は、今日最も注目されている研究分野の 1 つになっています。しかし、オープンソース コミュニティで簡潔で効率的、かつ変更しやすいビデオ理解コード ベースを見つけるのは、まだ容易ではありません。さらに重要なのは、最先端のディープラーニングモデルを再現することは、研究者にとって常に頭痛の種となっていることです。 これらのビデオ理解モデルには、数十 GFlops と数日間のトレーニングが必要になることがよくあります。モデルを再現するには、細部まで正確にするために実験とパラメータの調整を繰り返す必要があります。これには多くの時間とリソースが消費されることが多く、多くの研究者の意欲を削いでしまいます。 Facebook AI Researchは、CVPRやICCVなどの国際会議で多数の研究成果を発表し、CVPR 2019 Behavior Detection Challengeで優勝しました。そして、今年の ICCV で、FAIR はビデオ理解コード ライブラリ PySlowFast を発表しました。 さらに、PySlowFast コード ベースは多数のオープンソースの事前トレーニング済みモデルも提供しており、研究者はモデルを繰り返しトレーニングする手間が省け、FAIR 事前トレーニング済みの最先端のパフォーマンス モデルを直接使用できるようになります。 pySlowFastオープンソースモデルの視覚的検出結果 PySlowFast はオープンソースとしてリリースされて以来、GitHub のトレンドリストのトップ 10 にランクされています。以下は、このオープンソース プロジェクトの簡単な紹介です。 ワークショップのチュートリアルとオープンソース コード ライブラリの情報によると、PySlowFast はビデオ理解のベースライン モデルと、今日の最先端のビデオ理解アルゴリズムの再現の両方を提供します。そのアルゴリズムには、ビデオ分類だけでなく、アクション分類アルゴリズムも含まれます。 今日のオープンソース コミュニティにおけるさまざまなビデオ認識ライブラリのパフォーマンスのばらつきと比較すると、PySlowFast を使用すると、今日の最先端のモデルを簡単に再現できます。 ビデオ認識(キネティクス) 表 1: ビデオ分類データベース Kinetics 400 での PySlowFast のパフォーマンス (https://github.com/facebookresearch/SlowFast/blob/master/MODEL_ZOO.md からの抜粋) PySlowFast は、ビデオ分類だけでなくビデオ理解にも使用でき、2019 CVPR ActivityNet Challenge Winner を獲得したビデオ検出モデルを提供します。 さらに、PySlowFast には、簡単な編集を通じてマルチモーダル ビデオ理解、ビデオ自己教師学習、その他のタスクをサポートできるインターフェイスが用意されています。チームによると、PySlowFast は積極的にメンテナンスされ、チームと業界の最先端のアルゴリズムをリアルタイムで更新し、事前トレーニング済みのモデルをオープンソース化して、コードベースをビデオ理解の分野におけるベースラインベンチマークにする予定だという。 次のチュートリアルを通じて、読者は PySlowFast コード ライブラリを簡単に試すことができます。インストールが完了したら、MODEL_ZOO が提供する事前トレーニング済みモデルと対応する構成ファイルをダウンロードし、次のコードを実行することで、さまざまなビデオ データベースでモデルのパフォーマンスをテストできます。
このコードライブラリにより、最先端の高性能モデルを簡単に再現できることがわかります。同時に、読者は簡単な変更で独自のモデルを実装し、複数の GPU でトレーニングして最先端のパフォーマンスを得ることもできます。 |
<<: Alibaba DAMO Academyが2020年のトップ10テクノロジートレンドを発表!人工知能、ブロックチェーン、チップが注目される
>>: 2019 年の NLP における最先端のブレークスルーを振り返る
[[353997]]人工知能は誕生以来、成功と失敗の時期を経験し、技術の進歩も限界と放棄に直面してき...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
以前、河南省鄭州市は「花火」がもたらした大雨により洪水災害に見舞われた。こうした背景から、「花火」の...
[[436311]]最近、Meta CEO マーク・ザッカーバーグ氏によるメタバースの推進が大きな...
世界保健機関によれば、毎年80万人が自殺で亡くなっている。 この数字は年々高いままですが、人工知能と...
マスク氏はツイッターで奇妙な見解を表明した。人類が超人的な人工知能を創り出した理由は、ある種の「脳寄...
高品質なデータの取得は、現在の大規模モデルのトレーニングにおける大きなボトルネックとなっています。数...
[[346995]]さまざまな資料を読んでいくうちに、ニューラルネットワークの歴史に深く魅了されるよ...
人工知能が進歩し続けるにつれて、研究者たちはその能力を向上させ、さまざまな分野で倫理的かつ責任を持っ...
【51CTO.comオリジナル記事】 [[286886]]最近、北京グローバル金融センターで北科不...
導入最近では、機械学習、ディープラーニング、人工ニューラルネットワークに関する議論がますます増えてい...
MITの研究者らは、視覚と無線周波数(RF)センシングを組み合わせて、視界から隠れている物体でも見...
ChatGPT の素晴らしい初年度が終わりに近づくにつれ、生成型人工知能 (genAI) と大規模言...