FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使用されるクラスタリングや類似性検索などの手法は、通常、実装が困難です。最大 1 億枚の画像の内容を比較し、どの画像が類似しているかを調べたい場合、これは間違いなく非常に複雑な作業になります。実際、最も難しいのは複数のプロセッサにわたるスケーリングです。

[[185030]]

Facebook の AI 研究部門 (FAIR) は最近、Faiss と呼ばれる一連の興味深いソリューションをリリースしました。これは C++ で記述され、Python にバインドされたオープンソースのリソース ライブラリで、静止画像やビデオなどの大規模なデータ セット内の類似コンテンツを検索するために使用できます。

また、大規模なマルチ GPU 環境でアルゴリズムを同時に実行するためのより優れた方法を模索する、成長を続ける機械学習ソリューションのクラスを表しています。

干し草の山から針を見つける磁石

FAIRは2月末に発表した論文の中で、プロジェクトの内容と目的について説明した。研究開発の課題は、GPU 上で類似性検索や「k 選択」アルゴリズムを実行する方法だけではなく、メモリ容量よりもはるかに大きいデータセット (テラバイト レベルのビデオなど) を処理しながら、複数の GPU 間での同時操作を効率的に実装する方法です。

Faiss の利点は検索データそのものではなく、圧縮された表現形式にあります。これにより、精度レベルの限られた部分を犠牲にすることで、桁違い、あるいはそれ以上の大幅なストレージ効率の向上が実現されます。これを MP3 と比較すると、MP3 は「非可逆」圧縮形式ですが、その効果はほとんどのリスナーにとって完全に許容できるものです。同様に、Faiss はいわゆる PQ (積量子化) エンコード メカニズムを使用して、複数の GPU 間でワークロードを効率的に分割します。

論文で言及されている例の 1 つは、Yahoo の Flickr Creative Commons から 1 億枚の画像データセットを検索するというものです。ファイス氏は、赤い花と黄色い花の 2 つの画像を撮影し、それらを使用して、それらの画像の間にある一連の類似画像を探しました。 4 つの NVIDIA Titan X GPU を含むハードウェア セットのサポートにより、1 億枚の画像の類似性検索プロセスに合計 35 分かかりました。

FAIR は、Faiss は「従来の最先端 GPU よりも 8.5 倍高速」であると主張し、その結論を裏付けるいくつかのベンチマークを提供しています。 FAIR は、k 選択アルゴリズムの速度を 2 つの既存の GPU と比較したところ、Faiss アルゴリズムの方が高速であるだけでなく、GPU の最大利用可能メモリ帯域幅をより有効に活用できることを指摘しました。

FAIR はまた、Faiss のもう 1 つの大きな利点は、エンドツーエンドの検索時間、つまりデータの PQ バージョンの構築に必要な時間と、実際に検索を実行するために必要な時間であると紹介しました。競合ソリューションではテスト用の PQ 画像データ セットの構築に数日かかりますが、Faiss は「約半日」で「高品質」の画像を作成することができました。

スピードアップ

効率性を向上させるために精度をわずかに犠牲にする FAIR が採用した戦略は、機械学習の第一世代で広く受け入れられました。

これらのアクセラレーション ソリューションの多くは、NVIDIA Titan などのハイエンド ハードウェアに適用できるだけでなく、スマートフォンの GPU などのローエンド ハードウェアもサポートしています。 Google の TensorFlow ディープラーニング システムは最近アップグレードされ、スマートフォン クラスの GPU を使用して画像認識処理を実行できるようになりました。

精度と効率をトレードオフするこのアルゴリズム手法のもう 1 つの長期的な利点は、ローカル デバイス (高速だが不正確) とリモート バックエンド (より正確だがより多くの処理能力が必要) の間でワークロードを分散できることです。ネットワーク接続がある場合、ローカル デバイスが分類を担当し、より強力な処理リソースを備えたバックエンドが詳細な認識を実行します。

Faiss プロジェクトから得られた重要な教訓は、高並行性ハードウェアを使用して機械学習機能を完全に実現する方法を探るには、まだやるべきことがたくさんあるということです。

原題: Facebook の新しい機械学習フレームワークは精度よりも効率性を重視

原作者: Serdar Yegulalp

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

ホットなニュースをもっと知りたい方は、51CTO の「テクノロジーニュースモーニングレポート」コラムをご覧ください。

<<:  クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

>>:  IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

ブログ    
ブログ    

推薦する

国勢調査ではAISのAIロボットが初めて「世帯内に入る」

「こんにちは、泰達街人口調査事務所です。」現在、第7回全国人口調査が盛んに行われている。天津浜海新...

生成 AI とビッグモデルの違いと関連性は何ですか?

近年、ChatGPT、GPT-4、BARD、Claudeなどの大規模モデルが急速かつ大幅な進歩を遂げ...

ジェネレーティブ AI に投資する前に CIO が答えるべき 11 の質問

生成型AIの重要性を考慮すると、CIOは監査、運用、戦略の全体的なアプローチを積極的に更新する必要が...

AppleがAI研究成果を公開、マルチモーダルLLMモデルFerretをリリース

IT Homeは12月25日、Appleがコロンビア大学の研究者らと協力して2023年10月にオープ...

2020年以降のAIトレンド

機械で書かれたニュース記事、AI 主導のサイバーセキュリティ、感情検出における重要な進歩など、201...

Siriは中国で禁止されるのでしょうか?国内AI企業がアップルを特許侵害で訴え、高等法院は中国の特許を有効と認定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能がインダストリー4.0における製造業に革命をもたらす

人工知能 (AI) という用語は、流行語の地位を超え、業界全体にわたる技術革新の基礎となっています。...

アダムとイブ: ディープラーニングの問題を解決するための強力なツール

[[242433]] [51CTO.com クイック翻訳] 近年、ディープラーニングの波がインターネ...

AI時代ではモデルは大きいほど良い

今年も4分の3が過ぎた。テクノロジー業界から見れば、「室温超伝導」が実現可能であることが公式に証明さ...

BERTに続き、この新しいモデルは11のNLPベンチマークで再び記録を更新しました。

BERT が 11 個の NLP 記録を破って以来、幅広いタスクに適用できる NLP 事前トレーニ...

...

...

このアルゴリズムチームは 2020 年に何をしましたか?

[[383980]]冒頭に書いた私自身、毎年まとめを書く習慣があります。2020年は、私の職務が垂...

...

カスタムデータセットにOpenAI CLIPを実装する

2021年1月、OpenAIはDALL-EとCLIPという2つの新しいモデルを発表しました。どちらも...