FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使用されるクラスタリングや類似性検索などの手法は、通常、実装が困難です。最大 1 億枚の画像の内容を比較し、どの画像が類似しているかを調べたい場合、これは間違いなく非常に複雑な作業になります。実際、最も難しいのは複数のプロセッサにわたるスケーリングです。

[[185030]]

Facebook の AI 研究部門 (FAIR) は最近、Faiss と呼ばれる一連の興味深いソリューションをリリースしました。これは C++ で記述され、Python にバインドされたオープンソースのリソース ライブラリで、静止画像やビデオなどの大規模なデータ セット内の類似コンテンツを検索するために使用できます。

また、大規模なマルチ GPU 環境でアルゴリズムを同時に実行するためのより優れた方法を模索する、成長を続ける機械学習ソリューションのクラスを表しています。

干し草の山から針を見つける磁石

FAIRは2月末に発表した論文の中で、プロジェクトの内容と目的について説明した。研究開発の課題は、GPU 上で類似性検索や「k 選択」アルゴリズムを実行する方法だけではなく、メモリ容量よりもはるかに大きいデータセット (テラバイト レベルのビデオなど) を処理しながら、複数の GPU 間での同時操作を効率的に実装する方法です。

Faiss の利点は検索データそのものではなく、圧縮された表現形式にあります。これにより、精度レベルの限られた部分を犠牲にすることで、桁違い、あるいはそれ以上の大幅なストレージ効率の向上が実現されます。これを MP3 と比較すると、MP3 は「非可逆」圧縮形式ですが、その効果はほとんどのリスナーにとって完全に許容できるものです。同様に、Faiss はいわゆる PQ (積量子化) エンコード メカニズムを使用して、複数の GPU 間でワークロードを効率的に分割します。

論文で言及されている例の 1 つは、Yahoo の Flickr Creative Commons から 1 億枚の画像データセットを検索するというものです。ファイス氏は、赤い花と黄色い花の 2 つの画像を撮影し、それらを使用して、それらの画像の間にある一連の類似画像を探しました。 4 つの NVIDIA Titan X GPU を含むハードウェア セットのサポートにより、1 億枚の画像の類似性検索プロセスに合計 35 分かかりました。

FAIR は、Faiss は「従来の最先端 GPU よりも 8.5 倍高速」であると主張し、その結論を裏付けるいくつかのベンチマークを提供しています。 FAIR は、k 選択アルゴリズムの速度を 2 つの既存の GPU と比較したところ、Faiss アルゴリズムの方が高速であるだけでなく、GPU の最大利用可能メモリ帯域幅をより有効に活用できることを指摘しました。

FAIR はまた、Faiss のもう 1 つの大きな利点は、エンドツーエンドの検索時間、つまりデータの PQ バージョンの構築に必要な時間と、実際に検索を実行するために必要な時間であると紹介しました。競合ソリューションではテスト用の PQ 画像データ セットの構築に数日かかりますが、Faiss は「約半日」で「高品質」の画像を作成することができました。

スピードアップ

効率性を向上させるために精度をわずかに犠牲にする FAIR が採用した戦略は、機械学習の第一世代で広く受け入れられました。

これらのアクセラレーション ソリューションの多くは、NVIDIA Titan などのハイエンド ハードウェアに適用できるだけでなく、スマートフォンの GPU などのローエンド ハードウェアもサポートしています。 Google の TensorFlow ディープラーニング システムは最近アップグレードされ、スマートフォン クラスの GPU を使用して画像認識処理を実行できるようになりました。

精度と効率をトレードオフするこのアルゴリズム手法のもう 1 つの長期的な利点は、ローカル デバイス (高速だが不正確) とリモート バックエンド (より正確だがより多くの処理能力が必要) の間でワークロードを分散できることです。ネットワーク接続がある場合、ローカル デバイスが分類を担当し、より強力な処理リソースを備えたバックエンドが詳細な認識を実行します。

Faiss プロジェクトから得られた重要な教訓は、高並行性ハードウェアを使用して機械学習機能を完全に実現する方法を探るには、まだやるべきことがたくさんあるということです。

原題: Facebook の新しい機械学習フレームワークは精度よりも効率性を重視

原作者: Serdar Yegulalp

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

ホットなニュースをもっと知りたい方は、51CTO の「テクノロジーニュースモーニングレポート」コラムをご覧ください。

<<:  クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

>>:  IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

ブログ    

推薦する

海外メディア:NvidiaはARMアーキテクチャに基づくPCチップを設計しており、早ければ2025年に発売される予定

10月24日、チップ大手のNvidiaが人工知能(AI)コンピューティングチップ市場を独占した。現在...

Pytorch Geometric を使用したリンク予測コードの例

PyTorch Geometric (PyG) は、グラフ ニューラル ネットワーク モデルを構築し...

Microsoft が Copilot の統合バージョンをリリース、Windows、Edge、その他のプラットフォームにも近日登場

マイクロソフトは米国現地時間9月22日木曜日、人工知能アシスタント「コパイロット」の最新バージョンを...

上海交通大学が「人間行動理解エンジン」を発表:AIが超大作映画のあらゆる行動をフレームごとに理解

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自動運転車の危険性: 自動運転車が世界中で実現できないのはなぜか

テスラは2020年10月、車の所有者が駐車し、巡航速度で車線を自動的に維持し、赤信号で停止することを...

Google内部関係者、Bardチャットボットの有用性に疑問

10月12日、ブルームバーグは昨夜、グーグルとDiscordが共同で自社のAIチャットボット「Bar...

データ センターをよりスマートに: 人工知能はどのように役立つのか?

[[382637]]データセンターが国の経済の原動力となるにつれ、人工知能を導入することでより高い...

ハッシュテーブルアルゴリズムの最初から最後までの徹底的な分析

注: この記事は 3 つの部分に分かれています。最初の部分は、Baidu の面接の質問における To...

...

従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

Amazonが2006年にEC2サービスをリリースしてから11年が経ちました。この 11 年間で、A...

2018 年の 15 大テクノロジー トレンド、テクノロジーに関して正しい方向に進んでいますか?

[[216696]]一般的に言えば、未来そのものを予測することは難しいため、技術動向を明確に予測す...

「新しいインフラ」に注力 - Powerleader がコンピューティングパワーで人工知能を強化

「新インフラ」の7つの主要分野の一つとして、人工知能は政策推進と産業成熟度の大幅な向上の恩恵を受け、...

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

【51CTO.com クイック翻訳】 Amazon Web Services (AWS) は、クラウ...

...

メタバース: 新たな人間コミュニティか、それとも徹底的な監視による「金儲けの道具」か?

バーチャルリアリティヘッドセットは何年も前から市場に出回っており、多くのティーンエイジャーもこれらの...