FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか？

[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使用されるクラスタリングや類似性検索などの手法は、通常、実装が困難です。最大 1 億枚の画像の内容を比較し、どの画像が類似しているかを調べたい場合、これは間違いなく非常に複雑な作業になります。実際、最も難しいのは複数のプロセッサにわたるスケーリングです。

[[185030]]

Facebook の AI 研究部門 (FAIR) は最近、Faiss と呼ばれる一連の興味深いソリューションをリリースしました。これは C++ で記述され、Python にバインドされたオープンソースのリソースライブラリで、静止画像やビデオなどの大規模なデータセット内の類似コンテンツを検索するために使用できます。

また、大規模なマルチ GPU 環境でアルゴリズムを同時に実行するためのより優れた方法を模索する、成長を続ける機械学習ソリューションのクラスを表しています。

干し草の山から針を見つける磁石

FAIRは2月末に発表した論文の中で、プロジェクトの内容と目的について説明した。研究開発の課題は、GPU 上で類似性検索や「k 選択」アルゴリズムを実行する方法だけではなく、メモリ容量よりもはるかに大きいデータセット (テラバイトレベルのビデオなど) を処理しながら、複数の GPU 間での同時操作を効率的に実装する方法です。

Faiss の利点は検索データそのものではなく、圧縮された表現形式にあります。これにより、精度レベルの限られた部分を犠牲にすることで、桁違い、あるいはそれ以上の大幅なストレージ効率の向上が実現されます。これを MP3 と比較すると、MP3 は「非可逆」圧縮形式ですが、その効果はほとんどのリスナーにとって完全に許容できるものです。同様に、Faiss はいわゆる PQ (積量子化) エンコードメカニズムを使用して、複数の GPU 間でワークロードを効率的に分割します。

論文で言及されている例の 1 つは、Yahoo の Flickr Creative Commons から 1 億枚の画像データセットを検索するというものです。ファイス氏は、赤い花と黄色い花の 2 つの画像を撮影し、それらを使用して、それらの画像の間にある一連の類似画像を探しました。 4 つの NVIDIA Titan X GPU を含むハードウェアセットのサポートにより、1 億枚の画像の類似性検索プロセスに合計 35 分かかりました。

FAIR は、Faiss は「従来の最先端 GPU よりも 8.5 倍高速」であると主張し、その結論を裏付けるいくつかのベンチマークを提供しています。 FAIR は、k 選択アルゴリズムの速度を 2 つの既存の GPU と比較したところ、Faiss アルゴリズムの方が高速であるだけでなく、GPU の最大利用可能メモリ帯域幅をより有効に活用できることを指摘しました。

FAIR はまた、Faiss のもう 1 つの大きな利点は、エンドツーエンドの検索時間、つまりデータの PQ バージョンの構築に必要な時間と、実際に検索を実行するために必要な時間であると紹介しました。競合ソリューションではテスト用の PQ 画像データセットの構築に数日かかりますが、Faiss は「約半日」で「高品質」の画像を作成することができました。

スピードアップ

効率性を向上させるために精度をわずかに犠牲にする FAIR が採用した戦略は、機械学習の第一世代で広く受け入れられました。

これらのアクセラレーションソリューションの多くは、NVIDIA Titan などのハイエンドハードウェアに適用できるだけでなく、スマートフォンの GPU などのローエンドハードウェアもサポートしています。 Google の TensorFlow ディープラーニングシステムは最近アップグレードされ、スマートフォンクラスの GPU を使用して画像認識処理を実行できるようになりました。

精度と効率をトレードオフするこのアルゴリズム手法のもう 1 つの長期的な利点は、ローカルデバイス (高速だが不正確) とリモートバックエンド (より正確だがより多くの処理能力が必要) の間でワークロードを分散できることです。ネットワーク接続がある場合、ローカルデバイスが分類を担当し、より強力な処理リソースを備えたバックエンドが詳細な認識を実行します。

Faiss プロジェクトから得られた重要な教訓は、高並行性ハードウェアを使用して機械学習機能を完全に実現する方法を探るには、まだやるべきことがたくさんあるということです。

原題: Facebook の新しい機械学習フレームワークは精度よりも効率性を重視

原作者: Serdar Yegulalp

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

ホットなニュースをもっと知りたい方は、51CTO の「テクノロジーニュースモーニングレポート」コラムをご覧ください。

<<: クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

>>: IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。