FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使用されるクラスタリングや類似性検索などの手法は、通常、実装が困難です。最大 1 億枚の画像の内容を比較し、どの画像が類似しているかを調べたい場合、これは間違いなく非常に複雑な作業になります。実際、最も難しいのは複数のプロセッサにわたるスケーリングです。

[[185030]]

Facebook の AI 研究部門 (FAIR) は最近、Faiss と呼ばれる一連の興味深いソリューションをリリースしました。これは C++ で記述され、Python にバインドされたオープンソースのリソース ライブラリで、静止画像やビデオなどの大規模なデータ セット内の類似コンテンツを検索するために使用できます。

また、大規模なマルチ GPU 環境でアルゴリズムを同時に実行するためのより優れた方法を模索する、成長を続ける機械学習ソリューションのクラスを表しています。

干し草の山から針を見つける磁石

FAIRは2月末に発表した論文の中で、プロジェクトの内容と目的について説明した。研究開発の課題は、GPU 上で類似性検索や「k 選択」アルゴリズムを実行する方法だけではなく、メモリ容量よりもはるかに大きいデータセット (テラバイト レベルのビデオなど) を処理しながら、複数の GPU 間での同時操作を効率的に実装する方法です。

Faiss の利点は検索データそのものではなく、圧縮された表現形式にあります。これにより、精度レベルの限られた部分を犠牲にすることで、桁違い、あるいはそれ以上の大幅なストレージ効率の向上が実現されます。これを MP3 と比較すると、MP3 は「非可逆」圧縮形式ですが、その効果はほとんどのリスナーにとって完全に許容できるものです。同様に、Faiss はいわゆる PQ (積量子化) エンコード メカニズムを使用して、複数の GPU 間でワークロードを効率的に分割します。

論文で言及されている例の 1 つは、Yahoo の Flickr Creative Commons から 1 億枚の画像データセットを検索するというものです。ファイス氏は、赤い花と黄色い花の 2 つの画像を撮影し、それらを使用して、それらの画像の間にある一連の類似画像を探しました。 4 つの NVIDIA Titan X GPU を含むハードウェア セットのサポートにより、1 億枚の画像の類似性検索プロセスに合計 35 分かかりました。

FAIR は、Faiss は「従来の最先端 GPU よりも 8.5 倍高速」であると主張し、その結論を裏付けるいくつかのベンチマークを提供しています。 FAIR は、k 選択アルゴリズムの速度を 2 つの既存の GPU と比較したところ、Faiss アルゴリズムの方が高速であるだけでなく、GPU の最大利用可能メモリ帯域幅をより有効に活用できることを指摘しました。

FAIR はまた、Faiss のもう 1 つの大きな利点は、エンドツーエンドの検索時間、つまりデータの PQ バージョンの構築に必要な時間と、実際に検索を実行するために必要な時間であると紹介しました。競合ソリューションではテスト用の PQ 画像データ セットの構築に数日かかりますが、Faiss は「約半日」で「高品質」の画像を作成することができました。

スピードアップ

効率性を向上させるために精度をわずかに犠牲にする FAIR が採用した戦略は、機械学習の第一世代で広く受け入れられました。

これらのアクセラレーション ソリューションの多くは、NVIDIA Titan などのハイエンド ハードウェアに適用できるだけでなく、スマートフォンの GPU などのローエンド ハードウェアもサポートしています。 Google の TensorFlow ディープラーニング システムは最近アップグレードされ、スマートフォン クラスの GPU を使用して画像認識処理を実行できるようになりました。

精度と効率をトレードオフするこのアルゴリズム手法のもう 1 つの長期的な利点は、ローカル デバイス (高速だが不正確) とリモート バックエンド (より正確だがより多くの処理能力が必要) の間でワークロードを分散できることです。ネットワーク接続がある場合、ローカル デバイスが分類を担当し、より強力な処理リソースを備えたバックエンドが詳細な認識を実行します。

Faiss プロジェクトから得られた重要な教訓は、高並行性ハードウェアを使用して機械学習機能を完全に実現する方法を探るには、まだやるべきことがたくさんあるということです。

原題: Facebook の新しい機械学習フレームワークは精度よりも効率性を重視

原作者: Serdar Yegulalp

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

ホットなニュースをもっと知りたい方は、51CTO の「テクノロジーニュースモーニングレポート」コラムをご覧ください。

<<:  クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

>>:  IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

ブログ    
ブログ    

推薦する

人工知能が中国の古典「古いドラマ」と「古い映画」に新たな表情を与える

映画「トンネル戦争」修復前と修復後の比較。画像はインタビュー対象者より提供新華社北京1月1日(記者フ...

...

MIT が夢を創るマシン「ドリーム インキュベーター」を開発、インセプションの現実版をカスタマイズ

目が覚めているのと眠っているのを同時に経験したことがありますか?実はここは現実と夢を繋ぐ中継駅なので...

DeepMind がワンクリックで「Mole」言語モデルを起動します。 2,800億のパラメータがSOTAに到達可能

太い眉毛と大きな目を持つ「強化学習の専門家」も、大規模言語モデルに取り組み始めているのでしょうか? ...

OpenAIがChatGPTの「カスタム指示」機能を全ユーザーに公開

米国現地時間8月11日木曜日、人工知能研究企業OpenAIは、ChatGPTの「カスタム指示」機能を...

テーラーメイド:ChatGPTカスタム指示がAIパーソナライゼーション革命をリード

1. 概要カスタム指示「カスタム指示」は ChatGPT の新機能です。カスタム指示を使用すると、自...

...

誰もがエンドツーエンドに取り組んでいますが、エンドツーエンドの自動運転の基礎は何でしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

人工知能が水力発電の持続可能な開発にどのように役立つか

水力発電ダムの壁は川の流れを制限し、川をよどんだ水たまりに変えてしまいます。これらの貯水池が古くなる...

BEV の可能性の限界を探ろう! DA-BEV: 新しい教師なし BEV SOTA ソリューション!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

転移学習: データが不十分な場合に深く学習する方法

[[191502]]ディープラーニング技術を使用して問題を解決する際に最もよく見られる障害は、モデル...

AI によってビデオの偽造が容易になるのでしょうか?

ああ、あの時のビデオテープが本当にあればよかったのに!ジェームズ・コミー氏は6月8日、上院情報委員会...

工業情報化部:チップやオペレーティングシステムなどのトップレベルの基盤にブレークスルーがなければ、AI業界は空中楼閣になるだろう

12月17日、浙江省徳清国際会議センターで2019年中国スマート企業発展フォーラムが開催され、工業情...