行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

乗算と加算を行わずに行列の乗算を計算できますか?

行列の乗算には多数の a+b×c タイプの演算が含まれるため、乗算器と加算器が 1 つの計算ユニットに結合され、乗算と累算の演算が実行されることがよくあります。

近似アルゴリズムを使用する場合は、はい！

これはMITの最新の研究です。彼らは、一定の精度を確保しながら、既存の近似アルゴリズムの10倍の速度を実現する新しい近似アルゴリズムMADDNESSを提案しました。これは正確なアルゴリズムよりも100倍高速であり、 ICML 2021に含まれていました。

この研究では、新しいアルゴリズムは、スパース化や因数分解など最近人気の演算よりも有望である可能性があるとも考えています。

現在、作者はアルゴリズムのコードをオープンソース化しており、興味のある方は試してみることができます。

見てみましょう。

Kクラスタリングアルゴリズムを使用してルックアップテーブルを作成する

このアルゴリズムは、積量子化と呼ばれる手法を借用しています。

その中でも、量子化は本質的に近似演算です。

行列の乗算における各要素は 2 つのベクトルのドット積と見なすことができるため、多数の乗算演算を実行せずに類似のベクトルを見つけることで、ベクトルのドット積を近似的に推定できます。

積量子化の具体的な原理は次のとおりです。

計算対象のベクトルaを入力すると、関数g(·)はaに対して近似演算を実行し、事前に設定された数値参照テーブルからそれに最も近い値を見つけて、近似ベクトルg(a)を出力します。

同時に、このテーブルの各値は事前にドット積が計算されているため、g(a) を出力する際に、クエリベクトル b に対応するその近似ドット積計算結果 h(b) も参照して出力することができます。

最後に、乗算を必要とせずに g(a) と h(b) を加算するには、f(·,·) 関数を使用するだけです。

簡単に言えば、近似テーブル検索方式を使用することで、行列乗算における乗算計算時間が節約されます。

では、近似計算プロセス中に計算精度の低下を最小限に抑えるためには、このような数値参照テーブルにどのような値を設定すればよいのでしょうか。

ここでは、 K平均アルゴリズムの考え方を借用します。つまり、データをK個のグループに事前に分割し、K個のオブジェクトを初期クラスタリングセンターとしてランダムに選択し、トレーニングを反復して、サンプルがK個のクラスに分割されたときに、各サンプルとそのクラスの中心間の距離の合計が最小化されるようにします。

△ 可視化されたKクラスタリングアルゴリズム

この方法で計算された数値参照テーブルは、行列乗算の数値計算結果をより正確に近似することができます。

このアイデアに基づいて、著者らは、単一の CPU で毎秒 100 GB を超えるデータをエンコードできる効率的なベクトル積量子化関数を提案しました。同時に、低ビット幅の整数に対する高速な合計関数も提案しました。

そして、これら 2 種類の関数に基づいて、新しい行列乗算アルゴリズム MADDNESS が開発されました。

この近似はどの程度機能するでしょうか?