モデル推論が5〜20倍向上します。1行のコードで複数のDLコンパイラをテストできます。ハードウェアを理解していなくてもこのライブラリを使用できます。

モデル推論が5〜20倍向上します。1行のコードで複数のDLコンパイラをテストできます。ハードウェアを理解していなくてもこのライブラリを使用できます。

最近、reddit の投稿がネットユーザーの間で大きな議論を呼びました。投稿の主な内容は、「AI モデルの最適化がいかに簡単かを知っている人はほとんどいません。数行のコードを追加するだけで、モデルの推論速度を 5 ~ 20 倍に上げることができます。」というものでした。

ポスターを掲げるのは、スタートアップ企業 Nebuly の共同設立者兼 COO であるエミール・コートハウド氏です。コートハウド氏は、現在の開発者は AI、データセットのクリーニング、モデルのトレーニングには熟練しているものの、ハードウェア、コンパイラ、コンピューティング、クラウド コンピューティングなどの側面に関する知識が不足していると考えています。その結果、開発者は適切なハードウェアを選択することの重要性を認識せずに、ソフトウェアのパフォーマンスの向上に多くの時間を費やすことになります。

この問題は長い間 Courthoud 氏を悩ませてきました。そこで彼と Nebuly の数人の友人 (全員 MIT、ETH、EPFL 出身) は、DL コンパイラー技術を採用し、ハードウェアについて何も知らない開発者でもアクセスできる nebullvm というオープン ソース ライブラリに多大な労力を費やしました。このライブラリは、すべてのオープン ソース AI コンパイラーを同じ使いやすいインターフェイスに統合することを目指しています。

Nebullvm はどのように機能しますか?全体的には、さまざまな DL (ディープラーニング) コンパイラをテストし、ユーザーに最適なものを選択することで、ユーザーが使用する AI モデルをマシン (CPU、GPU など) と最適に結合し、モデルを約 5 ~ 20 倍高速化し、わずか数行のコードで完成させることができます。

プロジェクトアドレス: https://github.com/nebuly-ai/nebullvm

Nebullvm プロジェクトの紹介

ユーザーは、次の状況で Nebullvm ライブラリを使用することを選択できます。

  • AI モデルの応答時間を高速化したい。
  • 市場にあるすべての DL コンパイラをテストするのではなく、特定のアプリケーションに最適なコンパイラを知りたいだけです。
  • 私は複雑な問題を単純化するのが好きだし、ほんの数行のコードでどの DL コンパイラが自分にとって最適かを知りたいのです。

プロジェクトの作成者は、非常に使いやすいものを設計しました。DL モデルを入力するだけで、ハードウェアに一致する最適なモデル バージョンが得られます。

現在、このプロジェクトは PyTorch や TensorFlow などのフレームワークをサポートしており、まもなく Hugging Face もサポートする予定です。サポートされている DL コンパイラには、OpenVINO、TensorRT、TVM が含まれ、Rammer と MLIR も近々サポートされる予定です。

nebullvm をインストールするには、ソース コードを使用してインストールできます。git を使用してインストールする方法は次のとおりです。

 git クローンhttps://github.com/nebuly-ai/nebullvm.git

次にリポジトリに移動し、pip を使用して nebullvm をインストールします。

 cd ネブルlvm
pip をインストールします

PyPiのインストール: nebullvmをインストールする最も簡単な方法は、pipを使用して次のコードを実行することです。

 pip インストールnebullvm

自動インストールの方法は次のとおりです。この方法では、nebullvm でサポートされているすべての DL コンパイラを自動的にインストールできます。

 python - c "nebullvm をインポート"

ただし、自動インストールを回避したい場合は、次の方法を使用できます。

 エクスポートNO_COMPILER_INSTALLATION = 1

または、コマンドラインから追加します。

 インポートOS
os . environ [ "NO_COMPILER_INSTALLATION" ] = "1"

nebullvm をインストールしたら、使用できます。次のコードは、nebullvm を使用して pytorch モデルを最適化する例を示しています。

 >>> トーチをインポート
>>> torchvision.models モデルとしてインポートします
>>> nebullvm からoptimize_torch_model をインポートします
>>> モデル= models.efficientnet_b0 ( )
>>> bs入力サイズ= 1 、[( 3256256 )]
>>> save_dir = "."
>>> 最適化モデル= 最適化トーチモデル(
... モデルbatch_size = bsinput_sizes = input_sizessave_dir = save_dir
...
>>> x = torch.randn (( bs , * input_sizes [ 0 ]) )
>>> res = 最適化されたモデル( x )


<<:  AIファースト戦略に移行する5つの方法

>>:  清華大学 IEEE 論文: 自動運転の判断を支援する新しいトレーニング方法を使用して「路側干渉」を排除

ブログ    
ブログ    

推薦する

...

AI投資を最大限に活用するための6つのステップ

人工知能は、将来の発展にとって大きな破壊的技術の 1 つであるとよく考えられています。これにより、多...

教師あり学習、教師なし学習、強化学習とは何ですか?ついに誰かが明らかにした

[[337832]] 01 用語このセクションでは、機械学習の概要とその 3 つの分類 (教師あり学...

2021 年の Python 機械学習ライブラリ トップ 10

Python は機械学習にとって最も鋭い武器であると言えます。また、機械学習は Python の影...

...

...

...

ナレッジグラフリテラシー

過去 2 年間で、Linking Open Data などのプロジェクトの本格的な開発により、セマン...

AIと行動科学がワクチン接種への躊躇にどう対処できるか

Fractal Analytics の共同創設者 Ram Prasad 氏は、AI が問題領域の特定...

深さ優先探索 (DFS) と幅優先探索 (BFS) の 2 つのアルゴリズムの詳細な説明

序文深さ優先探索 (DFS) と幅優先探索は、グラフ理論における非常に重要な 2 つのアルゴリズムで...

クラウドに人工知能を導入する際の 10 の考慮事項

クラウド コンピューティングは、あらゆる規模の企業がインターネット経由で多様なオンデマンドの仮想 I...

市場規模は約16.8億元に達しました!物流と配送がドローンと出会う

現在、ナビゲーションや通信などの技術が継続的に進歩し、ドローンの開発はより成熟し、業界の規模も拡大し...

...

...

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。私たちは古代の真空管...