実装のアイデアと手順軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmony 標準システムに移植し、OpenHarmony で実行できるバイナリ製品をコンパイルします。 (InferLLM は、量子化されたモデルを LLM にローカルに展開できるシンプルで効率的な LLM CPU 推論フレームワークです) OpenHarmony NDK を使用して、OpenHarmony 上で InferLLM 実行可能ファイルをコンパイルします (具体的には、OpenHarmony lycium クロスコンパイル フレームワークを使用し、いくつかのスクリプトを記述します。次に、それらを tpc_c_cplusplusSIG リポジトリに保存します)。 DAYU200に大規模な言語モデルをローカルにデプロイするInferLLM 3 パーティ ライブラリ コンパイル製品をコンパイルして取得するOpenHarmony SDK をダウンロードするには、ダウンロード アドレス:http://ci.openharmony.cn/workbench/cicd/dailybuild/dailyList このリポジトリをダウンロードする
InferLLM の 3 者ライブラリ ヘッダー ファイルと生成されたライブラリを取得します。InferLLM-405d866e4c11b884a8072b4b30659c63555be41d ディレクトリは、コンパイルされた 32 ビットおよび 64 ビットのサードパーティ ライブラリを含む tpc_c_cplusplus/thirdparty/InferLLM/ ディレクトリに生成されます。 (関連するコンパイル結果は、lycium ディレクトリの下の usr ディレクトリにパッケージ化されません)。 コンパイルされた製品ファイルとモデルファイルを開発ボードにプッシュして実行します。
InferLLM 三部ライブラリを移植して、OpenHarmmony デバイス rk3568 に大規模な言語モデルを展開し、人間とコンピューターの対話を実現します。最終的な実行効果は少し遅く、人間とコンピューターのダイアログボックスが少しゆっくりとポップアップするので、しばらくお待ちください。 |
<<: GPT-4/Llama2のパフォーマンスを大幅に向上させるためにRLHFは必要ない、北京大学のチームはAlignerの新しいアライメントパラダイムを提案
結核は古代の呼吸器感染症として人類の歴史を通じて存在し、何億人もの命を奪い、「白ペスト」として知られ...
中国科学院物理研究所とプリンストン大学による2本の否定的な論文の発表により、LK-99に対する人々の...
図1: 負荷分散アルゴリズムの改善が必要[[91541]]図2: 開発者対テスター、非常に奇妙な図[...
[[209139]] Data Incubator は最近、Github と Stack Overf...
多くの人が驚くことに、Web 開発の分野で常に人気がある JavaScript は、大規模言語モデル...
人工知能は組織内で大きな変化をもたらしますが、変化とともに、AI が仕事を奪ってしまうのではないかと...
本日 Nature 誌に掲載された論文で、IBM Research のポスドク研究員 Stefano...
新型コロナウイルス感染症のパンデミックは、がんとの戦いにおいて医療界に重要な教訓を浮き彫りにした。そ...
都市はバスに大金を賭けている。パンデミックが沈静化し、アメリカ人が仕事に復帰するにつれ、全国の都市や...
[[207258]]コンピューター ビジョンはテクノロジー企業にとって恩恵となりつつあり、これまでは...
[[320195]]ビッグデータにより自動運転の未来が可能になります。自動運転は自動車メーカーの間で...
「Dlib は、高度なソフトウェアを作成するための機械学習アルゴリズムとツールの最新の C++ ツー...