0コードの微調整大型モデルが人気で、わずか5ステップで、コストは150元と低い

0コードの微調整大型モデルが人気で、わずか5ステップで、コストは150元と低い

0 コードの大規模モデルを20 ドル未満で微調整できますか?

プロセスも非常に簡単で、必要なステップは 5 つだけです

LLaMA、GPT、StableLM などの一般的なオープンソース生成モデルを処理できます。

写真

これは、最新の人気 API プラットフォームであるMonster APIです。

オープンソース分野におけるこの新たな取り組みは、AI開発におけるゲームのルールを書き換え、AIの応用速度を加速させることができると考える人もいます。

写真

中には、GPT-3/GPT-4 に後から接続されるのかと興奮気味に尋ねる人もいました。

写真

それで、それは具体的にどのように達成されるのでしょうか?

コーディングなしで5ステップで完了

簡単に言えば、Monster API は微調整の手順を可能な限り簡素化し、開発者が一連の設定を手動で実行する必要がなくなると同時に、安価な GPU リソースとメモリの最適化も提供します。

具体的なプロセスは以下のとおりです。

最初のステップは、微調整するモデルを選択することです

たとえば、LLaMA-7B、GPT-J-6B、StableLM-7B などです。Monster API は、少なくとも 10 個の基本的な大規模モデルを提供します。

写真

2 番目のステップは、微調整タスクを選択または作成することです。たとえば、指示の微調整、テキスト分類、カスタム タスクなどです。

写真

3 番目のステップは、HuggingFace データセットを選択することです。

Monster API は、幅広いオプションを提供する HuggingFace データセットをシームレスに統合できます。また、タスクの種類に基づいてデータセットを推奨することもできます。

手動で行う必要はなく、フォーマットは自動的に設定されます。

写真

4 番目のステップは、ハイパーパラメータを設定することです。

写真

ステップ 5 : 確認して送信します。

上記の手順をすべて設定したら、エラーがないことを確認し、送信してください。

Monster API は、WandB のログを通じてタスクを監視できることを示します。

彼はブログに、DataBricks Dolly 15k を使用して LLaMA-7B を微調整し、3 つのエポーチを完成させるのにかかる費用は 20 ドル未満 (約 144 人民元) だと書いています。

公式サイトでは、登録後にユーザーに2,500ポイントが付与されると記載されています。メンバーシップは 3 つのレベルに分かれており、それぞれ月額 9 ドル、29 ドル、39 ドルの料金がかかります。

写真

Monster API は、微調整に加えて、生成 AI 用のさまざまな API インターフェースも提供しており、他のソリューションよりもコストが 80% 低いと主張しています。

写真

この会社は110万ドルの資金を調達した。

報道によると、Monster API を開発する会社は、プレシード資金として110 万ドルを調達したとのことです。

この AI スタートアップは、世界中に散在する GPU リソースを柔軟にスケジュールし、開発者がより低価格で利用できるようにすることで、自らを「GPU 分野の Airbnb」と位置づけています。

写真

創設者は Gaurav Vij と Saurabh Vij の 2 人の兄弟です。

Gaurav Vij 氏も CV 会社を設立しました。CV 会社が巨大なクラウド コンピューティング資本に直面する必要があったため、このようなプラットフォームを作成するというアイデアが生まれました。

Saurabh Vij 氏は以前は CERN の素粒子物理学者であり、そこで分散コンピューティングの研究も行っていました。

兄弟は、数回の技術的な反復を経て、機械学習タスクにおけるコンシューマーグレードの GPU のパフォーマンスを最適化し、AWS プラットフォームと比較して Whisper AI モデルの実行コストを 90% 削減できたため、この方法を使って何万人もの開発者を支援してみようと考えたと述べています。

同時に、同社の顧客の1社が分散型GPUコンピューティングリソースを使用することで30万ドルを節約したことも明らかにした。

参考リンク:
[1] https://blog.monsterapi.ai/no-code-fine-tuning-llm/

[2] https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/


<<:  AIによる教育革命:自己主導型およびガイド型適応型学習の包括的分析

>>:  5400億パラメータの大規模モデル進化ツリーが大幅に更新されました!最も詳細なプロンプトスキルを備えた85ページのLLM開発履歴

ブログ    
ブログ    
ブログ    

推薦する

科学者はロボットに人間に近い触覚を与える人工指先を開発

ロボットは車を持ち上げたり、手術を手伝ったりするようにプログラムできますが、卵など、これまで扱ったこ...

「激怒」するビッグモデルがレコメンデーションシステムと衝突したとき

ChatGPTに代表される大規模モデル技術の急速な発展により、レコメンデーションシステムは革命的な変...

人工知能、VR、音声検索、従来のマーケティングモデルを変える「三銃士」

人工知能と関連技術はマーケティングの未来を変えつつあり、仮想現実 (VR)、音声検索、人工知能はマー...

人工知能(AI)の人間的側面を探る

新興技術である AI はこれまで多くの課題に直面しており、今後も直面し続けるでしょう。一方で、消費者...

DiDiのグローバルDi-Techアルゴリズムコンテストが終了し、中国のプレイヤーが10万ドルの優勝賞金を獲得した。

7月20日、滴滴出行の第一回グローバルDi-Techアルゴリズムコンテストが本日正式に終了しました...

人工知能の大学が雨後の筍のように次々と誕生しています。そこでは何を教えるのでしょうか?どのように教えるか?

[[240090]] 2018年グローバル人工知能製品アプリケーション博覧会で、来場者がテーマポス...

JD テクノロジー オープン デー第 4 号 - 電子商取引推奨検索システムのアーキテクチャとアルゴリズムの実践

第 4 回「JD テクノロジー オープン デー」イベントは、9 月 27 日に北京市宜荘区の超林広場...

...

国内の多くの大学が共同でオープンソースコミュニティLAMMを構築しています。マルチモーダル言語モデルファミリーに参加する時が来ました

ChatGPTの登場以来、大規模言語モデル(LLM)は飛躍的な発展を遂げ、自然言語に基づく人間とコン...

...

インタラクティブな推測 | ワールドカップとブラックテクノロジーが出会ったとき、最終的な勝者は誰になるでしょうか?

[オリジナル記事は51CTO.comより] 2018年ロシアワールドカップはエキサイティングな決勝...

新しいアルゴリズムとアーキテクチャ メトリックを備えた Lattix 5.0 アーキテクチャ管理ソフトウェアがリリースされました

Lattix は最近、インフラストラクチャ管理ソフトウェアのバージョン 5.0 をリリースしました。...

PyTorch のデータセット Torchvision と Torchtext

[[421061]] PyTorch がさまざまな種類のデータを読み込んで処理できるように、公式で...

人工知能と自然言語処理の概要: AI の 3 つの主要段階と NLP の主な応用分野

最近、Xenonstack は Jagreet Kaur 氏による「人工知能の概要とビッグデータにお...

機械分野では人材不足が起きているのでしょうか?人工知能の時代はあなたが思っているよりもずっと早く来ています!

人工知能の時代が来るとよく言われます。20年後に私たちの子供たちが社会に出たとき、彼らはおそらくロボ...