Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

ジェマとは

ジェマ 軽量で最先端のオープンモデルシリーズで、 ジェミニ 同じ研究と技術をモデル化します。 Google DeepMind と Google の他のチームによって開発された Gemma は、ふたご座にヒントを得たもので、その名前は「宝石」を意味するラテン語の gemma を反映しています。 Google は、モデルの重み付けのリリースに合わせて、開発者のイノベーションをサポートし、コラボレーションを促進し、Gemma モデルの責任ある使用をガイドするための関連ツールもリリースします。

知っておくべき重要な詳細は次のとおりです。

モデルウェイトには、Gemma 2B と Gemma 7B の 2 つのサイズがあります。事前トレーニング済みおよび命令調整済みのバリアントが各サイズごとにリリースされます。
新しい「Responsible Generative AI Toolkit」は、Gemma を使用してより安全な AI アプリケーションを作成するためのガイダンスと基本ツールを提供します。
すべての主要フレームワーク (JAX、PyTorch、TensorFlow) およびネイティブの Keras 3.0 の推論と教師あり微調整 (SFT) 用のツールチェーンが提供されます。
すぐに使用できる Colab および Kaggle ノートブック、および Hugging Face、MaxText、NVIDIA NeMo、TensorRT-LLM などの一般的なツールとの統合により、Gemma を簡単に使い始めることができます。
事前トレーニング済みで命令調整済みの Gemma モデルは、ノートパソコン、ワークステーション、または Google Cloud で実行でき、Vertex AI および Google Kubernetes Engine（GKE）に簡単にデプロイできます。
NVIDIA™ (NVIDIA®) GPU や Google Cloud TPU など、複数の AI ハードウェアプラットフォームにわたる最適化により、業界をリードするパフォーマンスが保証されます。
利用規約は、責任ある商業的使用および配布を許可します。

Gemma モデルは、現在市場で最大かつ最も強力な AI モデルである Gemini とテクノロジーおよびインフラストラクチャコンポーネントを共有しています。これにより、Gemma 2B および 7B は、他のオープンモデルと比較して、その規模でクラス最高のパフォーマンスを実現できます。さらに、Gemma モデルは開発者のラップトップまたはデスクトップコンピューターで直接実行できます。驚くべきことに、Gemma は主要なベンチマークで大型モデルを上回り、安全性と責任ある出力に関する厳しい基準も満たしています。

上図の評価データから判断すると、Gemma 7Bモデルの性能はすでに同レベルのLlma-2 7Bよりも優れており、Llama-2 13Bも完全に上回っています。次回は、ジェマの最新モデルをいち早く体験する方法を紹介します。

オラマがジェマを運営

まず、コンピュータにollama ^[1]がインストールされていることを確認してください。まだインストールしていない場合は、「わずか数分で大規模なローカル言語モデルをデプロイ！」という記事を参照してください。

ollama を正常にインストールしたら、コマンドラインに次のコマンドを入力して、Gemma 2b または Gemma 7b モデルを実行できます。

 ollama run gemma:2b # Or ollama run gemma:7b

このコマンドを実行すると、Gemma 2B または Gemma 7B モデルが自動的にダウンロードされます。コンピュータに十分なメモリがある場合は、次のコマンドを使用して、量子化されていないバージョン、つまり精度の高いバージョンをインストールし、より良い結果を得ることができます。

 ollama run gemma:2b-instruct-fp16 # Or ollama run gemma:7b-instruct-fp16

ollamaに加えて、 llama.cpp ^[2]も使用できます。またはgemma.cpp ^[3] ジェマを体験しに来てください。

llama.cpp Gemma を実行する

ソース: https://github.com/ggerganov/llama.cpp/pull/5631

gemma.cpp Gemmaを実行する

ソース: https://github.com/google/gemma.cpp

この記事では、Google の最新の Gemma オープンソースモデルを体験する 3 つの方法を紹介します。興味のある方は、このモデルの効果を体験してください。

参考文献

[1]オラマ: https://ollama.com/

[2]llama.cpp: https://github.com/ggerganov/llama.cpp

[3] gemma.cpp: https://github.com/google/gemma.cpp

<<: Karpathy が OpenAI を離れ、2 時間の AI コースを開始! GPTトークナイザーをゼロから構築する

>>: モデル融合、ハイブリッド専門家、小規模LLM、2024年のLLMの発展方向を理解するためのいくつかの論文

ブログ

Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

ジェマとは

オラマがジェマを運営

llama.cpp Gemma を実行する

gemma.cpp Gemmaを実行する

人工知能と5Gの完璧な組み合わせは人類に全く新しい体験をもたらすかもしれない

研究によると、AIシステムは大量のエネルギーを消費する

BEV の可能性の限界を探ろう! DA-BEV: 新しい教師なし BEV SOTA ソリューション!

買い物客の4分の3がレジなし店舗を試してみたいと考えている

テレンス・タオは数学の問題を解くために大規模なモデルを使用しています。コードの生成とLaTeXの数式の編集は非常に便利です。

アリババは、DAMOアカデミーの1990年代生まれの科学者が開発した新世代のAIアルゴリズムモデルをオープンソース化しました。

AI が「もや」を取り除くのに役立ちます: うつ病の治療における機械学習の応用

推薦する

顔認証の時代が本当に到来しました。あなたも参加してみませんか？

生体認証に関する最大の誤解は何ですか?

ドローンは将来のスマートシティで重要な役割を果たすだろう

TensorFlow 2.8.0が正式にリリースされ、多くのバグが修正され、50以上の脆弱性パッチがリリースされました

Quark App、健康検索をアップグレードし、健康モデルアプリ「Quark Health Assistant」をリリース

「あなたは私の中にいて、私はあなたの中にいる」人工知能はビッグデータと恋愛関係になりたい！

都市 AI アプリケーションの失敗事例: 善意の自治体 AI プロジェクトはなぜ失敗したのか?

スマートシティ開発：廃棄物管理と大気質監視

救急室のAIにはもう少し人間的なケアが必要

Llama 2を破り、GPT-3.5と競合するStability AIの新モデルがオープンソースの大規模モデルのリストでトップに