Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

ジェマとは

ジェマ 軽量で最先端のオープンモデルシリーズで、  ジェミニ 同じ研究と技術をモデル化します。 Google DeepMind と Google の他のチームによって開発された Gemma は、ふたご座にヒントを得たもので、その名前は「宝石」を意味するラテン語の gemma を反映しています。 Google は、モデルの重み付けのリリースに合わせて、開発者のイノベーションをサポートし、コラボレーションを促進し、Gemma モデルの責任ある使用をガイドするための関連ツールもリリースします。

知っておくべき重要な詳細は次のとおりです。

  • モデルウェイトには、Gemma 2B と Gemma 7B の 2 つのサイズがあります。事前トレーニング済みおよび命令調整済みのバリアントが各サイズごとにリリースされます。
  • 新しい「Responsible Generative AI Toolkit」は、Gemma を使用してより安全な AI アプリケーションを作成するためのガイダンスと基本ツールを提供します。
  • すべての主要フレームワーク (JAX、PyTorch、TensorFlow) およびネイティブの Keras 3.0 の推論と教師あり微調整 (SFT) 用のツールチェーンが提供されます。
  • すぐに使用できる Colab および Kaggle ノートブック、および Hugging Face、MaxText、NVIDIA NeMo、TensorRT-LLM などの一般的なツールとの統合により、Gemma を簡単に使い始めることができます。
  • 事前トレーニング済みで命令調整済みの Gemma モデルは、ノートパソコン、ワークステーション、または Google Cloud で実行でき、Vertex AI および Google Kubernetes Engine(GKE)に簡単にデプロイできます。
  • NVIDIA™ (NVIDIA®) GPU や Google Cloud TPU など、複数の AI ハードウェア プラットフォームにわたる最適化により、業界をリードするパフォーマンスが保証されます。
  • 利用規約は、責任ある商業的使用および配布を許可します。

Gemma モデルは、現在市場で最大かつ最も強力な AI モデルである Gemini とテクノロジーおよびインフラストラクチャ コンポーネントを共有しています。これにより、Gemma 2B および 7B は、他のオープン モデルと比較して、その規模でクラス最高のパフォーマンスを実現できます。さらに、Gemma モデルは開発者のラップトップまたはデスクトップ コンピューターで直接実行できます。驚くべきことに、Gemma は主要なベンチマークで大型モデルを上回り、安全性と責任ある出力に関する厳しい基準も満たしています。

上図の評価データから判断すると、Gemma 7Bモデルの性能はすでに同レベルのLlma-2 7Bよりも優れており、Llama-2 13Bも完全に上回っています。次回は、ジェマの最新モデルをいち早く体験する方法を紹介します。

オラマがジェマを運営

まず、コンピュータにollama [1]がインストールされていることを確認してください。まだインストールしていない場合は、「わずか数分で大規模なローカル言語モデルをデプロイ!」という記事を参照してください。

ollama を正常にインストールしたら、コマンド ラインに次のコマンドを入力して、Gemma 2b または Gemma 7b モデルを実行できます。

 ollama run gemma:2b # Or ollama run gemma:7b

このコマンドを実行すると、Gemma 2B または Gemma 7B モデルが自動的にダウンロードされます。コンピュータに十分なメモリがある場合は、次のコマンドを使用して、量子化されていないバージョン、つまり精度の高いバージョンをインストールし、より良い結果を得ることができます。

 ollama run gemma:2b-instruct-fp16 # Or ollama run gemma:7b-instruct-fp16

ollamaに加えて、 llama.cpp [2]も使用できます。  またはgemma.cpp [3]  ジェマを体験しに来てください。

llama.cpp Gemma を実行する

ソース: https://github.com/ggerganov/llama.cpp/pull/5631

gemma.cpp Gemmaを実行する

ソース: https://github.com/google/gemma.cpp

この記事では、Google の最新の Gemma オープンソース モデルを体験する 3 つの方法を紹介します。興味のある方は、このモデルの効果を体験してください。

参考文献

[1]オラマ:   https://ollama.com/

[2]llama.cpp:   https://github.com/ggerganov/llama.cpp

[3] gemma.cpp:   https://github.com/google/gemma.cpp


<<:  Karpathy が OpenAI を離れ、2 時間の AI コースを開始! GPTトークナイザーをゼロから構築する

>>:  モデル融合、ハイブリッド専門家、小規模LLM、2024年のLLMの発展方向を理解するためのいくつかの論文

ブログ    

推薦する

人工ニューラル ネットワークのドライバー: 活性化関数とは何ですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

未来:ビッグデータとAIがあなたをより深く理解する

今の時代の発展は本当に速すぎます、それを今実感していただけると思います。 3G から 4G、そして ...

高品質なマルチビュー画像生成、シーン素材を完璧に再現! SFUらはMVDiffusionを提案した

フォトリアリスティックな画像生成は、仮想現実、拡張現実、ビデオゲーム、映画制作などの分野で幅広く応用...

言語学における人工知能技術の応用

1990年代初頭、中国の著名な学者である周海中氏は、人工知能技術がさまざまな分野で広く使用され、予想...

Google のロボットアームはハンカチなど、柔らかいものも硬いものもつかむことができます。 ICRA 2021が承認されました

現在、ロボットに関する研究は、主に特定の形状の物体を掴むためのロボットアームの設計に焦点を当てていま...

アルゴリズム問題演習 - 大規模ブラックリスト IP マッチング

多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...

新たなブレークスルー:科学者が脳のようなナノワイヤネットワークを開発し、AIが人間のリアルタイム学習と記憶を模倣できるようにする

11月3日、研究者らは脳内の神経ネットワークを模倣することで動的に学習し記憶できる物理的なニューラル...

無人RV、全電動、未来は明るい

科学技術の急速な発展は、自動車産業の技術進歩を直接的に推進してきました。自動運転は自動車と技術の結晶...

AI主導のサプライチェーンが業界の変革を加速させる方法

アラブ首長国連邦(UAE)の企業がほぼ全面的にクラウドに移行する前に、政府はすでに大規模なデジタル変...

...

ブロックチェーンとAI: 完璧な組み合わせ

ブロックチェーンと人工知能は、現在最もホットなテクノロジートレンドの 2 つです。これら 2 つの技...

...

バナナの皮をむくのに9つの手順が必要ですか?ロボットが果肉を傷つけないように、研究者たちは何百本ものバナナの皮をむくのに13時間を費やした。

ビッグデータダイジェスト制作著者: カレブボストン・ダイナミクスを例に挙げると、ロボットはますます多...

決定木からランダムフォレストへ: ツリーベースアルゴリズムの原理と実装

この記事では、決定木の数学的詳細(およびさまざまな Python の例)とその長所と短所について説明...