Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

2020年11月、Appleは速度と強力な機能の点で驚異的なM1チップを発売しました。 2022年にAppleはM2を発売し、今年10月にはM3チップが正式にデビューしました。

Apple はチップをリリースする際に、チップ上で AI モデルをトレーニングおよび展開する機能にも大きな重点を置いています。

Apple の ML Compute を使用して、Mac 上で TensorFlow モデルをトレーニングできます。 PyTorch は、Apple Metal Performance Shaders (MPS) をバックエンドとして使用し、Mac の M1 バージョンで GPU アクセラレーションされた PyTorch 機械学習モデル トレーニングをサポートします。これにより、Mac ユーザーはニューラル ネットワークをローカルでトレーニングできるようになります。

現在、Apple は、Apple チップ上での機械学習専用のオープンソース配列フレームワークである MLX のリリースを発表しました。

MLX は、機械学習研究者が AI モデルを効率的にトレーニングおよび展開できるように特別に設計されています。フレームワーク自体の設計も概念的にはシンプルです。研究者は MLX を簡単に拡張および改善して、新しいアイデアを迅速に探索およびテストできます。 MLX のデザインは、NumPy、PyTorch、Jax、ArrayFire などのフレームワークからインスピレーションを得ています。

プロジェクトアドレス: https://github.com/ml-explore/mlx

Apple の機械学習研究 (MLR) チームの研究者であり、MLX プロジェクトの貢献者の 1 人である Awni Hannun 氏は、MLX フレームワークを使用して Llama 7B を実装し、それを M2 Ultra で実行するビデオを公開しました。

MLX はすぐに機械学習研究者の注目を集めました。 TVM、MXNET、XGBoost の作者であり、カーネギーメロン大学の助教授、OctoML の CTO である Chen Tianqi 氏は、「Apple チップには新しいディープラーニング フレームワークが搭載されています」とリツイートしました。

一部のネットユーザーはMLXについてコメントし、Appleが再び「車輪の再発明」をしたと述べた。

画像出典: https://twitter.com/ofervic/status/1732305883814596953

MLX の機能、例

このプロジェクトでは、MLX には次の主な機能があることがわかります。

使い慣れた API 。 MLX には、NumPy に非常によく似た Python API と、フル機能の C++ API (Python API に非常によく似ています) があります。 MLX には、API が PyTorch と非常によく似ている、より複雑なモデルの構築を簡素化できる高レベル パッケージ (mlx.nn や mlx.optimizers など) もあります。

構成可能な関数変換。 MLX は、自動微分、自動ベクトル化、計算グラフ最適化を備えた構成可能な関数変換を特徴としています。

遅延評価。 MLX での計算は遅延され、配列は必要な場合にのみインスタンス化されます。

動的グラフ構築。 MLX の計算グラフ構築は動的であり、関数パラメータの形状を変更してもコンパイル速度が低下することはなく、デバッグもシンプルで使いやすいです。

マルチデバイス。操作は、CPU や GPU など、サポートされている任意のデバイスで実行できます。

統合メモリ。 MLX と他のフレームワークの大きな違いは、配列がメモリを共有する統合メモリです。 MLX での操作は、モバイル データを必要とせずに、サポートされている任意のデバイス タイプで実行できます。

さらに、このプロジェクトでは、MNIST の例など、MLX フレームワークを使用するさまざまな例が提供されており、MLX の使用方法を学ぶのに適しています。

画像ソース: https://github.com/ml-explore/mlx-examples/tree/main/mnist

MLX には、次のような便利な例が他にもたくさんあります。

  • Transformer言語モデルのトレーニング。
  • LLaMA 大規模テキスト生成と LoRA 微調整。
  • 安定した拡散により画像が生成されます。
  • OpenAI の Whisper 音声認識。

詳細なドキュメントについては、https://ml-explore.github.io/mlx/build/html/install.html# を参照してください。

<<:  人間を超えた最初の専門家! OpenAIが混乱に陥る中、Googleのマルチモーダル大規模モデルGeminiがそれを打ち負かす

>>:  Googleがこれまでで最も強力なAIモデル「Gemini」を発表

ブログ    
ブログ    

推薦する

2019年の自動運転のキーワード:冬眠と迂回による救国

何年もの間大騒ぎされていた自動運転の人気も、ようやく落ち着いてきた。世界の資本市場が寒い冬の時期に入...

YOLOはまだ死んでいません! YOLOv9がリリースされました:パフォーマンスと速度SOTA〜

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ヴィンセントの3Dモデルが大躍進しました! MVDreamは、超リアルな3Dモデルを一文で生成します

すごいですね!数語を入力するだけで、美しく高品質な 3D モデルを作成できるようになりました。ちょう...

適切な機械学習アルゴリズムを簡単に選択する方法を教えます。

[[327632]] 【51CTO.com クイック翻訳】この質問に対する単純で明確な答えはありま...

最高データおよび分析責任者は、AI 投資の収益をどのように見ているのでしょうか?

[[344785]] 2020 年の夏、同僚の Laks Srinivasan と私は、RoAI ...

これらの「ブラックテクノロジー」は洪水対策をよりスマートにする

現在、我が国の南北はともに洪水の季節を迎え、大雨が頻繁に発生し、洪水の予防と制御は危機的な段階に達し...

「幻想」を消し去れ! Google の新しい ASPIRE メソッドにより、LLM は自己採点が可能になり、その効果はボリューム モデルよりも 10 倍優れています。

大規模モデルの「幻覚」問題は解決されつつあるのでしょうか?ウィスコンシン大学マディソン校とグーグルの...

知っておくべき6種類のニューラルネットワーク

[51CTO.com クイック翻訳]ニューラルネットワークは人工知能の分野で非常に人気が高まっていま...

スマートロボットが顧客サービスに革命を起こす

カスタマー サービスにおけるインテリジェント ボットは顧客データを収集して分析し、消費者の行動や好み...

...

...

エッジ AI ソフトウェア市場は 2023 年までに 11 億 5,000 万ドルに達する見込み

市場調査会社MarketsandMarketsによると、世界のエッジ人工知能(エッジAI)ソフトウェ...

2021 年のロボティック プロセス オートメーション (RPA) 面接の 6 つの質問

[[379840]] [51CTO.com クイック翻訳] 求職者や採用担当者は、RPA 面接にどう...

受注収益が7億人民元を超えるPercentが、なぜこれほど爆発的な成長を遂げることができたのでしょうか?

2009年に設立されたPercentage Pointは、間違いなく中国のビッグデータ産業の発展の...

500以上の研究と50以上のモデルを網羅したコードビッグモデルレビューがここにあります

BERT や GPT などの事前トレーニング済みのトランスフォーマーの登場により、言語モデリングは近...