「トランスフォーマーの挑戦者」MambaがMacBookで実行できるようになりました! 誰かが GitHub で、Mamba を最も簡単な方法で実行できるというメモを共有しました。 この共有には取扱説明書を含めてたった3つのファイルしかありませんが、公開されてから1日も経たないうちに500以上のスターを獲得しています。 写真 Mamba は、言語タスクやその 2 倍のサイズの Transformer と同等のパフォーマンスを発揮する新しい大規模モデル アーキテクチャです。 ただし、公式バージョンではモデル ファイルのみが提供されており、展開して使用するには一定の専門知識が必要であり、実行するには Linux+N カードが必要です。 写真 このノートにより、Mamba を実行する手順が大幅に簡素化され、N カードが不要になったため、M シリーズの MacBook でも実行できるようになりました。 これを見た関連職業に就いているネットユーザーたちは、この簡素化されたモデルは本当に素晴らしいと述べ、自分たちの仕事もこの方向に進むことを望んでいると語った。 写真 オリジナルの『マンバ』の著者であるトリ・ダオ氏とアルバート・グ氏もこのメモを転送し、そのシンプルさと読みやすさを称賛した。 写真 では、このメモはどのように使用すればよいのでしょうか? 2つのファイルを実行できるまず、Jupyter、VSCode、オンライン Google Colab など、PyTorch ノートブックを実行できるツールを開きます。 次に作者のメモとPythonスクリプトをダウンロードします。Colabを使用している場合は、GitHubのインポート機能も使用できます。 ローカルで実行する場合は、2 つのファイルを同じディレクトリに配置する必要があります。Colab を使用する場合は、接続が成功した後に model.py をアップロードする必要があります。 アップロードしないと、「モデルが見つかりません」というエラーメッセージが表示されます。 次に、必要な依存関係環境をインストールします。Colab では、einops を手動でインストールする必要があります。他のツールでは、エラー情報に基づいて不足している依存関係を判断できます。
写真 依存関係の問題を解決したら、最初のノートのグループにある実行ボタンをクリックできます。ここで、モデルのスケールを選択できます。デフォルトは 370M です。 写真 次は初期化です。実行ボタンをクリックするだけです。 出力トークンの数もここで調整できます。デフォルトは 50 です。 写真 次に、注記にいくつかの例を示します。プロンプトの内容を一重引用符で囲んで変更することもできます (改行は \n で表されます)。その後、[実行] をクリックします。 ただし、ここでのプロンプトは、ChatGPT などのボット アプリケーションを通常使用する方法とは異なることに注意してください。 写真 ここで、Hugging Face の Llama 2 のシステム プロンプトの単語を借用します。 以下は、さまざまな人々と AI アシスタントとの一連の対話です。AI は、親切で、礼儀正しく、正直で、洗練されていて、感情に敏感で、謙虚でありながら知識豊富であろうとします。アシスタントは、ほとんど何でも喜んで手伝ってくれ、必要なことを正確に理解するために最善を尽くします。また、誤った情報や誤解を招く情報を提供することを避け、正しい答えがわからない場合は警告します。とはいえ、アシスタントは実用的で、本当に最善を尽くしており、用心深さが役に立つことの妨げにならないようにしています。ユーザー: 質問アシスタント: 写真 パフォーマンスの面では、デフォルトのスケールと出力長 (370M、50 トークン) では、Once Upon a time の入力に Colab の純粋な CPU バージョンでは約 1 分、TPU では約 30 秒かかり、メモリ消費量は 3 ~ 4 GB になります。 写真 M1 チップを搭載した Mac では、同じ設定で同じコンテンツを処理するのに約 1 分半かかります。 写真 しかし、著者は、読みやすさを考慮して、オリジナルの Mamba の一部の加速命令が削除されたことも説明しました。 写真 参考リンク: https://news.ycombinator.com/item?id=38708730 |
著者の劉玉樹氏は中国人民大学重陽金融研究所学務委員会委員、マクロ研究部部長、研究者である。本稿は11...
今世紀の前半には、巨大な片腕の巨人のような産業用ロボットがロボット工学の分野を支配していました。産業...
多項式回帰は線形回帰の改良版です。線形回帰を知っていれば、簡単に理解できるでしょう。そうでない場合は...
ビデオ会議 264 ビデオ圧縮 - SVC H.264 には、階層化されたエンコードを可能にする S...
シャム・ナンダン・ウパディヤイノアが編集制作:51CTO テクノロジースタック(WeChat ID:...
AIを活用して企業業務の自動化プロセスを加速し、デジタルトランスフォーメーションや業務プロセスのアッ...
[[434311]]もともと Protobuf の原理を勉強したかったのですが、研究の過程で Pr...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
8月11日はHuawei Developer Conferenceの3日目であり、カンファレンスの議...
【51CTO.comオリジナル記事】この記事では主に、フレームワークの概要、システム アーキテクチャ...
テクノロジー業界ではレイオフの波が起こっているものの、IT 市場は依然として成長を続けています。ガー...