Llama、Llama 2 から Mixtral 8x7B まで、オープンソース モデルのパフォーマンス記録は継続的に更新されています。 Mistral 8x7B はほとんどのベンチマークで Llama 2 70B や GPT-3.5 よりも優れているため、「GPT-4 に非常に近い」オープンソース オプションとも考えられています。 少し前の論文で、このモデルの開発元である Mistral AI 社は、Mixtral 8x7B の技術的な詳細を発表し、Mixtral 8x7B – Instruct チャット モデルをリリースしました。このモデルのパフォーマンスは、人間による評価ベンチマークにおいて、GPT-3.5 Turbo、Claude-2.1、Gemini Pro、Llama 2 70B チャット モデルを大幅に上回ります。 Mixtral-Instruct は、BBQ や BOLD などのベンチマークでも偏りが少ないことが示されています。 しかし、最近ではMixtral Instructも追い抜かれてしまいました。 Nous Research という会社は、Mixtral 8x7B に基づいてトレーニングされた新しいモデル、Nous-Hermes-2 Mixtral 8x7B が、多くのベンチマークで Mixtral Instruct を上回り、SOTA パフォーマンスを達成したと発表しました。 「私の知る限り、これは Mixtral Instruct に勝る最初の Mixtral ベースのモデルであり、私の個人的なテストでは、最高のオープンソース LLM モデルかもしれません!」と、同社の共同設立者であり X プラットフォーム ユーザーでもある @Teknium (e/λ) は述べています。 モデル プロファイル カードには、モデルが 100 万を超えるエントリ (主に GPT-4 によって生成されたデータ) と、AI 分野全体のオープン データセットからのその他の高品質データでトレーニングされたことが示されています。モデルは、その後の微調整方法に応じて 2 つのバージョンに分割されます。
2 つのバージョンがリリースされた理由については、@Teknium (e/λ) が次のように説明しています。 モデルからの出力の例を次に示します。 1. データ可視化のためのコードを書く 2. サイバーパンクサイケデリック詩を書く 3. 入力テキストに基づいてプロンプトを作成する パフォーマンス数値は次のとおりです。 1. GPT4オール 2. AGI評価 3. BigBench推論テスト このモデルがリリースされてすぐに、生成 AI のスタートアップ企業 Together AI が、自社の API でこのモデルをサポートすることを発表しました。 Together AIは昨年11月に1億ドルを超えるラウンドA資金調達を完了したばかりだ。 Together AI は、Nous Research が Nous Hermes 2 Mixtral 8x7B モデルをトレーニングおよび微調整する間、コンピューティング能力のサポートを提供しました。 画像出典: https://twitter.com/togethercompute/status/1746994443482538141 Nous Researchはボランティアプロジェクトとして始まりました。同社は最近、Distributed GlobalとOSS Capitalが共同で主導し、Together AIの創設者兼CEOであるVipul Ved Reddy氏を含む数名の著名な投資家の参加を集めた520万ドルのシードラウンドを成功裏に完了しました。 Nousは2024年にNous-Forgeと呼ばれるAIオーケストレーションツールをリリースする予定です。 公式サイトの紹介から、同社の製品の位置付けは、プログラムを接続して実行し、顧客の文書を取得して分析し、生産に使用するための合成データを生成することができるということがわかります。これらの独自のシステムは、ビジネスの分野に関係なく、クライアントのニーズに合わせて微調整できます。これらの斬新なアルゴリズムを通じて、彼らはデジタルアテンションエコシステム内のこれまで構造化されていなかったテーマ別データを集約・分析し、隠れた市場動向情報を顧客に提供したいと考えています。 |
<<: Microsoft TaskWeaver オープンソース フレームワーク: データ分析と業界のカスタマイズを組み合わせてトップ エージェント ソリューションを作成
>>: ヤン・ルカンは、テンセントのポートレート写真生成が自由にできることを明かした。
近年のホットな言葉といえば、「人工知能」が挙げられます。昨年のChatGPTの人気爆発により、「AI...
マシンビジョンは急速に発展している人工知能の分野です。簡単に言えば、マシンビジョンとは、測定と判断の...
10月31日午前、杭州雲棲鎮で2023年雲棲会議が開幕した。アリババグループのジョセフ・ツァイ会長は...
これは非常に興味深い質問です。プログラマーという職業はAIによって消滅することはないと思いますが、プ...
[[416792]]この記事は、董澤潤氏が執筆したWeChat公開アカウント「董澤潤の技術ノート」か...
人工知能が台頭していることに疑いの余地はない。しかし、SF映画『バック・トゥ・ザ・フューチャー』が示...
「再帰的に自己進化する AI が人間を支配する」という問題に対する解決策はあるのでしょうか? !多く...
画像出典: Visual China 1956年、アメリカの経済学者によって「人工知能」の概念が提唱...
中国科学院が1月17日に発表したところによると、このほど中国科学院深圳先進技術研究所医療工学研究所低...
顔スキャン決済は私たちの生活に入り込んでいます。普通のスマートフォンのカメラに顔を向けるだけで、本人...
小売体験は長年にわたってあまり変わっていません。つまり、店に入って、適切な製品を見つけて、それを購入...
[51CTO.com クイック翻訳] 強化学習は自律的な意思決定を実現するのに非常に適しています。対...
Google、Facebook、Twitterなど、世界中の大手テクノロジー企業が人工知能ソリュー...
近年、人工知能がブームを迎えており、人々は合理的な分析と思考を通じて、人工知能の波をどのように利用し...