2024年のAIトレンド、このグラフをご覧ください、LeCun: オープンソースのビッグモデルがクローズドソースを上回る

2023年ももうすぐ終わりです。過去1年間で、さまざまな大型モデルがリリースされました。 OpenAIやGoogleのようなテクノロジー大手が競争する一方で、もう一つの「勢力」が静かに台頭している。オープンソースだ。

オープンソースモデルは常に疑問視されてきました。それらは独自モデルと同じくらい優れていますか?独自モデルのパフォーマンスに匹敵できますか?これまでのところ、私たちはいくつかの点でしか近づくことができませんでした。それでも、オープンソースモデルは常に、私たちが感心するような実証的なパフォーマンスをもたらします。

オープンソースモデルの台頭により、ゲームのルールが変化しています。たとえば、Meta の LLaMA シリーズは、その高速な反復性、カスタマイズ性、プライバシーの点で人気が高まっています。これらのモデルはコミュニティ内で急速に進化しており、独自のモデルに強力な挑戦をもたらし、大手テクノロジー企業の競争環境を変える可能性があります。

しかし、それ以前は、ほとんどの人の発想は「感情」から生まれたものでした。今朝、Meta の主任 AI 科学者でチューリング賞受賞者の Yann LeCun 氏が突然こう叫びました。「オープンソースの AI モデルは、独自のモデルを超えつつあります。」

ARK Invest チームが作成したこのトレンドチャートは、2024 年の AI の発展を予測する可能性が高いものと考えられています。生成 AI におけるオープンソースコミュニティと独自モデルの開発を図表化します。

OpenAIやGoogleなどの企業が、自社の最新モデルについてより閉鎖的になり、あまり公表しなくなるにつれて、オープンソースコミュニティとその企業支援者であるMetaもそれに倣い、生成AIへのアクセスを民主化し、独自モデルのビジネスモデルに挑戦する可能性があるようだ。

この散布図には、さまざまな AI モデルのパフォーマンスパーセンテージが表示されます。独自のモデルは青で表示され、オープンソースモデルは黒で表示されます。 GPT-3、Chinchilla 70B (Google)、PaLM (Google)、GPT-4 (OpenAI)、Llama65B (Meta) などのさまざまな AI モデルのパフォーマンスをさまざまな時点で確認できます。

Meta が LLaMA を初めてリリースしたとき、パラメータの数は 70 億から 650 億の範囲でした。これらのモデルのパフォーマンスは非常に優れています。130億のパラメータを持つLlamaモデルは、ほとんどのベンチマークでGPT-3（1750億のパラメータ）よりも優れており、単一のV100 GPUで実行できます。また、650億のパラメータを持つ最大のLlamaモデルは、GoogleのChinchilla-70BおよびPaLM-540Bに匹敵します。

Falcon-40B はリリース直後から Huggingface の OpenLLM ランキングでトップとなり、Llama だけが目立っていた状況を変えました。

Llama 2 はオープンソースであり、大規模モデルの世界に再び大きな変化をもたらします。 Llama 1 と比較して、Llama 2 はトレーニングデータが 40% 多く、コンテキストの長さが 2 倍になり、グループ化されたクエリアテンションメカニズムを使用します。

最近、オープンソースのビッグモデルの世界に、Yi モデルという新たなヘビー級メンバーが加わりました。一度に 40 万個の中国語文字を処理でき、中国語と英語の両方を処理できます。 Yi-34Bは、これまでにHugging Faceオープンソースモデルランキングでトップを獲得した唯一の国産モデルとなった。

散布図に示されているように、オープンソースモデルのパフォーマンスは独自のモデルに追いついています。これは、近い将来、オープンソースモデルのパフォーマンスが独自モデルに匹敵するか、それを上回ることが期待されることを意味する可能性があります。

先週末、Mistral 8x7B が最もシンプルな方法で強力なパフォーマンスを備えてリリースされ、研究者は「クローズドソースのビッグモデルは終わりを迎えた」とコメントしました。

一部のネットユーザーは、「2024年はオープンソースAIの年になるだろう」と期待し始めている。「私たちは重要なポイントに近づいています。オープンソースコミュニティプロジェクトの現在の開発速度では、今後12か月でGPT-4のレベルに到達するでしょう。」

オープンソースモデルの将来が順調に進むかどうか、またそれがどのように機能するかについては、待って見守る必要があります。

<<: GPT-4Vがロボットの頭脳として機能すると、AIで計画を立てることができなくなる可能性があります

>>: アマゾンのドローン配送部門の主要メンバーが目標未達成で辞任

あなたを偲んで！孫建博士が早朝に逝去されました。AIは偉大な人物を失い、Megviiは技術リーダーを失いました。

2024年のAIトレンド、このグラフをご覧ください、LeCun: オープンソースのビッグモデルがクローズドソースを上回る

あなたを偲んで！孫建博士が早朝に逝去されました。AIは偉大な人物を失い、Megviiは技術リーダーを失いました。

Microsoft Bing Chat が GPT-4 Turbo モデルを導入、一部のユーザーは無料で使用可能

機械学習が自閉症の「非コード変異」の秘密を解明

AI向けに構築されたコンピューターに最適なアクセサリと外部コンポーネント

AIが自動化に適した日常的なITタスク3つ

5400億パラメータの大規模モデル進化ツリーが大幅に更新されました！最も詳細なプロンプトスキルを備えた85ページのLLM開発履歴

人工知能の分野に早く参入したいJavaプログラマーですか?準備はできたか？

モンローとドラゴンマザーがあなたと話すことを学びましょう。静止画とビデオだけです

推薦する

AIがあらゆるところに存在している世界を想像してみてください

Baiduの新しい論文はGram-CTCを提案：単一システムの音声転写が最高レベルに到達

AI戦略に関するCIOの4つの優先事項

2022年のスマート製造のトレンド

SKU多次元属性状態判定アルゴリズム

業界丨2020年のインテリジェントウェーブを理解するには、BaiduとGoogleのAIの足跡から始める

清華大学の博士研究員が、AlphaCode の背後にある技術的原理を 10 分かけて説明しました。プログラマーはそう簡単に置き換えられるものではないことがわかりました。

人工知能と機械学習の違いと影響は何ですか?

医療機器製造における3つの大きなトレンド

業界関係者が語るウルトラマン解雇：業界にとっては大激震だが、AI開発の全体的な動向には影響しない

大学入試特集：AI出願ガイド

AIが人事と採用を変える3つの方法