GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半年も経っていない。しかし、中国はすでに「100機種の戦い」へと突入している。参加者には大企業と多数のスタートアップ企業が含まれます。しかし、大型モデル市場での競争は熾烈であり、企業ユーザーが「鋭い目」を養わなければ、罠に陥り、プロジェクトが失敗する可能性が高くなります。 文鑫大型モデル、同益千文、盤古大型モデルなど、一部の大手メーカーの大型モデルは、徐々にその差を広げています。 SuperCLUEの最新評価リストによると、Wenxin YiyanはGPT-3.5turboを上回り、GLM-130Bなどの国産大型モデルもリストの上位にランクされています。量的には国産大型モデルが世界で大きな勢力となり、品質面でも最先端のGPT-4に急速に追いついています。 「百式戦争」の背後には、大規模なモデル技術革新が産業のデジタル化を促進し、数兆ドルの市場価値を生み出すという業界の楽観的な見通しがある。現在の視点から見ると、文鑫易言や同益千文に代表される「大手メーカーが生産する」大型モデルは、技術面で優位な立場を占めており、産業エコシステムを構築することで、市場レベルでより多くのプロジェクト協力も獲得している。 なぜ大企業が製造する大型モデルは、スタートアップ企業が製造するモデルよりも高性能で、顧客に人気があるのでしょうか?私の意見では、主な理由は 3 つあります。 まず第一に、大規模モデルは、単なる 1 回限りの取引ではなく、最終的には業界のシナリオに適用されなければなりません。より高い安定性、セキュリティ、信頼性の象徴として、大企業は一般的に AI 技術基盤が十分に蓄積されています。企業顧客はアプリケーションレベルに重点を置く傾向があり、必ずしも基盤となる AI 技術が十分に蓄積されているわけではありません。百度、アリババ、ファーウェイなどの大手企業はすでに実戦でテストされたAI基盤を構築している。一方、スタートアップ企業は技術革新において多くのハイライトと突破口を持っているが、フルスタックAI技術基盤の蓄積と顧客への長期的かつ安定したサービスの観点から、その総合的な能力と耐久性には依然として疑問が残る。 第二に、大企業は大規模モデル技術の反復的な開発に投資する総合的な能力がより強力です。例えば、百度はグループ全体を動員して Wenxin Yiyan を開発しました。最新バージョンの Wenxin Big Model 3.5 では、バージョン 3.0 と比較して推論速度が 17 倍向上し、モデルの有効性が 50% 以上向上しています。対照的に、最も人気のあるスタートアップ企業であるLightyear Awayは、半年も経たないうちにMeituanに「売却」することを選択した。オープンソース技術に基づいて開発された一部の大規模モデルには、基盤となる技術の蓄積と自律的な進化能力が十分に欠けています。 市場調査会社IDCが発表した最新の「2023年AIビッグモデル技術能力評価レポート」によると、百度文心ビッグモデル3.5は「アルゴリズムモデル」と「業界カバレッジ」という2つの主要指標を含む12の指標のうち7つで満点を獲得し、総合スコアで1位となった。2位のアリババ同義ビッグモデルは11の指標のうち6つで満点を獲得し、「サービス能力」で満点を獲得した唯一のメーカーである。 第三に、業界シナリオにおける大規模モデルの実装、それに続くサービスの提供、運用と保守などは、大企業にとっては「簡単」ですが、新興企業にとっては難しい課題です。大企業は、垂直産業や主要顧客向けに専用のサービスチームを提供することができ、顧客が新しいテクノロジーを導入する際の不安を解消することができます。しかし、スタートアップ企業には、政府機関や企業顧客へのサービス提供で蓄積された経験が不足していることが多く、オープンソーステクノロジーに基づいて開発された大規模モデルの製品アプリケーションに対してフルプロセスのサービスを提供することは困難です。 要約すると、ビッグモデルはさまざまな技術的パラメータだけでなく、業界のアプリケーション、業界の「ノウハウ」、および成功した経験にも依存します。技術開発、産業応用、サービスなど、現在、大手メーカーの製品が有利な立場を占めています。もちろん、「百式戦争」は、最終的に勝者が2人しかいなかった10年以上前の「百連隊戦争」とは異なるかもしれない。このビッグモデルはまだ開発の初期段階にあり、GPT-4や欧米の競合製品を上回る可能性など、今後さらなる可能性が開けるだろう。 |
<<: Baiduのビジネスマルチモーダル理解とAIGCの革新的な実践
>>: AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか
数日後には、2019 年の新しい iPhone シリーズが登場します。iPhone が Face I...
質問に答えたり、翻訳したり、記事を書いたり、コードを書いたり、数式を計算したり、アイコンを描いたりす...
序文と個人的な理解とても良い作品を見つけたので、皆さんと共有したいと思います!占有+世界モデルに関し...
これは非公式の PyTorch ガイドですが、この記事では PyTorch フレームワークを使用した...
[[247168]]最近、IBM は、AI アプリケーションがどのように意思決定を行うかを説明する際...
先週、私たちは PaddlePaddle と Tensorflow を使用して画像分類を実装し、自分...
「新インフラ」は中国の「産業インテリジェンス」に強力な新たな原動力をもたらした。インテリジェント時...
[[415316]]海外メディアの報道によると、オーストラリアの裁判所は、特許出願において人工知能...
20 世紀初頭から、ロボットが人間のように考え始めることができるかどうかについて、人々は疑問を持ち...
中国の研究チームは、女性の外見だけに基づいてその性格特性を予測できる人工知能プログラムを立ち上げたと...
編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...
[[334883]]最近、ノートルダム大学のポストドクター研究員 Weiwen Jiang、Yiy...
マドゥ・ネール博士とアシャ・ダス博士は、人工知能 (AI) モデルを使用して患者の組織サンプルのスキ...
マイクロソフトとグーグルが財務報告を発表したが、一方は喜び、他方は悲しんだ。 AIへの大胆な賭けのお...