強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのCEOサム・アルトマン氏は「 AIは止めることのできない竜巻のように、驚くべきスピードで発展している」と述べた。人工知能がその高度なスピードで世界を変えつつあることが分かる。

年初に人工知能における大規模モデルの流行を経験した後、 2023年10月現在、中国には汎用型大規模モデル(AGI)と垂直型大規模モデルの両方を含む、10億以上のパラメータを持つ大規模モデルを保有するメーカーと大学・研究機関が254社ありました。つまり、数日ごとに中国で新し​​い大型モデルが正式に発表されることになります。

しかし、大規模モデルのインテリジェント化と商業化はそれほど速くないことに気づく実務家が増えています。

ビッグモデル技術の進化とビジネスの実施により、一部の参加者は砂の中の砂のように淘汰され、最終的にはハードコアな技術力とリソースを備えた企業だけが生き残ることができます。

では、現時点で国内にこれほど多くの大型モデルが存在するのは、どのような種類のモデルなのでしょうか?どれが一番強いでしょうか?

ユニバーサル大型モデルと垂直大型モデル、どちらが将来性があるか

中国には一般大型機種や縦型大型機種(特大機種とも呼ばれる)など、80種類近くの大型機種があると言われています。 2つを比較すると、どちらが良いでしょうか?実際、アプリケーションの観点から両方を考慮すると、どちらも独自の特徴を持っています。

汎用大規模モデル(AGI)とは、自然言語処理分野の事前学習済みモデル、画像認識分野の事前学習済みモデルなど、複数の分野や業界に適用可能な大規模モデルを指します。

この大型モデルは、用途が広く、複数の分野で使用できます。よく耳にする人工知能企業OpenAIが開発したChatGPT、アリババのTongyi Qianwen、百度のWenxin Yiyanなどは、いずれも一般的な大規模モデルの代表例です。

垂直型ビッグモデルとは、医療分野のビッグモデル、金融分野のビッグモデル、物流分野のビッグモデルなど、特定の分野や業界向けに開発されたビッグモデルのことです。

たとえば、物流シナリオには多くの文書(物流活動において物流輸送のために発行される法的かつ有効な文書、例えば物流輸送契約文書など)と一貫性のない形式が関係しています。物流ビッグモデルは、標準化された方法でそれらを迅速かつ正確に識別し、構造化されたデータを提供して、エラー修正と完了操作を実行し、その後の運送状の分割、契約の履行と配布、およびその他のリンクの品質と効率を確保できます

このタイプの大型モデルは、より専門的で、特定の分野を対象としており、その分野の特定の問題をよりよく解決できます。そのため、垂直大型モデルは特殊大型モデルとも呼ばれます

それぞれを比較するのは非常に難しいと言えますので、どれが最も将来性が有望であるかを言うことも困難です。

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

一般的な大型モデルと垂直型大型モデルの長所と短所を単一の法則で比較することは不可能ですが、強力な大型モデルが持つ「超能力」は常に共通しており、より広い発展の可能性を秘めています。

1. 超大規模な計算能力

一般的な AI アプリケーションと比較して、大規模モデル アプリケーションのトレーニングと推論には、より強力なコンピューティング パワーのサポートが必要です。コンピューティング パワーが一般的な大規模モデルの収益を決定すると言えます。

中国でクラウドサービスを提供するアリババクラウドやテンセントクラウドは、それ自体が巨大なコンピューティングパワーを持っており、それが彼らが開発する大規模モデルの最大の競争力となっている。

2. 大量のデータ

大規模モデルをトレーニングするには、より大量のデータ、より優れたデータ品質、より多様なデータ ソースが必要です。したがって、誰もが十分な計算能力を持ち、ビッグモデルのアーキテクチャが類似している場合、データ量が多く、データ品質が高いという利点を持つ人は、それに応じてビッグモデルの品質を向上させ、ビッグモデルの適用効果も向上します。

3. オープンソースの大規模モデルである

もう 1 つの考慮事項は、それがオープン ソースの大規模モデルであるかどうかです。ソースコードはオープンなので、ユーザーのニーズに合わせていつでも変更やカスタマイズが可能で、基本的に無料です(無料使用は大規模モデルの利用の敷居を下げます。例えば、海外でのChatGPTや中国のWenxin Yiyanの人気は、まさに使いやすさにあります。誰でも登録するだけで体験できます)。これにより、より多くの開発者やユーザーが参加でき、大規模モデルの品質と安定性を向上させることができます。代表的なオープンソースの大規模モデルとしては、Alibaba の Tongyi Qianwen が挙げられます。

クローズドソースの大規模モデルは開発会社によって保守されています。開発会社は大規模モデルの品質と安定性をコントロールできますが、モデルの機能を継続的に向上させ、長期にわたって揺るぎない優位性を維持できない場合は、オープンソースに置き換えられる可能性があります。したがって、ChatGPT や Wenxin Yiyan などの大規模なクローズドソース モデルでは、強力なパフォーマンスを維持する必要があります。

4. APIインターフェースがあるかどうか

オープン サービス機能は、大規模モデルの機能を評価する上で重要な要素の 1 つです。大規模モデルの API インターフェイスを公開すると、そのオープン性と外部サービス機能が向上します。

オープン API インターフェースは専門家にとって不可欠です。研究者はこれを使ってさまざまなテストを行うことができます。個人の起業家もこのインターフェースを利用して実際のビジネスに応用することができます。

近い将来、大規模モデルが直面している技術的およびコスト的な問題が解決されるにつれて、関連するエンタープライズレベルのアプリケーションやコンシューマーアプリケーションの実装のペースが加速すると考えています。これにより、強力な大規模モデルメーカーとアプリケーションベースの製品のグループも強調され、これらのメーカーと製品は、今日台頭している大規模モデル製品から生まれる可能性が高くなります。

<<:  データセンター: クラウドと AI 導入の鍵となる要素

>>:  シリコンバレーのAI界で注目の記事:ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

ブログ    
ブログ    
ブログ    

推薦する

...

Google が新しい AI ゲームをリリース: 落書きしてワンクリックでモンスターに変身

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

マイクロソフトCEOナデラ氏:AIはルールを変えるインターネットの波のようなもの

8月18日、マイクロソフトが人工知能(AI)技術の研究開発に注力し、OpenAIに100億ドル以上を...

Go データ構造とアルゴリズムの基本クイックソート

[[411577]]この記事はWeChatの公開アカウント「Light City」から転載したもので...

有名な文系大学が人工知能の分野に参入すると、何をもたらすことができるのでしょうか?

[[263482]]老舗の文系大学が人工知能人材育成分野への参入を正式に発表した。 「中国人民大学...

...

5G消毒ロボットが武漢を支援し、人間の感染を効果的に防ぐことができる

中国移動の公式ニュースによると、2月3日と2月4日、武漢協和病院と同済天佑病院はそれぞれ、中国移動と...

エッジコンピューティングの価値はデータにある

企業はビジネスニーズの変化に応じてスケールアップおよびスケールダウンできるコンピューティングおよびス...

拡散モデルはオートエンコーダです。ディープマインドの研究者は新しいアイデアを提案し、

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIの発展が遺伝子工学を推進している

CRISPRは遺伝子編集技術の専門用語です。簡単に言えば、ウイルスは細菌に自身の遺伝子を組み込み、細...

...

NVIDIA、医療用 AI コンピューティング プラットフォームを発表

NVIDIA は最近、AI 駆動型イメージング、ゲノミクス、スマート センサーの開発と展開のための...

...

AI を活用した新たなフィッシング攻撃に対抗するにはどうすればよいでしょうか?

サイバーセキュリティは、攻撃と防御の継続的なゲームです。防御戦略が進化し続ける一方で、攻撃者も攻撃の...