機械学習の 3 つの時代の計算パワーの法則をまとめる: 大規模モデルの出現によって何が変わったのでしょうか?

機械学習の 3 つの時代の計算パワーの法則をまとめる: 大規模モデルの出現によって何が変わったのでしょうか?

図 1: 1950 年から 2022 年までの 118 の重要な機械学習システムの傾向。私たちは3つの時代を区別しています。ディープラーニングの出現と一致する 2010 年頃の傾きの変化と、2015 年末の新しい大規模なトレンドに注目してください。

機械学習の分野における進歩を予測することは困難であり、業界、政策、社会の関係者にとって重要な意味を持ちます。

10年後にはコンピュータービジョンはどれほど進歩するでしょうか? 機械は人間よりも優れた小説を書けるようになるでしょうか? どんな仕事が自動化できるようになるでしょうか?

これらの質問は多くの要因に依存するため、答えるのが困難です。しかし、時間の経過とともに、これらすべての要素のうち 1 つの要素がその影響において驚くほど規則的になります。それは、コンピューティング能力です。

既存のデータによると、2010 年以前は、トレーニング コンピューティング能力の成長率はムーアの法則に沿っており、約 20 か月ごとに 2 倍になっていました。

2010 年にディープラーニングが登場して以来、トレーニング コンピューティング能力の成長率は大幅に増加し、約 6 か月ごとに 2 倍になっています。 2015年後半、多くの企業が大規模な機械学習モデルの開発を開始したため、トレーニングの計算能力に対する要件が10~100倍に増加し、新たなトレンドが生まれました。

上記の調査結果に基づき、共同チームは研究論文「機械学習の3つの時代におけるコンピューティング トレンド: プレディープラーニング時代、ディープラーニング時代、大規模時代」の中で、機械学習のコンピューティング パワーのトレンドを3つの時代、つまりディープラーニング以前の時代、ディープラーニング時代、大規模時代に分類し、現在のコンピューティング パワーの進化をわかりやすく整理しました。

図丨マイルストーンモデル情報を一目で確認

具体的には、この研究には次の 3 つの貢献があります。

1) 100 を超える画期的な機械学習システムのデータセットをキュレートし、それらをトレーニングするために必要な計算能力を注釈付けします。

2) コンピューティングパワーのトレンドは、プレディープラーニング時代、ディープラーニング時代、大規模時代の 3 つの時代に分けられます。この研究では、各時代の倍増時間の推定値を示します。

3) 一連の付録では、本研究の結論を検証するために行われたいくつかの代替実験を紹介し、データの代替解釈と以前の研究との相違点について説明します。

さらに、この研究で使用されたデータセット、データ、インタラクティブな視覚化は公開されています。

1. ディープラーニングの登場

この研究では、この研究で収集されたデータを 3 つの異なる時代と 3 つの異なる傾向に従って解釈します。

つまり、ディープラーニングが普及する前は、成長が緩やかな時代でした。この傾向は 2010 年頃に加速し、それ以降も減速していません。さらに、2015 年から 2016 年にかけて、大規模モデルという新たなトレンドが出現し、同様の成長率で、以前のものより 1 桁から 2 桁上回る規模 (OOM) で成長しました。

表1 主な結果の要約。この傾向は 2010 年にディープラーニングの人気とともに加速し、2015 年後半には大規模モデルへの新たな傾向が現れました。

以下では、まず2010年から2012年頃のディープラーニングへの移行期について考察する。次に、2015年から2016年頃に登場した大規模モデルの時代について説明します。

ディープラーニングの登場前と登場後には、まったく異なる2つのトレンドメカニズムが存在します。これまで、機械学習システムのトレーニングに必要なコンピューティング量は、17 ~ 29 か月ごとに倍増していました。その後、全体的な傾向は加速し、4~9 か月ごとに 2 倍になりました。

ディープラーニング以前のトレンドは、トランジスタ密度が約 2 年ごとに 2 倍になるというムーアの法則とほぼ一致しており、これは多くの場合、コンピューティング パフォーマンスが 2 年ごとに 2 倍になると簡略化されています。

ディープラーニングの時代がいつ始まったのかは明らかではありません。ディープラーニング以前の時代からディープラーニングの時代への移行には明確な断絶はありません。さらに、この研究では、ディープラーニング時代の始まりをそれぞれ 2010 年と 2012 年としていますが、表 2 に示すように、結果にほとんど変化はありません。

図 2. 1952 年から 2022 年までの 100 を超えるマイルストーン機械学習システムのトレーニング計算能力の傾向。 2010 年頃の傾向の傾きの変化に注目してください。

表2 1952年から2022年までのMLモデルの対数線形回帰結果

2. 大型モデルの出現

2015年から2016年頃に、大規模モデルへの新たなトレンドが生まれました。

この新しいトレンドは、2015 年後半に AlphaGo から始まり、今日まで続いています。これらの大規模モデルは大企業によってトレーニングされており、そのトレーニング予算が拡大すれば、これまでの傾向は打破されると思われます。

それ以外では、従来のスケールモデルへの傾向はそのまま残っています。この傾向は 2016 年頃まで継続しており、同じ傾きで 5 ~ 6 か月ごとに倍増しています (表 3 を参照)。大規模モデルにおける計算負荷の増加傾向は大幅に鈍化し、9 ~ 10 か月ごとに倍増しています。この研究ではこれらのモデルに利用できるデータが限られていたため、見かけ上の減速はノイズの結果である可能性もあります。この研究で発見された結果は、2012年から2018年の間に3.4か月というより速い倍増期間を発見したAmodei&Hernandezら(2018)の研究結果とはまったく対照的である。一方、Lyzhov(2021)は、2018年から2020年の間に2年以上というより長い倍増期間を発見した。

彼らの分析ではデータサンプルが限られており、単一の傾向が想定されていたため、結果はこの研究で見つかったものとは大きく異なっていました。この研究では大規模モデルと従来規模モデルを別々に検討しましたが、大規模モデルの傾向は近年になって現れたばかりであるため、これまでの分析では2つの異なる傾向を区別できませんでした。

図 2. 2010 年から 2022 年までの 100 を超えるマイルストーン機械学習システムのトレーニング コンピューティングの傾向。 2016年頃に出現する可能性のある、大規模モデルへの新たなトレンドに注目してください。残りのモデルの傾向は2016年頃と変わりません。

表3. 2010年から2022年までのデータの対数線形回帰結果。 2015年以前の従来型スケールモデルのトレンドは、その後も途切れることなく続いています。

3. 結論と方向性

この調査では、100 を超える画期的な機械学習システムのトレーニング計算のデータセットを管理することでコンピューティング能力の傾向を調査し、そのデータを使用して時間の経過とともに傾向がどのように成長したかを分析しました。

研究チームは、この研究によって、機械学習システムの最近の進歩は規模の拡大によって推進されていることを他の人々がよりよく理解し、高度な機械学習システムの開発に関する予測をさらに改善できるようになることを期待していると述べた。

さらに、コンピューティング能力のトレーニングの増加傾向により、ハードウェア インフラストラクチャとエンジニアの戦略的重要性が強調されています。

機械学習における最先端の研究は、大規模なコンピューティング予算やクラスターへのアクセスと、それらを活用するための専門知識と同義になっています。

この調査で取り上げられていない側面の 1 つは、機械学習モデルのトレーニングに使用されるもう 1 つの重要な定量化可能な要素、つまりデータです。今後の研究では、データセットのサイズとコンピューティング能力の傾向との関係を調査することが考えられます。


<<:  Python 用 OpenCV について Dlib を使って顔検出を実装する

>>:  ヘルスケアにおける人工知能:現在と未来

ブログ    
ブログ    

推薦する

Heroku クラウドにディープラーニング Web アプリケーションをデプロイするためのヒントとコツ

[51CTO.com クイック翻訳] Heroku Cloud は、Web 開発者や機械学習愛好家の...

...

スマート水利建設を加速する必要があり、ドローンが大きな推進力となる

夏の気温が上昇し続け、雨季が近づいているため、我が国の水利インフラは再び大きな試練に直面することにな...

人工知能技術は交通にどのように応用できるのでしょうか?

都市交通の分野では、AI信号制御、インテリジェントな街路交通監視、スマートバス停、スマート高速道路な...

AI 駆動型スマートビルは将来のトレンドになるでしょうか?

人工知能 (AI) は、建物の管理と制御の方法に革命をもたらし、これまで以上に効率的でコスト効率の高...

ドローン配送がレイアウトブームを巻き起こす、普及するには2つのポイントに注意が必要

滴滴出行が昨年11月にドローンによる食品配達サービスを検討すると発表し、美団も最近ドローン配達隊に加...

マイクロソフトはWindows 11の組み込みアプリにAI機能を導入すると報じられている。写真、スクリーンショット、描画などに新しい機能が追加される。

8月23日、マイクロソフトは過去1年間で人工知能の分野で大きな進歩を遂げており、同社の新製品のほぼ...

...

GPT-4V は惨めに失敗しました! CVマスター謝彩寧氏の新作:V*の重量級「視覚検索」アルゴリズムにより、LLMの理解力が人間に近づく

サム・アルトマン氏は最近、世界経済フォーラムで講演し、人間レベルの AI が間もなく登場すると述べま...

「柯潔は2つの石を与えられた」が、それでもAIに負けた。プログラマーが知っておくべきトップ10のAIライブラリとフレームワークはこちら

[51CTO.comより引用] 遅かれ早かれ、この日はやって来る。イ・セドルがアルファ碁に1対4で負...

Google、医療従事者が情報を素早く見つけられるようにAI検索機能を開始

10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...

AIプロジェクト開発における10の最も一般的な間違い

人工知能 (AI) モデルのトレーニングは単純に思えるかもしれませんが、そうではありません。 AI ...

2021年にAIスマートカメラがもたらす新たな市場

[[393303]] 2020年から2021年にかけて、ほぼすべてのビジネス分野の組織が多くの予期せ...

人工知能が中国の医療サービスに力を与える

「医者にかかりにくい」「入院しにくい」など、人々の生活における医療上の困難な問題が相次ぐ中、「インタ...