なぜ人工知能には膨大な電力需要があるのでしょうか?

なぜ人工知能には膨大な電力需要があるのでしょうか?

今日の人工知能 (AI) システムは、真の人間の知能を再現するにはまだ程遠い状態です。しかし、彼らは確かに、データ内のパターンを識別し、洞察を掘り出す能力が、ある意味では私たちよりも優れています。現在、AI モデルは画像を認識し、チャットボットを介して人々と会話し、自動運転車を運転し、さらにはチェスで人間に勝つことさえできます。しかし、これらのモデルのトレーニングと構築にかかるエネルギーと電力の消費量が膨大であることをご存知でしたか? 言い換えれば、AI のトレーニングは、大量のエネルギーを消費し、二酸化炭素排出量も大きいプロセスです。

[[379937]]

したがって、このエネルギー消費を削減することは、環境に良い影響を与えることになります。さらに、二酸化炭素排出量の削減や炭素関連の目標達成への近づきなど、企業にとって他のメリットももたらされます。エネルギー効率の高い AI やグリーン AI の構築を進める前に、AI がなぜこれほど多くの電力を消費するのかを理解する必要があります。

ニューラルネットワークのトレーニング

ニューラル ネットワーク モデルを例に挙げます。ニューラル ネットワークは、人間の脳を模倣して自らをモデル化する強力なタイプの機械学習です。ニューラル ネットワークは、ノードの層で構成され、人間の脳の機能を模倣してデータ セット内の基本的な関係を識別しようとします。各ノードは相互に接続されており、関連付けられた重みとしきい値を持ちます。ノードの出力値が指定されたしきい値を超えていると仮定すると、ノードがアクティブ化され、ニューラル ネットワークの次のレイヤーにデータを中継する準備ができていることを示します。

ニューラル ネットワークのトレーニングは、入力がニューラル ネットワークを通過し、入力を処理した後に出力が生成される順方向パスの実行で構成されます。次に、後方パスでは、前方パスで受信したエラーを使用して、多くの行列操作を必要とする勾配降下アルゴリズムによってニューラル ネットワークの重みを更新します。

2019年6月、マサチューセッツ大学アマースト校の研究チームが、4つの大規模なニューラルネットワークをトレーニングするために必要なエネルギー消費量を評価した研究論文を発表しました。これらのニューラル ネットワークには、Transformer、ELMo、BERT、GPT-2 が含まれ、それぞれ単一の GPU で 1 日間トレーニングされ、プロセス全体のエネルギー消費が測定されました。

これらのニューラル ネットワークの 1 つである BERT は、英語の書籍と Wikipedia の記事から 33 億語を使用します。 Kate Saenko 氏の The Conversation によると、BERT はトレーニング フェーズ中にこの膨大なデータセットを約 40 回読み取る必要がありました。比較分析として、彼女は、話し方を学んでいる平均的な5歳児は、その年齢までに4,500万語を聞いている可能性があると述べ、これはBERTの3,000分の1に相当します。

マサチューセッツ大学アマースト校の研究では、BERT のトレーニングにより、ニューヨークとサンフランシスコ間を往復する乗客の二酸化炭素排出量が削減されたことが研究者によって発見されました。チームは、各モデルの元の開発者が報告した合計トレーニング時間をその数値に掛けて、各モデルのトレーニングにかかる​​総電力消費量を計算しました。カーボンフットプリントは、米国の電力生産に使用される平均炭素排出量に基づいて計算されます。

実験的研究には、Neural Architectural Search と呼ばれる調整プロセスのトレーニングと開発も含まれていました。この技術では、試行錯誤という面倒なプロセスを通じてニューラル ネットワークの設計を自動化します。 BERT の最終的な精度を向上させるために使用されたこの追加の調整手順により、推定 626,155 トンの CO2 が発生しました。これは、自動車 5 台が生涯にわたって排出する総炭素排出量とほぼ同等です。比較すると、平均的なアメリカ人は年間18,078トンの二酸化炭素を排出します。

GPU の枯渇

今日の強力な GPU (グラフィックス プロセッシング ユニット) の助けにより、人工知能の開発が可能になりました。これらの GPU は通常、大量の電力を消費します。 NVIDIA によれば、GPU の最大消費電力は 250W で、これは Intel CPU の 2.5 倍に相当します。同時に、研究者たちは、AI モデルが大規模になれば精度とパフォーマンスが向上する可能性があると考えています。これはゲーミング ノート PC のパフォーマンスに似ていますが、ゲーミング ノート PC は通常のノート PC よりも強力で、パフォーマンスが高いため高速です。今日では、数十個の CPU と強力な GPU を備えたオンライン サーバーを数分でレンタルし、強力な AI モデルを迅速に開発できます。

サンフランシスコの AI 研究機関 OpenAI によると、機械学習の黎明期から 2012 年まで、この技術に必要なコンピューティング リソースの数は 2 年ごとに倍増しました (これは、プロセッサの能力が増加するムーアの法則と一致しています)。しかし、2012 年以降、最先端のモデルを構築するために必要な計算能力の軌道は、平均して 3.4 か月ごとに 2 倍になっています。これは、新たなコンピューティング要件が AI によってもたらされる環境への悪影響につながることを意味します。

現在、専門家は、大規模な AI モデルを構築しても、必ずしもパフォーマンスと精度の点で ROI が向上するわけではないと考えています。したがって、企業は精度と計算効率の間でトレードオフを行わなければならない可能性があります。

スパイキングニューラルネットワーク

米国のオークリッジ国立研究所の研究チームは以前、ディープラーニングニューラルネットワークをスパイキングニューラルネットワーク(SNN)に変換することでAIのエネルギー効率を向上させる有望なアプローチを実証した。 SNN は脳の神経発火メカニズムを再現するため、エネルギー効率や時空間データ処理など、脳の多くの機能を共有します。オークリッジ国立研究所のチームは、ベイジアンディープラーニングのようなランダムな値を追加する確率過程を導入することで、ディープスパイクニューラルネットワーク(DSNN)を深化させました。ベイジアンディープラーニングは、ニューラルネットワークにランダムな値を導入することで、脳が情報を処理する方法を模倣する試みです。これにより、研究者は必要な計算をどこで実行すればよいかを把握でき、エネルギー消費を削減できます。

現在、SNN はニューラル ネットワークの次世代であり、ニューロモルフィック コンピューティングの基盤として注目されています。昨年、オランダ国立数学・コンピュータサイエンス研究センター(CWI)とオランダのアイントホーフェンにあるIMEC/ホルスト研究センターの研究者らは、スパイキングニューラルネットワークの学習アルゴリズムの開発にすでに成功していた。

<<:  トップカンファレンスで新たな AI 技術が登場: リアルな 3D 顔を生成できるのは顔写真だけ

>>:  2020年顔認識レポート:数万社が市場に参入し、8つの主要技術と6つのトレンドがすべて1つの記事でカバーされています

ブログ    
ブログ    

推薦する

2021年1月から2月までの中国人工知能の月次情報まとめ

[[389793]]国内人工知能産業への投資と資金調達の調査不完全な統計によると、過去2か月間に66...

...

ドローンは「緊急産業」がインテリジェンスの時代に移行するのに大いに役立つ

私の国は、世界で最も深刻な災害に見舞われる国の一つです。自然災害は一般的に、種類が多く、被害地域が広...

人工知能はディープラーニングへと移行しており、強力なコンピューティングパワーの構築は重要な指標となっている

報告によると、人工知能の最大の課題の 1 つは、認識率と精度が低いことです。精度を向上させるには、モ...

スマート健康システムがコロナウイルス隔離中の人々を監視

新型コロナウイルスの世界的な感染拡大は187の国と地域に広がり、417万人が感染している。ほとんどの...

調査:消費者の68%がスマート家電がプライベートな会話を盗聴できると考えている

PCMag が調査を実施したところ、ユーザーの 68% が、さまざまなスマートホーム製品が知らないう...

マスク氏も騙された。AIの虚偽の内容が「リアル」すぎる

イスラエルとパレスチナの紛争が深刻化するにつれ、ソーシャルメディアのプラットフォーム上には現地の情景...

機械学習におけるクラス不均衡に対処するための 10 のヒント

導入あるクラスの観測値が他のクラスの観測値よりも高い場合、クラスの不均衡が生じます。例: 不正なクレ...

大規模言語モデルと知識グラフに関する共同研究のレビュー:2つの相補的な技術的利点

大規模言語モデル (LLM) はすでに強力ですが、さらに強力になる可能性があります。 LLM は、ナ...

Google は患者の質問に答える医療 AI チャットボット Med-PaLM 2 を病院でテスト中

ウォール・ストリート・ジャーナルによると、グーグルのMed-PaLM 2は今年4月からメイヨー・クリ...

1時間から3.5分まで、Metaの新しいアルゴリズムは携帯電話で3D顔データを収集できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

大規模な商用利用が間近に迫り、自動運転には明るい未来がある

自動運転は現在、自動車産業の主要な発展方向の一つとなり、社会全体が注目する技術テーマとなっています。...

...

COVID-19パンデミックの中、米国の産業界ではロボットがアメリカ人の雇用を急速に置き換えている

海外メディアの報道によると、アマゾンはこのほど、米カリフォルニア州の倉庫の管理者が新型コロナウイルス...