企業がより持続可能な推論を通じてより環境に優しい AIGC を実現する方法

企業がより持続可能な推論を通じてより環境に優しい AIGC を実現する方法

モデルとは何か

一般人にとって、AIとそのプログラミングの基盤となるアルゴリズムが、これほど広範囲にわたる環境的または経済的負担を担うことができるとは想像しにくいかもしれない。この ML の簡単な概要では、このプロセスを 2 つの段階で説明します。

最初のステップは、モデルをトレーニングして知能を開発し、特定のカテゴリの情報をラベル付けすることです。たとえば、電子商取引の運営では、製品や顧客の習慣の画像をモデルに入力して、これらのデータ ポイントをさらに調査することができます。

2 番目は認識または推論であり、モデルは保存された情報を使用して新しいデータを理解します。たとえば、電子商取引企業は、製品をタイプ、サイズ、価格、色、その他さまざまなセグメントに分類し、顧客にパーソナライズされた推奨事項を提供できるようになります。

推論段階は 2 つの段階のうち計算負荷が低い段階ですが、Siri や Alexa などのプラットフォームに大規模に展開されると、蓄積された計算によって大量の電力が消費され、コストと炭素排出量が増加する可能性があります。

おそらく、推論とトレーニングの最も大きな違いは、それをサポートするために使用される資金です。推論は販売コストに関連しているため、最終利益に影響しますが、トレーニングは通常、実際の製品またはサービスの予算とは別の研究開発費に関連しています。

その結果、推論には、コストと電力効率を最適化して実行可能でスケーラブルなビジネス モデルをサポートする特殊なハードウェアが必要となり、ビジネスと環境の利益を巧みに一致させるソリューションが求められます。

隠れたコスト

第 2 世代 AI の先駆者である ChatGPT は、推論コストが 1 日あたり数百万ドルにも達する (トレーニング コストは含まれていない) という、極めて大きなコストの好例です。

OpenAI が最近リリースした GPT-4 は、以前のバージョンと比べて 3 倍の計算リソースを消費すると推定されています。噂によると、16 のエキスパート モデルで 1.8 兆個のパラメータが実行され、128 個の GPU のクラスターで実行されるため、膨大な量のエネルギーを消費することになります。

キューの長さによって高い計算負荷がさらに高まり、応答に大量のエネルギーが必要になります。 GPT-4 のコンテキスト長は 8000 から 32000 に跳ね上がり、推論コストが増加し、GPU の効率が低下します。必然的に、AI を拡張できるのは資金力のある大企業に限られ、必要なリソースを持たない企業にはアクセスできないため、このテクノロジーのメリットを活用できません。

人工知能の力

AIGC と大規模言語モデルは環境に重大な影響を及ぼす可能性があります。必要な計算能力とエネルギー消費により、大量の炭素排出が発生します。単一の AI クエリの二酸化炭素排出量に関するデータは限られていますが、一部のアナリストは、検索エンジン クエリの 4 ~ 5 倍になると示唆しています。

ある推定では、ChatGPT の電力使用量は 175,000 人の電力使用量に匹敵するとされています。 2019年にMITは、大規模なAIモデルのトレーニングによって626,000ポンドの二酸化炭素が排出されるという研究結果を発表しました。これは平均的な自動車の生涯排出量のほぼ5倍に相当します。

いくつかの説得力のある研究や主張があるにもかかわらず、AIとその炭素排出量に関する具体的なデータが不足していることは、変化を推進するためには是正する必要がある大きな問題です。次世代の AI モデルをホストする企業やデータ センターも、環境への影響に積極的に取り組む必要があります。よりエネルギー効率の高いコンピューティング アーキテクチャと持続可能なプラクティスを優先することで、ビジネス上の必須事項を気候悪化を制限する取り組みのサポートと一致させることができます。

コンピュータの限界

CPU は、命令と数学演算を実行するコンピューターの一部であり、1 秒あたり数百万の命令を処理でき、最近まで推論用のハードウェアとして選ばれてきました。

最近では、CPU ではなく、オフロード エンジンとして CPU に接続されたコンパニオン チップ (ディープラーニング アクセラレータ (DLA) とも呼ばれる) を使用して、重いディープラーニング処理を実行する傾向にあります。問題は、これらの DLA をホストする CPU が、推論サーバーとの間の高スループットのデータ移動、および DLA に入力データを提供するデータ処理タスクと DLA 出力データに対するデータ処理タスクを処理しようとしているために発生します。

ここでも、CPU はシリアル処理コンポーネントであるため、ボトルネックが発生し、これらの DLA をビジー状態に保つために必要な効率で実行できません。

企業がディープラーニング モデルの推論管理に CPU に依存している場合、DLA がいかに強力であっても、CPU は最適なしきい値に達し、その重みに耐えられなくなります。考えてみてください。車はエンジンの性能でしかスピードを出せません。小型車のエンジンをスポーツカーのエンジンに交換すると、小型車はより強力なエンジンの速度と加速能力に追いつかなくなってしまいます。

同じことが、CPU 主体の AI 推論シ​​ステム (一般的には DLA、より具体的には GPU) にも当てはまります。これらのシステムは猛スピードで動作し、1 秒あたり数万の推論タスクを完了しますが、これは限られた CPU で入出力が削減されると実現できない機能です。

システム全体にわたるソリューションの必要性

NVIDIA CEO のジェンスン・フアン氏は、「AI にはコンピューティングの根本的な変革が必要です。チップからシステムまで。」と述べています。

AI アプリケーションや GPU や TPU などの特殊なハードウェア アクセラレータが急増しているため、これらのアクセラレータ周辺のシステムに目を向け、これらの DLA を活用するために必要なデータ処理の量と速度をサポートするシステム全体のソリューションを構築する必要があります。大規模な AI アプリケーションを処理し、コストとエネルギー投資を抑えながらシームレスなモデル移行を可能にするソリューションが必要です。

AI の利用拡大による環境への波及効果に対処しながら、増大する企業の AI 需要に対応するための効率的でスケーラブル、かつ経済的に実現可能なソリューションを提供するには、CPU 中心の AI 推論サーバーに代わるソリューションが不可欠です。

AIの民主化

現在、業界のリーダーたちはコストを削減しながら多くのソリューションを提案しています。 AI を動かすためにグリーン エネルギーに注目することも 1 つの方法であり、再生可能エネルギーが利用できる特定の時間にコンピューティング プロセスをタイミング調整することも 1 つの方法です。

データセンター向けの AI 駆動型エネルギー管理システムはコストを節約し、運用の環境的信頼性を向上させるという考え方があります。これらの戦略以外に、AI への最も価値のある投資の 1 つはハードウェアにあります。これはすべての処理のバックボーンであり、エネルギーを消費する計算の重荷を担います。

より低い財務コストとエネルギーコストですべての処理をサポートできるハードウェア プラットフォームまたは AI 推論サーバー チップは、変革をもたらすでしょう。これが AI を民主化する方法です。中小企業は、大企業のリソースに依存しない AI モデルを活用できるようになります。

ChatGPT クエリ マシンの実行には 1 日あたり数百万ドルのコストがかかりますが、はるかに低い電力と GPU 数で実行される代替のサーバー オン チップ ソリューションは、リソースを節約し、世界のエネルギー システムへの負担を軽減し、コスト意識が高く環境に優しく、誰もが利用できる第 2 世代の AI につながります。

<<:  AIがサプライチェーンを変革する7つの方法

>>:  スマートネットワークとスマート製造を備えた新エネルギーインテリジェントコネクテッドビークルがデジタル変革への道を開く

ブログ    

推薦する

機械学習モデルで機密データの忘却を実現するにはどうすればよいでしょうか?

I. 概要サイバーセキュリティ分野のデータ分析では機械学習手法がますます使用されるようになっていま...

人工知能端末チップ研究レポート

1. 人工知能とディープラーニング2016年、AlphaGoとイ・セドルの囲碁対決は間違いなく、人工...

自動運転はどこまで徹底できるのか?運転席をなくすことさえできる。

Baiduの無人運転アプリケーションを見ました。私は車の所有者が自動で駐車するのを助けるアウディの...

誰かが1週間でPASCALデータセットの17,120枚の画像をクリーンアップし、mAPを13%向上させました。

ある研究では、PASCAL VOC 2012 データセット内の 17,120 枚の画像を 1 週間で...

Google は 1,000 以上の「ロングテール」言語に対応する機械翻訳システムを開発、すでにいくつかのニッチ言語をサポート

学術および商用の機械翻訳 (MT) システムの品質は、過去 10 年間で劇的に向上しました。これらの...

...

教科書では学べない機械学習に関する12の「民間伝承」

[[264978]]ビッグデータダイジェスト制作出典: towardml編纂者:劉嘉偉、王元元、ウ...

李開復:人工知能に取って代わるのが最も難しい10の仕事

[[246854]]私の意見では、警告、悲観、パニックはすべて「廬山の本当の顔を知らない」根拠のない...

MITの新世代の昆虫型ドローンは、転がったり、ジャンプしたり、群れをなして飛んだりすることができ、人間の衝撃にも耐えられる。

バイオニック鳥類や昆虫はドローン研究の分野で常に重要なテーマであり、スタンフォード大学の学者が作った...

大国同士が競争する中、なぜ彼らは人工知能で優位に立とうとするのでしょうか?

不確実性が人間関係を形作ります。感染症は、かつては直線的でスムーズで予測可能だった社会を予期せぬ形で...

Google のアルゴリズムにどんな恥ずかしいことが起こったのでしょうか?

ここには Google が意図的に行ったジョークがあると思われます。周知のとおり、Google の柱...

テスラは最初にこの問題の矢面に立たされ、自動運転の安全性の問題が再び話題となっている。

今日、自動運転は自動車産業の発展と変革の重要な方向性の一つとなっています。自動運転技術が成熟するにつ...

...

中国をターゲットに!米国はドローンや衛星画像を含むAIソフトウェアの輸出を緊急制限

アメリカは再び中国に対して行動を起こしたが、今回はAIソフトウェアに関してだ。月曜日に発効する新しい...

2018年のトップ10の技術開発トレンド:人工知能は応用の「爆発期」に入る

情報技術の調査およびコンサルティング会社であるガートナーは最近、2018 年の戦略的技術開発のトレン...