現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが、この進歩に伴い、計算能力の大幅な増強が必要になりました。既存のトランジスタベースのコンピューティングは物理的な限界に近づいており、増大するコンピューティング需要に対応するのにすでに苦労しています。 大企業は、独自のカスタム チップ ソリューションを開発することでこの問題に対処しようとしてきました。ただし、ハードウェアのボトルネックは、従来の電子プロセッサでは克服できないほど深刻になる可能性があります。では、テクノロジーはどのようにして、急増するコンピューティング能力の需要に十分対応できるのでしょうか? 行列の乗算大規模言語モデルでは、計算タスクの 90% 以上で行列乗算が使用されます。行列乗算は、乗算と加算の基本演算を構造化された方法で実行することにより、人工知能のさまざまな機能ブロックをサポートします。言語モデルだけではありません。この基本的な線形代数演算は、ほぼすべての種類のニューラル ネットワークの基礎であり、ニューロンの大規模な相互接続を可能にし、画像分類やオブジェクト検出のための畳み込みを実行し、順次データを処理します。これは単純な概念ですが、人工知能やその他無数のアプリケーションを動かすデータを効果的に操作および変換するために不可欠なものであり、行列乗算の重要性を過大評価することはできません。 AI モデルが大きくなるにつれて、より多くの行列演算を実行する必要があり、より多くの計算能力が必要になります。要求される性能を達成するために、電子機器は現在でも限界まで追い込まれています。他に選択肢はありますか? 光学行列乗算光学は、光ファイバーネットワークにおける光通信に代表されるように、さまざまな方法で私たちの生活を変えるために使用されてきました。光コンピューティングは当然の次のステップです。デジタル エレクトロニクスでは、最も単純な算術演算を実行するために多数のトランジスタが必要ですが、光コンピューティングでは物理法則を利用して計算を実行します。入力情報は光線としてエンコードされ、干渉や回折などの光学の自然特性を使用して行列乗算が実行されます。情報は複数の波長、偏光、空間パターンでエンコードできるため、無制限の並列処理が可能になり、計算は事実上光速で実行されます。 3D光学で新たな次元を追加デナードスケーリングとムーアの法則の終焉に伴い、コンピューティングの基礎を再検討する時期が来ています。デジタル エレクトロニクスは本質的に「2D」レイアウトに制限されます。トランジスタ ゲートと回路はウェーハ上で製造され、計算は 2D 平面上の異なるユニット間の情報の流れによって実行されます。この 2D コンピューティング アーキテクチャでは、トランジスタ密度がますます高くなる必要があり、深刻な相互接続問題が発生し、悪名高いメモリ ボトルネックが発生します。 3D スタック メモリの開発により、2D 設計の変革が始まりました。しかし、業界全体が適応するにはまだ長い道のりが残っています。 現在、光学は 3D 空間で自然に計算を実行することでゲームを完全に変えることができます。新しい次元を追加することで、従来のコンピューティングにおける多くの制限を緩和できます。コンポーネントの相互接続はより簡単かつエネルギー効率が高く、レイテンシ (各計算の実行速度) を損なうことなく、スループット (一定時間内に実行できる計算数) を継続的に向上させることができます。これは 3D 光学に特有のもので、10 個の数を掛け算する場合でも 10,000 個の数を掛け算する場合でも、すべて光の速度で同時に行われます。これは光プロセッサのスケーラビリティに大きな影響を与え、現在のデジタルプロセッサの最大 1,000 倍の速度を実現できるようになります。 3D 光学の本来のスケーラビリティに加えて、光学のクロック速度は従来の電子機器よりも 100 倍高速であり、波長多重化 (複数の光波長を使用して情報を並行して処理する) 機能により、さらに 100 倍の速度向上が可能になります。これらすべてを組み合わせることで、3D 光学マトリックス乗算のみが提供できる、より高いスループット、より低いレイテンシ、およびより高い信頼性により、計算速度を飛躍的に向上させることができます。 これは AI にとって何を意味するのでしょうか?アプリケーションに関係なく、行列乗算はすべての AI 計算のバックボーンを形成します。特に、3D 光学によって実現される高スループットと低レイテンシは、リアルタイムの応答性と効率性が重視されるアプリケーションであるデータセンターの AI 推論タスクにとって特に価値があります。 3D 光コンピューティングは、従来のエレクトロニクスや統合フォトニクスと比較して、帯域幅、レイテンシ、速度、スケーラビリティが大幅に向上します。既存の機械学習アルゴリズムとの互換性と組み合わせることで、すべての AI アプリケーションに革命を起こす可能性があります。 |
<<: ワークステーションはクライアント側の大規模モデルの「幸せな家」です
>>: Panda-Gym のロボットアームシミュレーションを使用したディープ Q 学習強化学習
電子技術の発達により、私たちはいつでもどこでも「視聴覚の饗宴」を楽しめるようになり、人間の聴覚と視覚...
教師あり学習とは何ですか?教師あり学習は機械学習のサブセットであり、機械学習モデルの入力データにラベ...
[PConline News] ジャカルタアジア競技大会が閉幕し、アジア競技大会は正式に杭州タイムに...
過去 6 か月間にわたり、Meta のオープン ソース LLaMA アーキテクチャはテストされ、LL...
OpenAIは2022年11月に会話型大規模言語モデルChatGPTをリリースしました。これは、非常...
量子コンピューティングは、学術誌だけでなく、一般の新聞や雑誌でも頻繁に議論される、非常に人気の高いト...
Xi Xiaoyao Technologyはオリジナル著者 | 王二狗 みなさんこんにちは、私は二...
深層強化学習は最近大きな成功を収めていますが、安定性の欠如や再現性の低さといった限界もあります。 M...
2017年6月30日、第一回世界知能大会で上汽大通の「RVスマートモビリティビジョン」が盛大に発表さ...
[[205998]]皆さんのお役に立てれば幸いですので、この投稿を書くのは大変でした。機械学習とデ...
[[430918]]今日、機械学習 (ML) モデルは大規模に使用され、影響力がますます高まっていま...
テクノロジー企業が「個人のプライバシーを侵害する」顔認識システムを開発する際、彼らはあなたが予想して...
ビッグモデルが退化する中、トランスフォーマーの地位も次々と脅かされてきました。最近、RWKV は最新...