AIコンピューティング能力のボトルネックを打破するソリューションは、FPGAベースの異種コンピューティングアクセラレーションプラットフォームソリューションです。

AIコンピューティング能力のボトルネックを打破するソリューションは、FPGAベースの異種コンピューティングアクセラレーションプラットフォームソリューションです。

【51CTO.comより引用】無人スーパーマーケットが誕生し、ヒューマノイドロボットがインタビューを受け、自動運転車が量産されようとしています...現在、AIはさまざまなサブセクターに統合され、私たちの生活を静かに変えつつあります。しかし、SF映画のような人間とコンピュータの相互作用の効果を実現するには、計算能力が重要なボトルネックの1つとなります。ハードウェアの計算能力は、AI の開発に不可欠な条件の 1 つです。GPU/ASIC/FPGA はすべて、膨大な計算ワークロードを解決するための加速エンジンです。

[[228624]]

アクセラレータークラウドの創設者兼CEO、ウー・ガン氏

最近、杭州アクセラレータクラウド情報技術有限公司(以下、アクセラレータクラウド)の創設者兼CEOである呉剛氏は、新製品発表会で次のように述べました。「人工知能の今後の発展にはボトルネックがあり、ハードウェア技術とアルゴリズムのブレークスルーが必要です。ヘテロジニアスコンピューティングはコンピューティングアーキテクチャの将来のトレンドであり、FPGAはヘテロジニアスコンピューティングを実現するための最良の選択肢です。」

FPGAベースのディープラーニングソリューションは、ディープラーニングモデルの効率的な実行に役立ちます。

ビッグデータの時代において、ディープラーニングは人工知能の主な原動力です。近年のビッグデータとコンピューティング能力の急速な成長により、ディープラーニング技術の質的な飛躍が可能になり、コンピュータービジョン、音声認識、自然言語処理などの分野で大きな進歩がもたらされました。しかし、ディープラーニングには大量の並列コンピューティングが必要であり、従来のコンピュータでは満たせない非常に高いハードウェア プラットフォーム要件があります。

既存のソリューションでは、GPU を使用してディープラーニング トレーニングを完了しますが、GPU は消費電力が高く、パフォーマンスと電力の比率が低く、処理の遅延が大きいため、大規模な推論の展開や遅延に敏感なシナリオには適していません。 FPGA は性能電力比が非常に高く、ゲートレベルの回路設計により超低レイテンシかつ確定的なレイテンシのソリューションを実現しているため、FPGA のプログラマビリティと動的再構成により、ディープラーニング アルゴリズムの将来の変化に適応でき、IO プログラマビリティにより、より多くのビジネス ニーズ (ネットワーク アクセラレーション、エッジ コンピューティング) に対応できます。そのため、FPGA ベースのディープラーニング ソリューションは、今後の技術開発の方向となっています。

今回の記者会見で、アクセラレーションクラウドは、SC-OPM/SC-OPF/SC-OPSアクセラレーションカードやFDNNアクセラレーションライブラリなど、FPGAベースのディープラーニングアクセラレーションソリューションの完全なセットを発表し、市場の需要に迅速に対応しました。

SC-OPS アクセラレータ カード

SC-OPSは、最新の14nmプロセスを採用したIntelのStratix10 FPGAをベースにしています。2800K LEと9.2TFLOPSのコンピューティング性能を提供し、8つのDDR4コントローラをサポートし、最大150GB/Sのメモリ帯域幅を提供し、PCIe*16Laneインターフェースを提供し、最大128Gbpsのアクセス速度をサポートし、データセンターの高性能ディープラーニングアクセラレーション要件を満たすことを目指しています。

SC-OPM/SC-OPF アクセラレータ カード

SC-OPM/SC-OPFは、最新の20nmプロセスを採用したIntelのARRIA 10 FPGAをベースとしており、1150K~2*1150K LEおよび1.5~2TFLOPSのコンピューティング性能を提供し、データセンターやエッジコンピューティングゲートウェイのディープラーニングアクセラレーションのニーズを満たすことを目指しています。

FDNN アクセラレーション ライブラリ

FDNN アクセラレーション ライブラリは、RTL ベースのディープ ニューラル ネットワーク アクセラレーション ライブラリ FDNN のセットであり、パラメータ設定可能な CNN/DNN/LSTM を実装できるほか、高性能な共通ネットワーク モデル アクセラレーション ライブラリ (Lenet、VGG16、Darknet19、YOLOV2、RestNet、DNN、LSTM など) も提供し、高性能で柔軟なディープラーニング アクセラレーションに対する顧客の要件を満たすことに専念しています。

FPGA ベースの完全な OpenCL 異種開発環境

顧客が開発に高級言語を使用できるようにするために、Acceleration Cloud は、ユーザー定義のディープラーニング アクセラレーション ソリューションを迅速に実装するための完全な FPGA ベースの OpenCL 異種開発環境を提供します。また、高速なディープ ニューラル ネットワークのカスタマイズされたアクセラレーション サービスも提供します。

プログラムの特徴:

A. 高性能な統合IP、使いやすさ、二次開発

B. 豊富なIOインターフェース、便利で柔軟な拡張

C. さまざまなアプリケーションシナリオをサポートするモジュール設計

D. 高性能な電力消費率で運用コストを削減

E. 超低レイテンシと確定的レイテンシ、時間に敏感なアプリケーションシナリオをサポート

具体的なパフォーマンス指標:

ディープラーニング加速ソリューションの応用 - 画像OCR

電子商取引プラットフォームは、毎日大量の顧客の店舗開設や業務申請の要求に直面しており、大量の営業許可証やその他の証明書を審査する必要があります。従来は手動による審査方法が使用されていましたが、ビジネスの成長に伴い、手動による審査は完了できなくなりました。ディープラーニング画像OCRを使用することは、優れたソリューションです。

ディープラーニングに基づく画像 OCR ソリューションには、テキスト配置とテキスト認識の 2 つの部分が含まれます。テキスト配置では 4 層の CNN ネットワークを使用し、テキスト認識では 4 層の双方向 LSTM を使用します。CNN 部分は多くの計算を必要とせず、主な計算は LSTM で行われるため、LSTM 部分は高速化されます。

元のソリューションでは GPU を使用しますが、次の 2 つの問題があります。

  1. 処理遅延が非常に大きく、要件を満たすことができない
  2. 一部の画像内のテキストは非常に長いです。非常に長いテキストと通常の長さのテキストを GPU に送信して一緒に処理すると、通常の長さのテキストの処理時間は非常に長いテキストの処理時間と同じになり、ビジネスがオンライン条件を満たすことができなくなります。

具体的な LSTM 仕様は次のとおりです。

Acceleration Cloud は FPGA ソリューションを使用して双方向 LSTM の高速化を実現し、顧客の要件を満たします。具体的なソリューション機能は次のとおりです。

  • SC-OPMアクセラレータカードを採用(ハーフハイト、ハーフレングス:56×167mm)
  • 660k LEと1.5T FLOPSの単精度浮動小数点処理機能を統合したAltera Arria 10 GX660デバイス
  • 4層LSTM + 1層完全接続、各層のネットワークパラメータはソフトウェア構成を通じてダウンロード可能
  • 40000T/Sのフローレート、超低遅延、混合データ長を実現
  • シングルカードのみ 33W

上記の内容に加え、アクセラレーションクラウドは今回の記者会見で、FBLAS IPライブラリ、高性能コンピューティングおよびデジタル信号処理ソリューション、エッジコンピューティングソリューションも発表しました。

インタビューの中で、呉剛氏は次のように述べた。「アクセラレータクラウドはテクノロジーから生まれた企業です。同社のソリューションは、ディープラーニング、人工知能、金融、マシンビジョンなどの分野で幅広く活用できます。現在、同社はアリババ、テンセント、iFlytekなど多くの企業と緊密な協力関係を築いています。」

***で書かれています:

当初、FPGA はグルー ロジックにのみ使用されていました。グルー ロジックからアルゴリズム ロジック、さらにデジタル信号処理、高速シリアル トランシーバー、組み込みプロセッサへと、FPGA はサポート役から主役へと真に変化しました。高性能コンピューティングやデジタル信号処理、エッジ コンピューティング、AI などの新しいアプリケーション要求の出現により、FPGA に歴史的な開発機会がもたらされました。現在、国内メーカーの主要市場は依然としてアプリケーション端末と中低価格帯のバックエンドサーバー市場にあります。クラウドに参入し、AIコンピューティングパワーのボトルネックを打破するには、FPGAハイエンド技術者、先進プロセス技術などのボトルネックも打破し、独自のエコシステムを確立する必要があります。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  Python が Java や C/C++ に勝って機械学習に最適な言語である理由!

>>:  人工知能が爆発的に進化しています。この「鉄の飯碗」を手に入れるための新しいガイドをぜひ保存してください!

ブログ    
ブログ    
ブログ    

推薦する

IoT人工知能の将来動向

AI と IoT の融合は拡大し続けており、刺激的な将来のトレンドと機会への道を切り開いています。 ...

OpenAIは、テキストを使用してユーザーの感情を検出できる教師なし感情ニューロンを「巧みに」発見した。

OpenAIは4月7日、公式サイトで最新の研究結果を発表し、感情表現を効率的に学習し、現在Amaz...

Python 機械学習の実践: クレジットカード詐欺検出

ストーリーの背景:元のデータは個人の取引記録ですが、データ自体のプライバシーを考慮して、元のデータは...

「顔認識」はあなたの「顔」を盗む

3月15日にも、別の悪徳業者が監視カメラで摘発されたが、消費者の関心を最も集めたニュースは「顔情報の...

第2回解析アルゴリズムコンテストが開始され、技術専門家があなたの参加を待っています

データスキルについてまだ不安がありますか?アルゴリズムの革新を適用できる場所はありませんか?こんなに...

テクノロジーは農作物の栽培プロセスを変えています。何か食べたいときはロボットに頼まなければなりません

Science News for Students によると、食物の栽培は通常、種から始まります。そ...

...

世界ロボット会議は、未来がここにあることを伝えます。

「リラックスして、直立不動で、右を向いてください!」司会者の指示に従い、一列に並んだロボットが一斉...

【WOT2018】4人の重鎮専門家が企業ビジネスにおけるNLPの詳細な応用を分析

[51CTO.comより引用] 2018年11月30日から12月1日まで、WOT2018グローバル人...

人工知能の時代では、機械があなたの仕事を奪うのでしょうか?

テクノロジーの波が押し寄せています。近年、人工知能技術の発展に伴い、ロボット宅配便や純電気無人車両の...

人工知能は多くの仕事を置き換えるでしょう。将来の子供たちの競争力は成績とは全く関係ないかもしれません。

[[379145]]昨日、家で強宝と一緒に『様々な職業』という本を読んでいました。突然思いついて、...

MITが世界の画期的な技術トップ10をランク付け、アリババはそのうち4つを研究中

2月22日のニュース:昨日、権威あるアメリカの科学雑誌「MITテクノロジーレビュー」は、2018年の...

数学をしっかり学べないMLエンジニアは優れたデータサイエンティストではない

数学はすべての科目の基礎であり、数学の学習には終わりがありません。ビジネスに携わっている場合、または...

仮想現実プログラムを使用してテストされた人工視覚技術は、視覚障害者の自立を支援する

科学技術が発展するにつれ、人類への科学技術の貢献が徐々に明らかになってきています。現在、世界中の科学...

ソラがビデオ世代を爆発させたとき、Metaは中国の著者の主導で、エージェントを使用してビデオを自動的に編集し始めました。

最近、AIビデオの分野は非常に活発になっており、OpenAIが立ち上げた大規模なビデオ生成モデルであ...