MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

データベース市場でMySQLの地位を揺るがすようなデータベースが登場したのは久しぶりのようです。主要なデータベースランキングでMySQLがトップの座を占めているのを見るのは慣れっこです。 MySQL は確かに優れたオープンソース データベースであり、現在最も広く使用されているデータベースです。業界の多くの人々も、未来は MySQL にあると信じていますが、本当にそうでしょうか?

[[214237]]

この問題を探るために、この記事ではSQream Technologies の CEO である Ami Gal 氏を特別に招きました。彼の見解では、 GPU データベースは将来のトレンドです。その理由を見てみましょう。

Ami は、強力な技術的バックグラウンドを持ち、20 年を超えるテクノロジーおよび起業家としての経験を有しています。Magic Software (MGIC) で事業開発担当副社長を務め、高性能で複雑なデータ統合環境における新たな成長エンジンを生み出してきました。彼がこのアイデアを思いついた理由は単純です。GPU は CPU よりもはるかに高速にデータを読み取り、処理することができ、そのパフォーマンスは毎年約 40% (データの増加率に等しい) 向上します。

現時点では、ディープラーニング、仮想現実、自動運転車などのいくつかのコア領域以外でのコンピューティングにおけるグラフィックス プロセッシング ユニット (GPU) の機能は、まだあまり知られていません。実際、ほとんどの人にとって、GPU をグラフィック以外のコンピューティングに使用するという考えも聞いたことがありません。ただし、この考え方は、GPU データベースから始めてすぐに変更できます。

多くの人が、 GPU が CPU よりも優れたコンピューティング リソースであることを知っています。複雑な画像を画面上にレンダリングすることは並列化可能な問題、つまり複数の命令ストリームからの命令を同時に処理できる問題であるとエンジニアやアーキテクトが認識したとき、GPU が CPU の現実的な代替手段として登場しました。

当初の解決策は、より複雑でない数千のコアと、より高速で高帯域幅のコアを備えた新しい処理ユニットを作成することでした。その努力の結果、データの読み取りと処理の両方で CPU をはるかに上回る新しい処理ユニットが誕生しました。 (これで、GPU がデータベースに適している理由がおわかりいただけると思います。結局のところ、GPU はデータの読み取りと処理に優れているのです)

実際、GPU データベースはすでに非常によく発達しています。

2016 年の時点では、データは年間約 40% の割合で増加しており、加速傾向が明確に見られました。 1TBのストレージを搭載したスマートフォンの登場により、企業が処理するデータ規模はPBレベルにまで増大しましたが、CPUは毎年10%~20%の増加にとどまっています。データの増加率はCPUが処理できるデータ量をはるかに上回り、GPUデータベースの誕生を可能にしました。

当初、データベース業界で働く多くの人々は、GPU データベースは単なる一時的な流行であり、ニッチな分野やインメモリ データでの使用にのみ適していると考え、GPU データベースに対して楽観的ではありませんでした。

将来も従来のデータベースが主流になると確信している一方で、新しいテクノロジーの受け入れが常に限られていた政府機関を含む多くの業界で、GPU データベースがひっそりと採用されてきました。米国郵政公社が良い例です。同社のデータベースは、20 万の配達ルートにわたる 1 億 5,400 万件の住所を管理しており、郵便配達員の位置データも含まれています。このデータベースがいかに大きいかは想像がつくでしょう。 GPU データベースを使用すると、郵便局は Web ページの読み込みにかかる時間と同じ時間で、複雑なクエリを迅速に処理できます。

[[214238]]

さらに、 GPU データベースは、金融、通信、小売、セキュリティなどの業界で広く使用されています。

現在 CPU と GPU が処理できる生の FLOPS を見てみましょう。

  • CPU - 200 ギガフロップス - 1 秒あたり 200 億回の浮動小数点演算

  • GPU - 120 テラフロップス - 1 秒あたり 120 兆回の浮動小数点演算

GPU は多数の計算を同時に処理できるため、分割して処理することが可能です。大きな問題は小さな問題に分割され、一つずつ解決されます。一方、CPU ベースのデータベースは、コアの数によって制限され、シリアル化された計算を実行するように最適化されています。この結果、データベースは一度に少数のクエリしか処理できなくなるため、クエリを 1 つずつ順番に実行する必要があります。

将来的には、多くの人が GPU データベースの革新的で強力な機能に気づき始めるでしょう。

GPU データベースには、各 GPU ごとに数千個のコアが含まれています。これにより、データベースは数千のクエリを同時に実行し、起動時により高い帯域幅のメモリを使用できるようになります。

ほとんどのビジネスには投資収益率があります。フル GPU サーバーは高価になる可能性がありますが、従来の CPU サーバーの数十台、あるいは数百台に相当する計算能力を実現できます。

GPU データはどのように実装されますか?

ほとんどの GPU データベースはクラウドで実行され、IBM Bluemix から Amazon AWS に至るまでのさまざまな環境で利用できます。データベースが構築されたら、業界標準のドライバーを使用して標準 SQL でデータをクエリできます。ドライバーには次のものがあります。

  • JDBC と ODBC

  • Python、Jupyter、sklearn など。

  • Rおよびその他の機械学習ライブラリ

ほとんどの GPU データベースは構築が簡単で、高度なスキルを必要とせず、既存のエコシステムと互換性があることがよくあります。データ サイエンス作業の場合、作業負荷を数時間から数分以下に短縮できます。

これらすべてが、GPU データベースの開発にとって非常に説得力のある根拠となり、近い将来に GPU データベースが広く採用されるようになるかもしれません。

<<:  ディープラーニングに加えて、これらの開発の方向性も理解する必要があります

>>:  ディープニューラルネットワークのトレーニングが難しいのはなぜですか?

ブログ    
ブログ    

推薦する

AIアラインメントを説明する4万語:北京大学と複数の大学チームがアラインメントの包括的なレビューを発表

論文(継続的に更新):arxiv.org/abs/2310.19852 AI アライメント概要ウェブ...

...

ホーキング博士が亡くなりました。彼が残した5つの予言をぜひ読んでみてください

ガーディアン紙、BBC、スカイニュースチャンネルなど複数の外部情報源によると、英国の物理学者スティー...

Google、医療従事者が情報を素早く見つけられるようにAI検索機能を開始

10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...

AI: 世界の終わりか、それとも新しい時代か?

[[273786]] [51CTO.com クイック翻訳] 1980年代のインターネットの出現から...

調査によると、経営幹部はAIが職務記述書を時代遅れにしていると考えている

最近の調査によると、機械が仕事を奪っていくのを見ると、人間の従業員の士気が低下する可能性があることが...

...

...

一枚の写真で「踊り続ける」ことができ、SHERFは人間の神経放射場を駆動できる新しい方法を一般化することができます

人体神経放射線分野の目標は、2D 人体画像から高品質の 3D デジタル人間を復元して駆動し、それによ...

Adobeは、より高品質な画像を提供するために、AI生成モデルの新世代であるFirefly Image 2をリリースしました。

アドビは10月11日、先日開催されたAdobe MAXクリエイティブカンファレンスにおいて、同社のA...

人工知能は将来の仕事や生活にどのような影響を与えるのでしょうか?

記憶の道をたどってみると、この時代に人類がどれだけ進歩したかがわかるでしょう。昔は、愛する人に手紙を...

TPU v4 チップの計算能力が新たな高みに到達しました。 Googleが世界最大の機械学習センターを建設

最近、Google の I/O 開発者会議で、Google は魅力的な新しい携帯電話、AR グラス、...

ナレッジグラフはどのようにして「人工知能」をよりスマートにするのでしょうか?

この記事では、人工知能がインテリジェントでない領域と、ナレッジ グラフに基づく認知知能がインテリジェ...

...

Baidu Apollo がインテリジェント時代のモバイル空間「Apollo II」を正式に開始

2021年8月5日、百度アポロの新世代自動運転ミニバス「アポロII」が広州市黄埔で正式に公開されまし...