イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

[51CTO.com からのオリジナル記事] 今日の情報化社会には、さまざまな情報リソースが溢れています。さまざまな情報リソースをいかに効果的に管理し、活用するかは、科学研究や意思決定管理の前提条件です。データ処理は、管理情報システムの不可欠な中核部分です。手動管理段階からファイルシステム段階、そして現在のデータベースシステム段階に至るまで、データ処理はここ数十年で質的な飛躍を遂げてきました。

欧州科技のCEOである張磊氏は、最近51CTOとの独占インタビューで、新世代のデータベースはAI脳レベルに対応し、人工知能の応用シナリオにより適したものになるはずだと語った。そこで、欧州科技はこのチャンスを捉え、HAWQをベースとした第4世代データウェアハウスの開発に着手し、エンジェルラウンドとRedpointとSequoiaが主導するAラウンドの2回の資金調達を獲得しました。

データベースの進化

新しい世代のデータベースについて話す前に、まずデータベースの進化について見てみましょう。データベースシステムの研究開発から現在に至るまで、数十年を経てきました。共有ストレージデータベースの第 1 世代から、MPP データベースの第 2 世代、ストレージとコンピューティングを分離したアーキテクチャを持つデータベースの第 3 世代まで、3 つの進化を遂げてきました。

共有ストレージ データベース: リソースを節約し、開発者のコ​​ストを削減するために、共有ストレージ データベースが登場しました。データはハイエンドの共有ストレージに保存されます。従来の Oracle データベースやその他の共有ストレージ データベースも、最も古いトランザクション データベースです。このタイプのデータベースでは、ノードの数が多いとストレージがボトルネックになります。

MPP データベースは現在、Teradata や Vertica を含む多数の企業で使用されています。オペレーティング システムやファイル システムなどの基盤となるインフラストラクチャがあまり成熟していないため、Teradata は独自のハードウェアを使用し、ハードウェアとソフトウェアが統合されたマシンに重点を置き、大量のオペレーティング システムとファイル システム コードを変更してきました。 2000 年頃には、Vertica、Greenplum など、x86 アーキテクチャに基づく MPP データベースが登場しました。これらの x86 ベースの MPP データベースは通常のサーバーを使用し、独自のハードウェア サポートはありません。ソフトウェア アーキテクチャは Teradata に似ています。

ストレージとコンピューティングが分離されたアーキテクチャを持つデータベース。このタイプのデータベースの代表的なものとしては、HAWQ や Hive などがあります。第 3 世代データ ウェアハウスの利点は優れたスケーラビリティですが、Hive などのほとんどのエンジンはパフォーマンスが低く、互換性も低いため、顧客が使用するのは困難です。

人工知能シナリオにおける HAWQ に基づく新世代の分析データベース

チャン・レイ氏は、1990年代頃のデータ処理はデータの保存と管理に限定されず、ユーザーが必要とするさまざまなデータ処理方法に重点が置かれるようになったと述べた。分析データベースは、分析アプリケーション用のデータベースです。オンライン統計、オンライン分析、ランダムクエリなどのタスクを実行して、情報データの価値を調査できます。大量のデータの処理には一定の利点があります。しかし、人工知能のシナリオでは、ほとんどの分析データベースがまだ苦戦しており、反復的なイノベーションが差し迫っています。 Oushu Technology が開発した HAWQ ベースの Oushu データベースは、人工知能向けの大量データ処理において独自の利点を備えています。

新世代の分析データベースは、さまざまな分野のデータ処理のボトルネックを解決します

ビッグデータと人工知能アプリケーションの出現により、新世代のデータベースの膨大なデータ処理および分析機能に対する要件がさらに高まっています。金融、セキュリティ、製造業などの業界では、データベースのパフォーマンスを向上させることが急務となっています。新世代の分析データベースの誕生により、このニーズは解決されました。

セキュリティ分野などの人工知能の応用場面では、新世代のデータベースは、画像認識や顔認識を通じてより深い認知と推論を行うことができます。個人の身元認識や人間の軌跡分析の面では、ビデオ、写真、電子ナンバープレートなどのさまざまな種類のデータを分析、照合して潜在的なつながりを発見し、貴重な情報を抽出し、疑わしい行動に対して早期警告を発し、ケースをリンクして公安部門によるケース検出の効率を向上させることができます。

リアルタイム データや、企業内のさまざまなレベルにわたるリアルタイム IoT センサー データなどのその他の実用的なケースでは、新世代のデータベースは Storm などの面倒なソリューションを放棄し、大量のプログラミングや IoT センサー データに完全に適応できないという問題を解決しました。

さらに、新世代のデータ ウェアハウスは、グローバル規模の展開のニーズも解決します。現在、あらゆるコアアプリケーションはデータ分析と人工知能と切り離すことはできません。たとえば、従来の銀行の取引システムやクレジットカードの不正防止システムは、データウェアハウス内の2か所に3つのセンター、異なる場所でのマルチアクティブを実現する必要があり、これはPBレベルのデータを管理するデータウェアハウスシステムにとって大きな課題となっています。

次世代分析データベースの応用シナリオ

Chang Lei 氏は、現在のデータベース アプリケーションの需要は大きく変化しており、これはデータベース市場が大きな変化のチャンスを持つことを示していると考えています。これを機に、Oushu TechnologyはOushu DatabaseとLittleBoyという2つのコア製品を発表しました。Oushu DatabaseはApache HAWQをベースにしており、LittleBoyはOushu Databaseとシームレスに統合された人工知能製品です。金融、税務データ、治安、司法データ、電力網データなど、膨大なデータを扱う分野に適用できます。

金融分野では、企業が銀行から融資を受けるという伝統的な業務では、まず銀行が企業に対してデューデリジェンスと審査を行い、その後、審査員による評価を受ける必要があります。これらの審査プロセスは、完全に手作業で行われています。個人向け融資や中小零細企業向け融資の場合、借り手情報は比較的簡単に入手できるため、借り手情報を自動的に審査できます。法人向け業務の場合は、膨大な量のデータが関係するため、銀行はすべての内部データと外部データを一元管理し、内部データを主題ごとに統合し、外部データセットを統合する必要があります。 Oushu Technology は、データの保存、管理、分析、人工知能アルゴリズム モデリングを使用して、顧客がモデル プロセスを簡単に構築し、モデルを管理および起動できるように支援します。以前の複雑なレビュー プロセスは不要になり、レビュー時間が大幅に短縮されます。

インタビューの中で、張磊氏は次のように述べた。「Microsoft Accelerator は欧樹科技にとって大きな助けとなっています。一方では、Microsoft Accelerator と欧樹科技は研究開発で協力関係を築き、欧樹科技は自社製品を Microsoft Accelerator の Azure パブリック クラウドに移植しました。他方では、Microsoft Accelerator はさまざまな業界の多くの顧客リソースを紹介し、管理、財務、採用、広報、その他のトレーニングの側面でも欧樹科技に指導を提供しました。」

<<:  機械翻訳の3つのコア技術原則 | AI知識の普及

>>:  ブロックチェーン科学: 非対称暗号化、楕円曲線暗号

ブログ    
ブログ    
ブログ    

推薦する

住宅建設はよりスマートになる

スマートホーム革命はここしばらく本格的に始まっています。住宅所有者はデータと IoT テクノロジーを...

...

認知科学から進化まで、強化学習における最新の2つのブレークスルーを詳しく説明します

ビッグデータダイジェスト制作編纂者:李磊、銭天培近年、深層強化学習 (Deep RL) は人工知能に...

Microsoft Bing Chat が GPT-4 Turbo モデルを導入、一部のユーザーは無料で使用可能

12月25日、Windowslatestによると、Microsoft Bing ChatのGPT-4...

顔認識と指紋認識のどちらがより定量化しやすいでしょうか?

顔認証と指紋認証は、携帯電話のロックを解除する主な 2 つの方法です。私たちは、日常の仕事でも公共の...

Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

今後、Kaggle のコンペティションに参加する際には、AutoML を直接送信して、参加する AI...

...

Scikit-learn を使用して機械学習用のテキストデータを準備する方法

[[208625]]テキスト データを使用して予測モデルを構築する前に、特別な準備が必要です。まずテ...

WeChat AIがGoogleを超え、NLP分野で新たな世界初を獲得

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IoT、エッジコンピューティング、AIプロジェクトが企業にもたらす利益

[[385209]]ビル・ホームズは、象徴的なフェンダー・ストラトキャスターとテレキャスターのギター...

AI技術を活用してより強力な処理チップを開発

現在、ますます多くのスタートアップ企業と大手半導体企業が新しい AI チップの発売を競っています。 ...

市長や市議会議員に立候補する際、ロボットは公務員として適しているでしょうか?

知名度という点では、サウジアラビアのパスポートを持つソフィアは、間違いなくロボット工学界のトップスタ...

快手ドラゴンフライ戦略エンジンの設計と応用

1. 問題と課題1. 問題の背景2018年以来、Kuaishouの事業全体は急速に発展しており、チー...

...