イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

[51CTO.com からのオリジナル記事] 今日の情報化社会には、さまざまな情報リソースが溢れています。さまざまな情報リソースをいかに効果的に管理し、活用するかは、科学研究や意思決定管理の前提条件です。データ処理は、管理情報システムの不可欠な中核部分です。手動管理段階からファイルシステム段階、そして現在のデータベースシステム段階に至るまで、データ処理はここ数十年で質的な飛躍を遂げてきました。

欧州科技のCEOである張磊氏は、最近51CTOとの独占インタビューで、新世代のデータベースはAI脳レベルに対応し、人工知能の応用シナリオにより適したものになるはずだと語った。そこで、欧州科技はこのチャンスを捉え、HAWQをベースとした第4世代データウェアハウスの開発に着手し、エンジェルラウンドとRedpointとSequoiaが主導するAラウンドの2回の資金調達を獲得しました。

データベースの進化

新しい世代のデータベースについて話す前に、まずデータベースの進化について見てみましょう。データベースシステムの研究開発から現在に至るまで、数十年を経てきました。共有ストレージデータベースの第 1 世代から、MPP データベースの第 2 世代、ストレージとコンピューティングを分離したアーキテクチャを持つデータベースの第 3 世代まで、3 つの進化を遂げてきました。

共有ストレージ データベース: リソースを節約し、開発者のコ​​ストを削減するために、共有ストレージ データベースが登場しました。データはハイエンドの共有ストレージに保存されます。従来の Oracle データベースやその他の共有ストレージ データベースも、最も古いトランザクション データベースです。このタイプのデータベースでは、ノードの数が多いとストレージがボトルネックになります。

MPP データベースは現在、Teradata や Vertica を含む多数の企業で使用されています。オペレーティング システムやファイル システムなどの基盤となるインフラストラクチャがあまり成熟していないため、Teradata は独自のハードウェアを使用し、ハードウェアとソフトウェアが統合されたマシンに重点を置き、大量のオペレーティング システムとファイル システム コードを変更してきました。 2000 年頃には、Vertica、Greenplum など、x86 アーキテクチャに基づく MPP データベースが登場しました。これらの x86 ベースの MPP データベースは通常のサーバーを使用し、独自のハードウェア サポートはありません。ソフトウェア アーキテクチャは Teradata に似ています。

ストレージとコンピューティングが分離されたアーキテクチャを持つデータベース。このタイプのデータベースの代表的なものとしては、HAWQ や Hive などがあります。第 3 世代データ ウェアハウスの利点は優れたスケーラビリティですが、Hive などのほとんどのエンジンはパフォーマンスが低く、互換性も低いため、顧客が使用するのは困難です。

人工知能シナリオにおける HAWQ に基づく新世代の分析データベース

チャン・レイ氏は、1990年代頃のデータ処理はデータの保存と管理に限定されず、ユーザーが必要とするさまざまなデータ処理方法に重点が置かれるようになったと述べた。分析データベースは、分析アプリケーション用のデータベースです。オンライン統計、オンライン分析、ランダムクエリなどのタスクを実行して、情報データの価値を調査できます。大量のデータの処理には一定の利点があります。しかし、人工知能のシナリオでは、ほとんどの分析データベースがまだ苦戦しており、反復的なイノベーションが差し迫っています。 Oushu Technology が開発した HAWQ ベースの Oushu データベースは、人工知能向けの大量データ処理において独自の利点を備えています。

新世代の分析データベースは、さまざまな分野のデータ処理のボトルネックを解決します

ビッグデータと人工知能アプリケーションの出現により、新世代のデータベースの膨大なデータ処理および分析機能に対する要件がさらに高まっています。金融、セキュリティ、製造業などの業界では、データベースのパフォーマンスを向上させることが急務となっています。新世代の分析データベースの誕生により、このニーズは解決されました。

セキュリティ分野などの人工知能の応用場面では、新世代のデータベースは、画像認識や顔認識を通じてより深い認知と推論を行うことができます。個人の身元認識や人間の軌跡分析の面では、ビデオ、写真、電子ナンバープレートなどのさまざまな種類のデータを分析、照合して潜在的なつながりを発見し、貴重な情報を抽出し、疑わしい行動に対して早期警告を発し、ケースをリンクして公安部門によるケース検出の効率を向上させることができます。

リアルタイム データや、企業内のさまざまなレベルにわたるリアルタイム IoT センサー データなどのその他の実用的なケースでは、新世代のデータベースは Storm などの面倒なソリューションを放棄し、大量のプログラミングや IoT センサー データに完全に適応できないという問題を解決しました。

さらに、新世代のデータ ウェアハウスは、グローバル規模の展開のニーズも解決します。現在、あらゆるコアアプリケーションはデータ分析と人工知能と切り離すことはできません。たとえば、従来の銀行の取引システムやクレジットカードの不正防止システムは、データウェアハウス内の2か所に3つのセンター、異なる場所でのマルチアクティブを実現する必要があり、これはPBレベルのデータを管理するデータウェアハウスシステムにとって大きな課題となっています。

次世代分析データベースの応用シナリオ

Chang Lei 氏は、現在のデータベース アプリケーションの需要は大きく変化しており、これはデータベース市場が大きな変化のチャンスを持つことを示していると考えています。これを機に、Oushu TechnologyはOushu DatabaseとLittleBoyという2つのコア製品を発表しました。Oushu DatabaseはApache HAWQをベースにしており、LittleBoyはOushu Databaseとシームレスに統合された人工知能製品です。金融、税務データ、治安、司法データ、電力網データなど、膨大なデータを扱う分野に適用できます。

金融分野では、企業が銀行から融資を受けるという伝統的な業務では、まず銀行が企業に対してデューデリジェンスと審査を行い、その後、審査員による評価を受ける必要があります。これらの審査プロセスは、完全に手作業で行われています。個人向け融資や中小零細企業向け融資の場合、借り手情報は比較的簡単に入手できるため、借り手情報を自動的に審査できます。法人向け業務の場合は、膨大な量のデータが関係するため、銀行はすべての内部データと外部データを一元管理し、内部データを主題ごとに統合し、外部データセットを統合する必要があります。 Oushu Technology は、データの保存、管理、分析、人工知能アルゴリズム モデリングを使用して、顧客がモデル プロセスを簡単に構築し、モデルを管理および起動できるように支援します。以前の複雑なレビュー プロセスは不要になり、レビュー時間が大幅に短縮されます。

インタビューの中で、張磊氏は次のように述べた。「Microsoft Accelerator は欧樹科技にとって大きな助けとなっています。一方では、Microsoft Accelerator と欧樹科技は研究開発で協力関係を築き、欧樹科技は自社製品を Microsoft Accelerator の Azure パブリック クラウドに移植しました。他方では、Microsoft Accelerator はさまざまな業界の多くの顧客リソースを紹介し、管理、財務、採用、広報、その他のトレーニングの側面でも欧樹科技に指導を提供しました。」

<<:  機械翻訳の3つのコア技術原則 | AI知識の普及

>>:  ブロックチェーン科学: 非対称暗号化、楕円曲線暗号

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

空から地上へ、そしてついに無人機が海へ

[[251878]]数日前、もう一つの非常に興味深い広告が私の注意を引きました。それはトルコのテクノ...

ML Ops: データ品質が鍵

ML Ops は AI 分野における比較的新しい概念であり、「機械学習操作」として説明できます。モデ...

データセンターで自動化できない 5 つのこと

データセンター内外を問わず、自動化に境界はないと考えるのは簡単です。 AI がデータ センターの運用...

大規模言語モデルの視覚的才能: GPTは文脈学習を通じて視覚的タスクも解決できる

現在、大規模言語モデル (LLM) は、自然言語処理 (NLP) の分野で変化の波を引き起こしていま...

...

Google X、手作業でラベル付けすることなく一目で対象部品を見つけられるグリッパーアームをオープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

6000億元の市場シェア!今は無人採掘に最適な時期でしょうか?

2019年を振り返ると、無人商用車にとっては着陸の兆しがなく、資金調達がますます困難になり、最悪の...

AI天気予報には依然として人間の介入が必要

業界では、デート、マーケティング、ソーシャルメディアから宇宙探査、医療の進歩に至るまで、人工知能とそ...

2018 年後半のディープラーニング プロジェクトをお見逃しなく!

[[252582]]ビッグデータダイジェスト制作翻訳者:fuma、Ni Ni、Jiang Baos...

機械学習で避けるべき3つのよくある間違い

企業は、お金の無駄遣い、アプリケーションのパフォーマンスの低下、成果の得られないという 3 つの間違...

天一雲が大規模言語モデル微調整データコンテストで優勝しました!

最近、天地FT-Data Rankerコンテストが終了し、天一クラウドインテリジェントエッジビジネス...

「機械代替」がもたらす技術的失業危機をどう見るか

[[376593]] 1月18日の光明日報によると、近年、中国の製造業は「機械が人間に取って代わる」...

人工知能とデータサイエンスに基づく実用的な分析システムの構築におけるシティバンクの実践経験

シティバンクは、人工知能とデータサイエンスに基づいた実用的な分析システムをどのように構築したのでしょ...

「新しいインフラ」に求められるAI人材のギャップをどう埋めるか

「新インフラ」がホットワードとなり、その重要な構成要素として人工知能に大きな期待が寄せられている。 ...