AI搭載ストレージは企業がデータからより多くの価値を引き出すのに役立ちます

AI搭載ストレージは企業がデータからより多くの価値を引き出すのに役立ちます

ストレージを、手作業で手間がかかる必需品ではなく、自動運転車として考えることができたらどうでしょうか。自動運転車のように、ストレージ インフラストラクチャも必要なものを予測し、道路上の障害物を回避できるとしたらどうでしょうか。

新しいテクノロジーに対する許容度と会社の文化によっては、アプリケーションの動作から学習し、アプリケーションと構成の異常を識別し、その情報を使用して問題を予測して防止するテクノロジーをすでに活用している可能性があります。

[[347751]]

これらのコアテクノロジーを支えるのは人工知能です。実際、AI は特異な状況にあり、専門家によれば、この状況がすぐに変わる可能性は低いとのことです。最近のマッキンゼーの調査によると、現在、企業のほぼ半数が何らかの形で AI を使用していますが、大多数の企業は今後も AI への投資が引き続き増加すると予想しています。

人工知能も、今日のストレージのニーズを満たす上で急速に重要になってきています。これにより、大量のデータを迅速かつインテリジェントに分析できるようになり、ボトルネック、可用性の問題、セキュリティの問題を回避するのに役立ちます。 AI を活用したスト​​レージにより、IT スタッフは問題の解決に費やす時間を短縮し、インフラストラクチャの可用性と生産性を向上させることができます。

HPE ストレージの製品マーケティング ディレクターである David Wang 氏は、同社の目標は、ほぼ瞬時に洞察を提供できる自動化された AI 駆動型のインフラストラクチャを構築することだと述べています。

「私たちは、洞察が即時かつ目に見える変化をもたらすところまで到達したいのです」と彼は語った。 「ローカルエッジからクラウドに至るまで、エンドツーエンドの AI パイプラインが必要であるという見方があります。」

問題を別の視点から見る

IBMのストレージマーケティング担当ディレクター、ダグ・オフラハティ氏は、「AIはストレージの使命を変えるため、企業もストレージとデータを違った視点で見る必要がある」と述べた。

「ストレージをデータベースや特定のユースケースに必要なものとして考えるのをやめ、さまざまな部門からさまざまな方法でデータにアクセスする方法について考える必要があります」と彼は言いました。 「データ サイエンティストや組織内のさまざまな機能を担当する他のユーザーがそのデータにアクセスできるようになれば、ストレージを真に変革するために不可欠な、次のレベルのデータ分析を実現できます。」

より広い視点で考えることに加えて、従来のデータ中心のアプローチではなく、よりアプリケーション中心のアプローチでストレージに取り組むことが重要です。

「ビッグデータAIの世界のバージョン1.0では、企業はデータによって動かされる必要があると信じていました。そのため、すべてのデータをリポジトリに保存し、グループ内のすべてのAI担当者に焦点を当てていました」と、分散型NoSQLデータベーステクノロジーを専門とする企業Splice MachineのCEO、モンテ・ズウェベン氏は説明します。

その結果、これらのデータ レイクはすぐに「データ スワンプ」に変わってしまうことが多く、その主な原因は、ビジネス プロセスの責任者が、そのビジネス プロセスで使用されるデータとアプリケーションを考慮していないことです。

データではなくアプリケーションに重点を置くことで、ストレージとその機能をビジネスに適合させることができます。たとえば、大量の請求 (ビジネス プロセス) を処理する保険会社は、請求システムを担当する請求スペシャリストやアプリケーション開発者と協力してアプリケーションを特定します。これらを統合することで、データをどのように使用してスマートな請求処理システムを構築するかをより適切に決定できるようになります。

「これは、世界中のすべてのデータを収集し、それを請求に関心がある可能性のある人々に提供しようとするのではなく、アプリケーションがよりインテリジェントにデータを処理できるようにすることです」と彼は言いました。 「これは単純なアイデアだが、企業が AI を実装する方法に大きな影響を与える可能性があります。」

成功する AI ベースのストレージ インフラストラクチャを構築するには、AI ストレージ パイプラインの 3 つの異なるフェーズ、つまりデータ取り込み (さまざまな環境からデータを取り込んで正規化し、全体として確認できるようにする)、トレーニング (機械学習を使用してデータを研究し、実際のデータの内容を理解する)、推論 (洞察を提供するフェーズ) に対処することも意味します。

これらの要件を満たすには、ストレージ インフラストラクチャが非常に大きな容量、長期のデータ保持、および高性能な処理をサポートできる必要があります。つまり、大規模な AI には、大規模な機能、保持、パフォーマンスも必要です。

ストレージ・スイス社の主席アナリスト、ジョージ・クランプ氏は、大容量のストレージをサポートする能力が重要であると述べた。同氏によると、データ取得の初期コストが高いため、組織が AI ワークロードのトレーニングに使用したデータ ポイントを削除することはほとんどないという。さらに、これらのデータセットは、アクセスが経年とともに減少するという一般的なデータ アクセス モデルに従っていません。 「AIワークロードが古いトレーニングデータを再処理する必要がある可能性はほぼ100%なので、データセット全体を常にすぐに利用できるようにしておく必要があります」と彼は付け加えた。

特にストレージ容量が増加し続けるにつれて、長期保存も同様に重要になります。

「私たちが言いたいのは、機械は入力されたデータに基づいて判断を下すようになるということだ。つまり、データは削除できない。データは増え続けるだろう」とオフラハティ氏は語った。 「データが増えれば増えるほど、AIをより正確かつ効率的に適用できるようになります。」

単にデータ量を増やすだけでなく、より多くの種類のデータを保存する必要があります。これには、データに関するデータ (メタデータ) が含まれます。メタデータは、特にデータ ガバナンスに関しては、最も価値のある商品の 1 つになりつつあると多くの人が考えています。

3 番目の要件は、高性能な処理です。

「AIアプリケーションのトレーニングは反復的なプロセスであり、精度を向上させるには、何度もトレーニングし、AIアルゴリズムを微調整し、そして再びトレーニングするというプロセスが必要になる」とクランプ氏は述べた。 「反復が速くなればなるほど、開発者はより正確なモデルを作成できるようになり、ストレージ インフラストラクチャにかかる負荷が増大します。」

ほとんどの AI ワークロードで重要なのは、これらの環境内の標準グラフィック プロセッシング ユニット (GPU) を可能な限りビジー状態に維持することだとクランプ氏は言います。 AIのワークロードによっては、多数のノードとフラッシュとハードディスクの混在を備えたスケールアウト型ストレージシステムが合理的になる可能性があるとクランプ氏は述べた。 「AI ワークロードは非常に並列化される傾向があり、並列のスケールアウト ストレージ クラスターはハード ディスク ドライブ上でも困難な場合があります」と彼は述べています。

人工知能を活用する

事業を始めたばかりの企業の場合、既存のデータをシステムから抽出し、選択したデータ セットに AI 手法を適用して相関関係を見つけるだけで、簡単にデータを拡張できます。しかし、最終的には、もう少し深く掘り下げたいと思うようになるでしょう。重要なアプリケーションとシステムが結び付けられると、AI の真のメリットを享受するには、新しいインフラストラクチャとデータ処理の新しい方法を導入する必要があるかもしれません。

選択する AI ベースのストレージ システムには、メタデータを迅速に管理し、適切なデータ タイプを適切なストレージ タイプに保存できるインテリジェンスが備わっている必要があります。インフラストラクチャをオンプレミスで実行することを選択した場合、オールフラッシュ ストレージ システムから始めることもできますが、最終的にはフラッシュとハード ディスクのハイブリッド環境に移行することも理にかなっているとクランプ氏は述べています。通常、環境には、環境間でのデータの移動を自動化するソフトウェア定義ストレージも含まれます。

一部の組織(特に機密性の高いワークロードやコンプライアンス/データ ガバナンスの問題がある組織)では、すべてをオンプレミスで維持することを好む一方、クラウドベースの AI/ストレージ環境のメリットを享受できる組織もあります。

「クラウドコンピューティングではコンピューティング能力とデータの共有が必要なため、こうしたことの多くはクラウドで起きている」と、HPEのNimble Storage製品管理担当シニアディレクター、ロクナ・ダンド氏は語った。 「AI モデルから得られる結果の品質は、そのモデルをトレーニングするために利用できるデータの多様性と量に依存するため、クラウドからグローバル データを収集するシステムを使用するのが理にかなっています。」

一方、ダンド氏は、HPE は HPE Insight がクラウドで提供しているのと同じタイプのグローバル データ分析を顧客のオンプレミス環境に導入する方法を検討していると述べました。彼女の目標は、クラウドで学んだ教訓をコードに体系化し、それをファイアウォールの背後のローカルアップデートとして適用することだ。

ダンド氏は、時間の経過とともにテクノロジーが進化し、インフラストラクチャ管理は最終的に完全に自動化されると考えています。 「現在よりも多くの問題を予測し、予防できるようになり、それらの予測と予防に対する自信も高まるでしょう」と彼女は語った。 「問題を予測して解決方法を特定できるだけでなく、適切な解決策を特定して行動を起こすこともできるようになります。」

<<:  機械は人間に取って代わるでしょうか?人工知能技術の倫理的リスクを解明する

>>:  FacebookはVRキーボードを使ってデータを入力する方法を開発中

ブログ    

推薦する

インテリジェント チャットボットを自分で開発するための完全ガイド (完全なソース コード付き)

1. はじめに人工知能の時代において、独自のインテリジェントな質問応答ロボットを開発することは、一...

建設技術におけるAIは潜在性があるが、まだ現実にはなっていない

建設業界がテクノロジーの導入において他の業界に遅れをとっているのは周知の事実です。 2018年の米国...

機械学習 = 「新しいボトルに入った古いワイン」の統計?いいえ!

最近、ディープラーニングと人工知能に関するジョークがソーシャルメディア上で広く流布しており、この2つ...

5G+AI:将来的には1+1>2の効果は得られるのか?

情報産業革命以来、人々の生活は大きく変化しました。それぞれの新しいテクノロジーの出現は、さまざまなレ...

初心者のための機械学習ガイド

[[202148]]レベル2初心者になる仕事で機械学習の実際の応用に遭遇したのはこれが初めてでした。...

李開復「2021年を予測」:4つの主要分野が前例のない発展の機会をもたらす

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

673本の論文を要約し、UIUCなどが20ヶ月で完成させた信頼性の高い機械学習レビューを発表

少し前、UIUC と南洋理工大学の 3 人の研究者が 20 か月かけて 673 本の論文を研究し、信...

組み込み物流ロボットの用途は何ですか?

ネットワーク技術やグリッドコンピューティングの発展により、組み込み型モバイル機器を中核とした「ユビキ...

MITは、Natureの表紙に掲載され、非コード領域のDNA変異を予測するディープラーニングフレームワークを設計した。

人間の細胞にはそれぞれ多数の遺伝子が含まれていますが、いわゆる「コーディング」DNA配列は、ヒトゲノ...

ちょうど今、ビートルズはAIがプロデュースした「最後の」新曲をリリースした。

音楽に詳しい友人なら、ビートルズを知らない人はいないでしょう。ビートルズは、歴史上最も偉大で最も影響...

日本の警察は、AIを使って不審者の動きや表情を分析し、「一匹狼」犯罪に対処する予定

7月10日、日経中国版ウェブサイトの報道によると、日本の警察庁は早ければ年内にもAIによる捜査活動を...

GPTベースの開発者ツール

localGPT - GPT モデル ツールのローカル展開localGPT を使用すると、GPT モ...

...

ChatGPT も「逆方向に学習」するのでしょうか?

継続的に学習することで向上していくことは、現代の AI の大きなセールスポイントの 1 つです。しか...

ガートナー:2021年までに70%の組織が従業員の生産性向上にAIを活用する

人工知能は職場にますます浸透しつつあり、現在では仮想パーソナルアシスタント (VPA) やその他の形...