ガートナーの予測: データレイクの90%は役に立たなくなる

ガートナーの予測: データレイクの90%は役に立たなくなる

ガートナーは以前、2018 年までにデータ レイクの 90% が生データで満たされ、そのテクノロジを使用する人がほとんどいないため役に立たなくなると予測していました。

現在のテクノロジーの世界では、人工知能 (AI) ほど好奇心と興奮を掻き立てるものはありません。 AI の潜在的な利点は、企業内でようやく現れ始めています。

しかし、データ サイエンティストが効果的な AI モデルを構築するために必要な関連データにアクセスできないことが多いため、企業における AI の成長は妨げられています。これらのデータ エキスパートは、必要なすべてのリアルタイム データを活用するのではなく、既存のデータ ウェアハウスなどのいくつかの既知のソースのみに頼らざるを得ないことがよくあります。さらに、多くの企業は、大量のデータのビジネスコンテキストと品質を効果的かつコスト効率よく判断することに苦労しています。こうした困難を考慮すると、AI の加速と導入を阻む歴史的な障壁のいくつかは容易に理解できます。

データが AI にとって価値がある場合にのみ、ユーザーは自信を持って安全にデータを使用して AI モデルをトレーニングできます。これを実現する唯一の方法は、「スマートデータ」に基づくことです。

長年にわたり、私たちはデータの収集と集約を超えて、特定のビジネス アプリケーションを推進してきました (データ 1.0)。組織は、誰もがデータにアクセスできる明確に定義されたプロセスを作成できるようになりましたが、それだけでは十分ではありません。現在では、企業全体の変革を真に推進するためにインテリジェントなデータが必要な段階に達しています (データ 3.0)。

たとえば、企業が顧客ベースとの従来の関係を再定義しようとするときに直面する課題を考えてみましょう。この破壊的な変化を乗り越えるには、データベース、データ ウェアハウス、アプリケーション、ビッグ データ システム、IoT、ソーシャル メディアなどの多数のデータ ソース、構造化、半構造化、非構造化などのさまざまなデータ タイプ、オンプレミス、クラウド、ハイブリッド、ビッグ データ要素などのさまざまな場所からの入力が必要です。

今日、データ レイクは、情報変革の時代に必要とされる大量の多様なデータを保存する究極のリポジトリになりつつあります。しかし、スマートデータがなければ、これらの湖はほとんど価値がありません。ガートナーは以前、2018 年までにデータ レイクの 90% が生データで満たされ、そのテクノロジを使用する人がほとんどいないため役に立たなくなると予測していました。

対照的に、スマート データを使用すると、データ サイエンティストは Google のような検索を実行し、関連するデータの潜在的なソースをすべて即座に発見できます。スマート データを使用すると、データ サイエンティストがモデルに必要なデータの収集、組み立て、調整に費やす貴重な時間を大幅に節約できます。

では、データが本当にインテリジェントであることをどうやって保証するのでしょうか? 広範なメタデータによって駆動される機械学習と AI 機能を使用するエンドツーエンドのデータ管理プラットフォームを構築し、プラットフォーム全体の生産性を向上させます。メタデータはデータの価値を引き出す鍵です。

AI 技術を実装するための包括的で関連性のある正確なデータを提供したい場合は、次の 4 つの異なるメタデータ カテゴリを確認する必要があります。

  1. 技術メタデータ - データベース テーブルと列の情報、およびデータの品質に関する統計が含まれます。
  2. ビジネス メタデータ - データのビジネス コンテキストと、それが関与するビジネス プロセスを定義します。
  3. 運用メタデータ - ソフトウェア システムとプロセス実行に関する情報。
  4. 使用状況メタデータ - アクセスしたデータセット、評価、コメントなど、ユーザーアクティビティに関する情報。

このメタデータのコレクションに AI と機械学習を適用すると、適切なデータを識別して推奨できるだけでなく、このデータは人間の介入なしに自動的に処理できるため、エンタープライズ AI プロジェクトに適しています。

デジタル変革により、組織はデータに対する見方を変える必要に迫られています。これは「獲物になるか、捕食者になるか」という問題です。現在、データとツールへのリアルタイム アクセスにより迅速な分析が可能になり、人工知能と機械学習が促進され、データ ファースト アプローチへの移行が可能になります。人工知能によってもたらされた情報技術革命は、デジタル化、データの爆発的増加、そして企業に対する人工知能の変革的影響により、急成長を遂げています。

明らかに、AI アプリケーションの決定に影響を与える可能性のあるデータ入力がますます増えているため、組織は関連性と影響力のあるコンテンツを選別する必要があります。ただし、組織がデータ管理に人間主導のアプローチを採用する前に、次の質問を検討してください。

AIから何を得たいと考えていますか?

<<:  「システムアーキテクチャ」マイクロサービスサービス劣化

>>:  人工知能について知っておくべき4つのこと!

ブログ    
ブログ    

推薦する

PaxosアルゴリズムがRaftプロトコルとZabプロトコルの祖先である理由とその原理分析

Paxos アルゴリズムは分散分野で非常に重要な役割を果たします。ただし、Paxos アルゴリズムに...

...

2022 年の AI 開発とイノベーションのトップ 10 トレンド

イノベーションは終わりがなく、人工知能(AI) などのテクノロジーが静かに世界を変えています。人工知...

清華大学の博士が「チップレット・アクチュアリー」サミットを提案!ムーアの法則に近づくほど、マルチチップ統合のコスト効率は向上する。

Chiplet は、製品の歩留まり、パッケージの歩留まり、さまざまなコストなどを考慮しながら、大規...

OpenAI、超知能AIの制御に関する中核的な技術的課題に取り組むため新チームを結成

OpenAIは、共同設立者兼主任科学者のイリヤ・スツケバー氏とアラインメント責任者のヤン・ライケ氏が...

2021 年に企業に影響を与える自然言語処理のトレンド

[[384737]] [51CTO.com クイック翻訳] 昨今、自然言語技術は企業でますます活用さ...

Dr. ByteのAIは大活躍、ワンクリックでボーカルと伴奏を完璧に分離

[[424966]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

私たちは皆、AIについて間違っていました! MIT教授が批判:データへの過度の焦点

ルイス・ペレス・ブレバは、マサチューセッツ工科大学 (MIT) の教授であり、MIT エンジニアリン...

...

...

新世代の人工知能標準システムを構築するには?ガイドが来ます →

国家標準化局中央サイバースペース委員会 国家発展改革委員会 科学技術省 工業情報化省 「 国家新世...

人工知能の時代において、テクノロジーは中立ではない

インターネットや人工知能に代表される情報技術の台頭により、社会は第三次科学技術革命の時代を迎えていま...

Programiz: 多くの人がChatGPTを使ってプログラミングを学んでおり、Web開発分野はAIの影響を最も受けやすい

プログラマー育成ウェブサイトProgramizは10月18日、ChatGPTがプログラミング教育分野...

自然言語処理(NLP)の歴史と方向性

自然言語処理の歴史は紆余曲折に満ちた物語です。それは無駄な研究から始まり、何年にもわたる実りある研究...

生成 AI の「生産性パラドックス」: Microsoft はすでに利益を上げていますが、他のクラウド大手はいつ成果を実感するのでしょうか?

1987 年のノーベル経済学賞受賞者であるボブ・ソローは、「生産性統計を除けば、コンピュータ時代は...