データが生成型 AI に対応できるようにする 7 つの方法

データが生成型 AI に対応できるようにする 7 つの方法

翻訳者 |ブガッティ

レビュー | Chonglou

誰も生成AIと大規模言語モデルの力を活用したいと考えていますが難問があります。 AIに対する高い期待に応えるには高品質で実用的なデータが必要ですが多くの組織はそれを達成できていません。

ジョー・カゼルタ氏ケイヴァン・ロウシャンキッシュ氏共同執筆した最近のマッキンゼーのレポートでは、多くの組織が生成型AIに関連したものを求めていると指摘されています。しかし、このプレッシャーには他の問題も伴いますデータが生成AI対応していない場合はビジネスも生成AI対応していないことになります。

報告書の著者はIT 部門とデータ マネージャーは、生成AIに対するデータの影響を明確に理解する必要があると示唆しています。データは既存のサービスを利用して、アプリケーション プログラミング インターフェイスまたは企業独自のモデルを通じて使用される場合がありますがこれには多額の投資だけでなく、複雑なデータ タグ付けおよび注釈戦略も必要になります。

カゼルタ氏と彼のチームによると、おそらく最も難しいのは、チャット、ビデオ、コードなどの非構造化データを処理する生成AIの能力です。データ指向の組織は、これまで、表内のデータなどの構造化されたデータしか処理できませんでした。

このデータ変化は、組織が生成AI プロジェクトをサポートするために全体的なデータ アーキテクチャを再考する必要があることを意味します。これは古いニュースのように聞こえるかもしれませんが、企業がこれまでは問題にならなかったシステムの脆弱性が、生成AIによって大きな問題になります。強力なデータ基盤がなければ、生成AI利点の多くは実現できません

業界全体で、リーダーたちは、生成 AI などの新たな課題に対処するために必要な大量データ流入組織が処理できるかどうかについて、懸念を表明する傾向が高まっています 継続的なイノベーションと技術の進歩によって推進されるデジタル変革は、組織の運営方法を変えることを意味しますと、 Faction Inc.技術および運営担当副社長ジェフ・ヘラー氏は述べています

さらに、より効率的応答性の高いデータ アーキテクチャの必要性を推進する要因は AI だけではありません。 「顧客は今後もカスタマイズされたサービスとコミュニケーションを期待するだろうが、それは当然ながら正確なデータに大きく依存するインターゾイドの創設者兼CEOボブ・ブラウアー氏は語った

メッセージは明確ですデータが負担ではなく貴重な資産であり続けるように、企業が戦略を策定し高度なテクノロジーを導入する時が来ているのです

専門家は急速に台頭しつつあるAI時代に向けデータを準備するには考慮すべき要素がいくつかあると示唆しています

1. データ ガバナンス戦略を策定する:適切な優先順位スタッフ、ガバナンス、ツール、管理要件があれば、組織はデータ品質の課題を負担から大きな競争上の優位性へと変えることができます AI やその他の取り組みの背後にあるデータに対する組織的なサポートを構築するための第一歩としては生成AI 、大規模言語モデル、その他の新しい AI ベースのテクノロジーにおける新たなイノベーションをどのように活用して競争上の優位性を獲得できるかを検討するワーキング グループを作成することが考えられます

2. データストレージ戦略を策定する:すべてのデータを保存する場所を見つけ、簡単に見つけてアクセスできるようにすることが必須ですクアンタムの最高開発責任者ブライアン・パウロウスキー氏は、最近の業界調査で、保存されているデータの半分以上(60%)が非アクティブでありつまりほとんどアクセスされないか、まったくアクセスされないことがわかったと語った。それでも、企業はこのデータを捨てたくないと考えています。なぜなら、特に生成 AI が広く使用されるようになると、今後数年間でこのデータが貴重なソリューションとビジネス価値をもたらす可能性があると理解しているからです。この課題を解決するには、既存の機能を再評価しライフサイクル全体を通じてアクティブデータと非アクティブデータに簡単にアクセスして処理できる最新の自動化ストレージ アーキテクチャを構築する必要があります

3.データ品質戦略を確実に確立する: AI によってもたらされる新たな需要対応できるようにデータアーキテクチャを準備するには、まず高いデータ品質を戦略上の優先事項にすることから始めます良いスタートとしては、データ品質プログラム専用の予算とリソースを持つ最高データ責任者または同様の役職を任命することです。

4.進捗状況を確実に測定する:リーダーシップの優先事項には、企業全体のデータを測定し成功を測定するための指標と目標を確立することが含まれる必要があります

5.非構造化データを処理する能力を確保する:生成AIモデルでは、データ量が多く、その多くが非構造化されているため、従来の機械学習モデルよりもデータ品質の問題が顕著になり既存の追跡ツールを使用して追跡することが困難になります。将来的には、生成されるデータ全体の約90 %を非構造化データが占め、世界のストレージ容量は今後 5 年間で平均 25 % の成長率で増加すると予想されます。この非構造化データは高解像度のビデオや画像、複雑な医療データ、ゲノム配列、機械学習モデルへの入力、自然界に関する科学的データ油田やガス田のマッピングなど 、特殊効果、アニメーション、拡張現実などの現実シミュレーションなど、ファイルやオブジェクトに保存されます。組織にとって、データのライフサイクルを自動的に管理し、 AIなどの最先端テクノロジーを活用してビジネス価値を高めるソリューションを導入することが重要です

6.幅広いユースケースをサポートする機能をデータ アーキテクチャに組み込む:関連する機能(ベクトル ライブラリ、データの前処理および後処理パイプラインなど) 特に非構造化データをサポートする機能を既存のデータアーキテクチャに組み込みます

7. AIを活用して AI を構築する:生成AIを使用して独自のデータを管理します生成AI は、データ エンジニアリングからデータ ガバナンス、データ分析まで、データ バリュー チェーン全体にわたって既存のタスクを高速化しタスクの処理方法を改善できます

原題:データが生成型 AI に対応していることを確認する 7 つの方法、著者: Joe McKendrick

<<:  マスク氏の AI ツール Grok は ChatGPT のシェルですか?

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

高度な数学に希望があります!ニューラルネットワークは1秒未満で偏微分方程式を解く

タスクの数が増えるにつれて、現在の計算方法を使用して汎用の日常的なロボットを構築するコストは法外なも...

...

産業インテリジェンスは「新しいインフラ」の下で非常に人気がありますが、まだ多くの問題があります

「新しいインフラ」が流行っています。これらは5G、人工知能、モノのインターネットなどの情報デジタルイ...

...

ヘルスケア市場における人工知能は2028年までに615億9000万ドルに達すると予想

[[432745]]パーソナライズ医療の需要の高まりは、ヘルスケア市場における人工知能の成長を推進す...

これらの不気味な「偽人間」は人工知能の新時代の到来を告げる

[51CTO.com クイック翻訳]唇の無精ひげ、額のしわ、皮膚の斑点がはっきりと見えますが、「彼」...

...

Titanium Technology CEO、Li Shuhao氏:ツールの輸出からブランドの輸出まで、Martechはどのような新たな機会に直面していますか?

2020年、国内の新たな消費が活況を呈する一方で、海外市場も急速な成長機会の新たな波を迎えています...

TRSのTuotianビッグモデルが正式にリリースされ、メディア、金融、政府関係の3つの業界向けのビッグモデルが発表されました。

2023年6月29日、チューリングはNLP分野での30年間の技術革新、10年以上の高品質なデータと...

GPT のプログラミング バージョンは 30,000 スターに急上昇し、AutoGPT は危険にさらされています。

執筆者 | 王 瑞平AutoGPT に続いて、GPT ファミリーに新しいメンバーである GPT-En...

メモリを3%~7%削減! Google がコンパイラ最適化のための機械学習フレームワーク MLGO を提案

現代のコンピュータの出現により、より高速でより小さなコードをコンパイルする方法が問題になりました。コ...

知っておくべき 19 の実用的なコンソール デバッグのヒント!

みなさんこんにちは、CUGGZです。ブラウザの開発者ツールは、DOM ツリー構造の表示、CSS スタ...

顔認識は政治的立場を決定できるか?研究者:本当ですよ!正解率は72%にも達する

アメリカのテクノロジーウェブサイト「ベンチャービート」が1月12日に報じたところによると、米スタンフ...

...

マスク氏が「ブレインカッター」を募集! Neuralink が初の人体実験を公式に発表。ALS 患者は「数秒でホーキング博士に変身」するのでしょうか?

マスク氏の世界で「脳コンピューターインターフェース」を開発している企業、Neuralink は本日、...