商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

当社のガイドで、ビジネスに AI の力を活用する方法を学びましょう。 RAG と CRAG の統合、ベクトル埋め込み、LLM、ヒント エンジニアリングについて学習します。 AI を責任を持って導入する企業に最適です。

企業向け AI 対応プラットフォームの構築

企業が生成 AI を導入する場合、戦略的に管理する必要がある多くのビジネス リスクに直面します。これらのリスクは相互に関連していることが多く、コンプライアンスの問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な懸念事項としては、評判の失墜、法律および規制基準の遵守(特に顧客とのやり取りに関して)、知的財産権の侵害、倫理的問題、プライバシーに関する懸念(特に個人情報や識別可能なデータを扱う場合)などが挙げられます。

これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG は、AI 生成コンテンツの精度と関連性を向上させ、企業の AI イニシアチブに、より安全で信頼性の高いフレームワークを提供します。この戦略は、知識不足や誤報などの差し迫った問題に対処するだけでなく、法的および倫理的規範を遵守し、評判の失墜やコンプライアンス違反を防ぎます。

検索強化生成 (RAG) を理解する

検索拡張生成 (RAG) は、企業のナレッジ ベースからの情報を統合することで AI コンテンツ作成の精度と信頼性を向上させる高度なアプローチです。 RAG は、料理の基礎を徹底的に理解した上で、生まれ持った才能、包括的なトレーニング、創造力に頼るシェフだと考えてください。珍しいスパイスを使う必要がある場合や、斬新な料理のリクエストに応える必要がある場合、シェフは信頼できる料理の参考文献を参照して、食材が最適に活用されるようにします。

シェフがさまざまな料理を調理できるのと同じように、GPT や LLaMA-2 などの AI システムはさまざまなトピックに関するコンテンツを作成できます。しかし、特にエキゾチックな料理や大量の企業データのナビゲーションなどの複雑なトピックについて、具体的で正確な詳細を提供する必要がある場合は、精度と詳細さを実現するために特別なツールを使用します。

RAG の検索フェーズが不十分な場合はどうなりますか?

RAG 設定の堅牢性を強化するために、Corrective-RAG (CRAG) が導入されました。 CRAG は T5 を使用して、取得したドキュメントの関連性を評価します。企業ソースからの文書が無関係であると判断された場合、そのギャップは Web 検索を通じてデフォルトで埋められる可能性があります。

エンタープライズ規模の生成AIソリューションのアーキテクチャに関する考慮事項

アーキテクチャは基本的に、データの取り込み、クエリとインテリジェントな検索、生成プロンプト エンジニアリング、大規模言語モデルという 3 つの中核的な柱を中心に構築されています

データの取り込み:最初のステップは、会社の文書のコンテンツを簡単にクエリできる形式に変換することです。この変換は埋め込みモデルを使用して、以下の一連の操作に従って行われます。

  1. データ セグメンテーション: Confluence、Jira、PDF などのエンタープライズ ナレッジ ソースからのさまざまなドキュメントがシステムに取り込まれますこのステップでは、ドキュメントを「チャンク」と呼ばれる管理しやすい部分に分割します。
  2. 埋め込みモデル:これらのドキュメント チャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストをその意味を表す数値形式 (ベクトル) に変換し、機械が理解できるようにするニューラル ネットワークです。
  3. インデックス ブロック:埋め込みモデルによって生成されたベクトルにインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
  4. ベクター データベース:すべてのベクター埋め込みはベクター データベースに保存されます。そして、各埋め込みによって表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めます。

クエリとインテリジェント検索:推論サーバーは、ユーザーの質問を受け取ると、同じモデルを使用してドキュメントを知識ベースに埋め込む埋め込みプロセスを通じて、質問をベクトルに変換します。次に、ベクトル データベースを検索して、ユーザーの意図に密接に関連するベクトルを識別し、コンテキスト強化のために大規模言語モデル (LLM) に送り込みます。

5.クエリ:アプリケーションおよび API レイヤーからクエリを実行します。クエリとは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得:生成された Vector.Embedding を使用して、ベクター データベースのインデックスで検索を開始します。ベクトル データベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル(類似性ベクトル):このプロセスは、クエリコンテキストに関連するドキュメントのチャンクを表す類似ベクトルを識別します

8.関連するベクトルを取得します。
ベクター データベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備手順という 2 つの関連するベクトルに相当する可能性があります。対応するスニペットが収集され、プロンプトとともに提供されます。

9.関連するチャンクを取得する:システムは、クエリに関連すると識別されたベクトルに一致するドキュメントの部分を取得します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一貫している場合は、重要度に応じて並べられます。情報が正しくない場合、システムはそれを破棄し、オンラインでより良い情報を探します。

生成ヒントエンジニアリングとLLM :生成ヒントエンジニアリングは、大規模な言語モデルが正しい答えを出すように導くために不可欠です。データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは継続的であり、より良い対応を実現するために定期的な調整が必要です。また、これらの質問が倫理的で偏見がなく、デリケートな話題を避けていることを確認することも重要です。

10. ヒント エンジニアリング:取得されたチャンクは元のクエリとともに使用され、ヒントが作成されます。ヒントは、クエリ コンテキストを言語モデルに効果的に伝えるように設計されています。

11. LLM (大規模言語モデル):エンジニアリングプロンプトは、大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答:最後に、言語モデルはプロンプトによって提供されたコンテキストと取得されたチャンクを使用して、クエリに対する回答を生成します。この回答は、アプリケーション層と API 層を通じてユーザーに送り返されます。

結論は

このブログでは、AI をソフトウェア開発に統合する複雑なプロセスについて説明し、CRAG にヒントを得たエンタープライズ生成の AI プラットフォームを構築することによる変革の可能性に焦点を当てます。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) 手法の複雑さに対処することで、AI テクノロジーをビジネスオペレーションの中核に組み込むアプローチの概要を説明します。今後の議論では、インテリジェント開発のための生成 AI フレームワークについてさらに詳しく検討し、AI の使用を最大化し、よりスマートで効率的な開発環境を確保するための具体的なツール、テクニック、戦略を検討します。

出典: https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

著者: ベンカト・ランガサミー

<<:  人工知能、機械学習、ディープラーニングとは、いったい何なのでしょうか?

>>:  1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース

ブログ    
ブログ    
ブログ    

推薦する

...

...

トップエキスパートが語る: 生成型AIとロボット工学の未来

ビッグデータダイジェスト制作最近、カーネギーメロン大学、カリフォルニア大学バークレー校、Meta、N...

...

2020年にAIに適した5つのプログラミング言語

AI システムの開発にはコンピュータ コードが必要であり、コンピュータ プログラムを開発する際にはさ...

5G+ロボットが炭鉱のインテリジェント開発を加速します!

最近、山西省太原でインテリジェント炭鉱・安全生産フォーラムが盛大に開催され、炭鉱のインテリジェント建...

インテリジェントAIのサポートにより、Xiaomi YoupinはYESOUL Wild Beast高反発腹筋ホイールをクラウドファンディング

YESOUL高反発腹筋ローラーは、1月7日よりXiaomi Youpinでクラウドファンディングで販...

企業がAIアプリケーションの成功を測定する方法

AI を従来のソフトウェアと区別する基本的な特徴は、非決定性です。同じ入力であっても、計算のラウンド...

AI規制論争が再燃、しかしウォール街は依然として熱狂的

米国政府は最近、新たな AI 規制を発表し、AI のセキュリティ上の懸念に再び世界の注目が集まってい...

...

【2021年開始】人工知能産業の発展は依然として多くの課題に直面している

[[380335]]新華網、北京、2月3日(記者:孫雲龍)新たなインフラの重要な部分として、人工知能...

ChatGPTはAmazonに「オンラインストアを開設」し、一夜にしてインターネットの有名人になった

「当社の [製品] は、[タスク 1]、[タスク 2]、[タスク 3] など複数のタスクに使用できる...

BingチャットAIの品質に問題があるとユーザーが報告、マイクロソフトはエクスペリエンスの改善を約束

ここ数週間、ユーザーは Microsoft Edge に組み込まれている GPT-4 AI チャット...

子どもたちがロボットに出会うと、彼らの社会的交流はどのように変化するのでしょうか?

[[241846]]タイトル画像はVisual Chinaより過去2年間で、子供向けのロボット教育...