商用 AI をマスターする: RAG と CRAG を使用したエンタープライズレベルの AI プラットフォームの構築

当社のガイドで、ビジネスに AI の力を活用する方法を学びましょう。 RAG と CRAG の統合、ベクトル埋め込み、LLM、ヒントエンジニアリングについて学習します。 AI を責任を持って導入する企業に最適です。

企業向け AI 対応プラットフォームの構築

企業が生成 AI を導入する場合、戦略的に管理する必要がある多くのビジネスリスクに直面します。これらのリスクは相互に関連していることが多く、コンプライアンスの問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な懸念事項としては、評判の失墜、法律および規制基準の遵守（特に顧客とのやり取りに関して）、知的財産権の侵害、倫理的問題、プライバシーに関する懸念（特に個人情報や識別可能なデータを扱う場合）などが挙げられます。

これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG は、AI 生成コンテンツの精度と関連性を向上させ、企業の AI イニシアチブに、より安全で信頼性の高いフレームワークを提供します。この戦略は、知識不足や誤報などの差し迫った問題に対処するだけでなく、法的および倫理的規範を遵守し、評判の失墜やコンプライアンス違反を防ぎます。

検索強化生成 (RAG) を理解する

検索拡張生成 (RAG) は、企業のナレッジベースからの情報を統合することで AI コンテンツ作成の精度と信頼性を向上させる高度なアプローチです。 RAG は、料理の基礎を徹底的に理解した上で、生まれ持った才能、包括的なトレーニング、創造力に頼るシェフだと考えてください。珍しいスパイスを使う必要がある場合や、斬新な料理のリクエストに応える必要がある場合、シェフは信頼できる料理の参考文献を参照して、食材が最適に活用されるようにします。

シェフがさまざまな料理を調理できるのと同じように、GPT や LLaMA-2 などの AI システムはさまざまなトピックに関するコンテンツを作成できます。しかし、特にエキゾチックな料理や大量の企業データのナビゲーションなどの複雑なトピックについて、具体的で正確な詳細を提供する必要がある場合は、精度と詳細さを実現するために特別なツールを使用します。

RAG の検索フェーズが不十分な場合はどうなりますか?

RAG 設定の堅牢性を強化するために、Corrective-RAG (CRAG) が導入されました。 CRAG は T5 を使用して、取得したドキュメントの関連性を評価します。企業ソースからの文書が無関係であると判断された場合、そのギャップは Web 検索を通じてデフォルトで埋められる可能性があります。

エンタープライズ規模の生成AIソリューションのアーキテクチャに関する考慮事項

アーキテクチャは基本的に、データの取り込み、クエリとインテリジェントな検索、生成プロンプトエンジニアリング、大規模言語モデルという 3 つの中核的な柱を中心に構築されています。

データの取り込み:最初のステップは、会社の文書のコンテンツを簡単にクエリできる形式に変換することです。この変換は埋め込みモデルを使用して、以下の一連の操作に従って行われます。

データセグメンテーション: Confluence、Jira、PDF などのエンタープライズナレッジソースからのさまざまなドキュメントがシステムに取り込まれます。このステップでは、ドキュメントを「チャンク」と呼ばれる管理しやすい部分に分割します。
埋め込みモデル:これらのドキュメントチャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストをその意味を表す数値形式 (ベクトル) に変換し、機械が理解できるようにするニューラルネットワークです。
インデックスブロック:埋め込みモデルによって生成されたベクトルにインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
ベクターデータベース:すべてのベクター埋め込みはベクターデータベースに保存されます。そして、各埋め込みによって表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めます。

クエリとインテリジェント検索:推論サーバーは、ユーザーの質問を受け取ると、同じモデルを使用してドキュメントを知識ベースに埋め込む埋め込みプロセスを通じて、質問をベクトルに変換します。次に、ベクトルデータベースを検索して、ユーザーの意図に密接に関連するベクトルを識別し、コンテキスト強化のために大規模言語モデル (LLM) に送り込みます。

5.クエリ:アプリケーションおよび API レイヤーからクエリを実行します。クエリとは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得:生成された Vector.Embedding を使用して、ベクターデータベースのインデックスで検索を開始します。ベクトルデータベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル（類似性ベクトル）：このプロセスは、クエリコンテキストに関連するドキュメントのチャンクを表す類似ベクトルを識別します。

8.関連するベクトルを取得します。
ベクターデータベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備手順という 2 つの関連するベクトルに相当する可能性があります。対応するスニペットが収集され、プロンプトとともに提供されます。

9.関連するチャンクを取得する:システムは、クエリに関連すると識別されたベクトルに一致するドキュメントの部分を取得します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一貫している場合は、重要度に応じて並べられます。情報が正しくない場合、システムはそれを破棄し、オンラインでより良い情報を探します。

生成ヒントエンジニアリングとLLM :生成ヒントエンジニアリングは、大規模な言語モデルが正しい答えを出すように導くために不可欠です。データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは継続的であり、より良い対応を実現するために定期的な調整が必要です。また、これらの質問が倫理的で偏見がなく、デリケートな話題を避けていることを確認することも重要です。

10. ヒントエンジニアリング:取得されたチャンクは元のクエリとともに使用され、ヒントが作成されます。ヒントは、クエリコンテキストを言語モデルに効果的に伝えるように設計されています。

11. LLM (大規模言語モデル):エンジニアリングプロンプトは、大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答:最後に、言語モデルはプロンプトによって提供されたコンテキストと取得されたチャンクを使用して、クエリに対する回答を生成します。この回答は、アプリケーション層と API 層を通じてユーザーに送り返されます。

結論は

このブログでは、AI をソフトウェア開発に統合する複雑なプロセスについて説明し、CRAG にヒントを得たエンタープライズ生成の AI プラットフォームを構築することによる変革の可能性に焦点を当てます。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) 手法の複雑さに対処することで、AI テクノロジーをビジネスオペレーションの中核に組み込むアプローチの概要を説明します。今後の議論では、インテリジェント開発のための生成 AI フレームワークについてさらに詳しく検討し、AI の使用を最大化し、よりスマートで効率的な開発環境を確保するための具体的なツール、テクニック、戦略を検討します。

出典: https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

著者: ベンカト・ランガサミー

<<: 人工知能、機械学習、ディープラーニングとは、いったい何なのでしょうか?

>>: 1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース