1. アトラスの概要まず、ナレッジグラフの基本的な概念をいくつか紹介します。 1. ナレッジグラフとは何ですか?ナレッジグラフは、グラフ構造を使用して、物事間の複雑な関係をモデル化し、識別し、推測し、ドメイン知識を沈殿させることを目的としています。これは、認知インテリジェンスを実現するための重要な基礎であり、検索エンジン、インテリジェントな質問と回答、言語の意味理解、ビッグデータ意思決定分析など、多くの分野で広く使用されています。 ナレッジ グラフは、データ間の意味的関係と構造的関係の両方をモデル化し、ディープラーニング テクノロジと組み合わせることで、2 つの関係をより適切に統合して表現できます。 2. ナレッジグラフを構築する理由私たちは、主に次の 2 つの考慮事項に基づいてナレッジ グラフを構築します。1 つは Ant 独自のデータ ソースの背景特性、もう 1 つはナレッジ グラフがもたらす利点です。 [1] データソースは多様かつ異質であり、統一された知識理解システムが欠如しています。 [2] ナレッジグラフは次のような多くの利点をもたらします。
3. ナレッジグラフの構築方法の概要さまざまなビジネス ナレッジ グラフを構築する過程で、私たちは Ant Knowledge Graph の一般的な構築パラダイムを開発しました。これは主に次の 5 つの部分に分かれています。
共通の構築パラダイムが確立されると、体系的な構築が必要になります。 Ant Knowledge Graph の体系的な構築を 2 つの観点から見てみましょう。まず、アルゴリズムの観点から見ると、知識推論、知識マッチングなど、さまざまなアルゴリズム機能があります。実装の観点から、下から上に向かって、一番下の基本的な依存関係にはグラフ コンピューティング エンジンとコグニティブ ベース コンピューティングが含まれます。その上には、NLP とマルチモーダル プラットフォーム、グラフ プラットフォームなどのグラフ ベースがあります。その上には、Ant Knowledge Graph を構築できるさまざまなグラフ構築テクノロジがあります。ナレッジ グラフに基づいて、グラフ推論を行うことができます。さらに上には、一般的なアルゴリズム機能を提供します。そして、一番上にはビジネス アプリケーションがあります。 2. マップの構築次に、グラフ構築、グラフ融合、グラフ認識など、ナレッジグラフ構築における Ant Group の中核機能の一部を紹介します。 1. グラフの構築グラフ構築のプロセスには、主に次の 6 つのステップが含まれます。
建設中の3つの経験とヒント専門知識を取り入れたエンティティ分類ナレッジ グラフを構築する場合、入力エンティティを分類する必要があります。これは、ant シナリオにおける大規模なマルチラベル分類タスクです。エンティティ分類の専門知識を統合するために、主に次の 3 つの最適化が行われます。
ドメイン語彙の挿入によるエンティティ認識エンティティ認識に基づいて、単語接続のグラフ構造から始めて、モデルは接続に適切な重みを付け、ノイズ単語接続の重みを減らすことを学習します。境界コントラスト学習と意味コントラスト学習の 2 つのモジュールが提案されています。
論理ルールによって制約された小規模サンプル関係抽出ドメインの問題に関しては、ラベル付けされたサンプルが非常に少なく、少数のショットまたはゼロショットのシナリオに直面する可能性があります。この場合、関係抽出の核となるアイデアは、外部の知識ベースを導入することです。異なる意味空間によって引き起こされるパフォーマンス低下の問題を解決するために、論理ルールに基づく推論モジュールが設計されています。エンティティタイプのマッチングによって引き起こされる暗記の問題を解決するために、微妙な違いを認識するモジュールが設計されています。 2. グラフ融合グラフ融合とは、異なるビジネス分野のグラフ間で情報を融合することを指します。 グラフ融合の利点:
グラフ融合におけるエンティティの配置ナレッジ グラフ融合プロセスにおける中核的な技術的ポイントは、エンティティのアライメントです。ここでは、主に 2 つのモジュール (1 つは表現モジュール、もう 1 つはインタラクション モジュール) を含む SOTA アルゴリズム BERT-INT を使用します。 アルゴリズムの実装プロセスには、主にリコールとソートが含まれます。 再現:表現モジュールでは、タイトル テキストの BERT ベクトル類似度再現が利用されます。 タイトル + 属性 + 隣接要素に基づくソート モデル: ü 表現モジュールを使用して、タイトル、属性、隣接要素のベクトル表現を完成させます。
3. グラフ認識このセクションでは、主に ants 内の知識表現学習フレームワークについて説明します。 Ant は、Encoder-Decoder フレームワークに基づいた知識表現学習を提案しました。エンコーダーはグラフニューラルネットワークの学習方法であり、デコーダーはリンク予測などの知識表現の学習です。この表現学習フレームワークは、ユニバーサルなエンティティ/リレーションシップ埋め込みの生成を自己監視することができ、次のようないくつかの利点があります。1) 埋め込みサイズが元の特徴空間よりもはるかに小さいため、ストレージ コストが削減されます。2) 低次元ベクトルは密度が高く、データのスパース性の問題が効果的に緩和されます。3) 同じベクトル空間で学習することで、複数のソースの異種データの融合がより自然になります。4) 埋め込みにはある程度の普遍性があり、下流のビジネスでの使用に便利です。 3. グラフアプリケーション次に、Ant Group におけるナレッジグラフの代表的な応用事例をいくつか紹介します。 1. グラフのシナリオ適用モード具体的な事例を紹介する前に、まずは知識獲得、知識管理と推論、知識サービスを中心に、Ant Knowledge Graph シナリオ適用のいくつかのモードを紹介しましょう。下の図の通りです。 2. 典型的なケースケース1: ナレッジグラフに基づく構造化マッチングリコールビジネス シナリオは、Alipay のメイン検索エンジンのミニ アプリにコンテンツを追加することです。解決すべきビジネス上の問題点は次のとおりです。
解決策は、マーチャントナレッジグラフを構築することです。マーチャント グラフ内の製品関係と組み合わせることで、ユーザーのクエリ製品レベルの構造化された理解が実現されます。 事例2: 推薦システムにおけるユーザー意図のリアルタイム予測このケースは、ホームページの推奨に対するユーザーの意図をリアルタイムで予測するものです。AlipayKG が構築され、フレームワークは上図に示されています。関連研究はトップカンファレンスwww 2023でも発表されています。さらに理解を深めるために論文を参照することができます。 事例3: 知識表現に基づくマーケティングクーポンの推奨このシナリオは、消費者向けバウチャーを推奨するためのシナリオです。企業が直面する問題点は次のとおりです。
上記の問題を解決するために、動的グラフ表現を統合したディープベクトルリコールアルゴリズムを設計しました。ユーザーの消費バウチャー行動は周期的であることがわかったため、静的な単一のエッジではこの周期的な行動をモデル化することはできません。この目的のために、まず動的グラフを構築し、次にチームが開発した動的グラフ アルゴリズムを使用して埋め込み表現を学習しました。表現を取得した後、それをデュアルタワー モデルに組み込んでベクトル リコールを行いました。 事例4: 医療イベントに基づくインテリジェントなクレームエキスパートのルール推論最後のケースはグラフルールの推論に関するものです。医療保険の健康マップを例にとると、医療知識、請求ルール、および「人間の」健康に関する情報が含まれており、これらはエンティティにリンクされ、論理ルールと組み合わされて意思決定の基礎として機能します。グラフにより、専門家による請求処理の効率が向上します。 4. グラフと大規模モデル最後に、大規模モデルの急速な開発の文脈におけるナレッジグラフの機会について簡単に説明しましょう。 1. ナレッジグラフとビッグモデルの関係ナレッジグラフとビッグモデルにはそれぞれ長所と短所があります。ビッグモデルの主な長所には、一般的な知識モデリングと普遍性が含まれますが、ビッグモデルの短所はナレッジグラフの利点によって補うことができます。グラフの利点としては、高い精度と強力な解釈可能性が挙げられます。大きなモデルとナレッジグラフは相互に影響を与える可能性があります。 グラフとビッグモデルの統合には通常 3 つのルートがあります。1 つは、ナレッジ グラフを使用してビッグモデルを強化することです。2 つ目は、ビッグモデルを使用してナレッジ グラフを強化することです。3 つ目は、ビッグモデルとナレッジ グラフが相乗効果を発揮し、互いの長所を補完することです。ビッグモデルはパラメーター化されたナレッジ ベースと見なすことができ、ナレッジ グラフは可視的なナレッジ ベースと見なすことができます。 2. 大規模モデルと知識グラフの応用例大規模モデルは知識グラフの構築に使用されるナレッジ グラフの構築プロセスでは、大規模なモデルを使用して、情報抽出、知識モデリング、関係推論を行うことができます。 大規模モデルを使用してナレッジグラフから情報を抽出する方法DAMO アカデミーのこの研究では、情報抽出の問題を 2 つの段階に分解します。
大規模モデルへのナレッジグラフの適用ナレッジ グラフを大規模モデルに適用する場合、主に次の 3 つの側面があります。 ナレッジ グラフを大規模なモデル入力に統合します。ナレッジ グラフは、データをクリーンアップしたり、形式的なスプライシングを直接的かつ明示的に実行したりするために使用できます。 ナレッジグラフを大規模モデルのトレーニングに統合します。例えば、2 つのタスクのトレーニングを同時に実行できます。ナレッジ グラフは知識表現タスクに使用し、大規模モデルは MLM 事前トレーニングに使用して、2 つを共同でモデル化できます。 大規模モデル推論に知識グラフを注入します。まず、大規模モデルの 2 つの問題を解決できます。1 つは、大規模モデルの「ナンセンス」を回避するために、知識グラフを事前制約として使用することです。2 つ目は、大規模モデルの適時性の問題を解決することです。一方、ナレッジグラフに基づいて、大規模なモデルの生成に説明可能なソリューションを提供することができます。 知識強化型質問応答システム主に 2 つのカテゴリがあります。1 つは、大規模なモデルを使用して KBQA モデルを最適化するナレッジ グラフ強化質問応答システムです。もう 1 つは、LangChain、GopherCite、New Bing などに似た情報検索強化で、大規模なモデルを使用してナレッジ ベースの質問応答を行います。 知識強化型生成検索質問応答システムには、次のような利点があります。
3. まとめと展望ナレッジ グラフや大規模モデルをより適切に操作および連携させるには、次の 3 つの方向性があります。
|
<<: AppleはAI競争で遅れをとり、市場価値ランキングはAmazon、Google、Microsoftに追い抜かれる可能性も
AlphaGoがイ・セドルに勝利したことで世界は人工知能に再び親しむようになったが、アップグレード...
[[417713]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
知能の鍵となるのは、簡単な指示を与えられて新しいタスクを実行する方法を素早く学習する能力です。たとえ...
最近のコロナ時代では、教育は大きなビジネスへと変貌しました。初等、中等、高等教育機関における学習は目...
開発チームが AI ツールの作成に奔走する中、エッジ デバイスでのアルゴリズムのトレーニングが一般的...
[[258735]] 3月3日、毎年恒例の全国「両会」が正式に始まりました。「両会」シーズンが始ま...
画像解析アプリケーションでは、大量の画像サンプルを効果的かつ自動的にフィルタリングすることが重要な基...
[51CTO.comからのオリジナル記事] 近年、自然言語処理技術は徐々に最も広く使用されている人工...
企業は AI ツールを使用して、顧客ロイヤルティにプラスの影響を与え、利益を増やすことができる会話型...
[[347812]]現在の人工知能技術の発展は、主にコンピュータを媒体として活用し、自動化技術の発...
7月4日に開催された百度AI開発者会議(Baidu Create 2018)で、百度上級副社長兼AI...
パルクールはエクストリームスポーツであり、複雑な環境におけるさまざまな障害物を素早く克服する必要があ...