ナレッジグラフの紹介と応用

ナレッジグラフの紹介と応用

[[376661]]

人間は知識を獲得する過程で、物事の本質にますます注意を払うようになります。人工知能とビッグデータ分析機能の助けを借りて、これに基づいてさまざまなインテリジェントアプリケーションが派生してきましたが、その中でも知識グラフの構築は非常に重要です。

ナレッジグラフを使い始める

1. ナレッジグラフの重要性

AI は知覚知能から認知知能へと移行する必要があります。本質的には、知識が基礎であり、知識に基づいた推論です。偶然にも、ナレッジ グラフには実際にそのような属性があります。

2. 知識工学の歴史

3. 知識とは何でしょうか?

情報: Cover News、China、First Intelligence Mediaなどの外部の客観的事実を指します。

知識:それは外部の客観的な法則の誘導と結論であり、例えば、Cover News は中国初のインテリジェントメディアです。

4. ナレッジグラフとは何ですか?

ナレッジ グラフは本質的にはセマンティック ネットワークであり、ノード (ポイント) とエッジ (エッジ) で構成されるグラフ ベースのデータ構造です。ナレッジグラフでは、各ノードが現実世界に存在する「エンティティ」を表し、各線がエンティティ間の「関係」になります。ナレッジグラフは関係性を表現する最も効果的な方法です。

5. ナレッジグラフの構成

エンティティ:区別可能で独立した存在を持つもの。人、都市、植物、製品など。

概念:国、国民、書籍、コンピューターなど、同じ特性を持つエンティティの集合。

コンテンツ:通常は、エンティティやセマンティック クラスの名前、説明、解説などであり、テキスト、画像、音声、ビデオなどで表現できます。

属性:エンティティからその属性値へのポインター。異なる属性タイプは、異なるタイプの属性を持つエッジに対応します。属性値は主にオブジェクトの指定された属性の値を指します。たとえば、「面積」、「人口」、「首都」はそれぞれ異なる属性です。属性値は主に、960 万平方キロメートルなど、オブジェクトの指定された属性の値を指します。

リレーションシップ:リレーションシップは異なるエンティティを接続し、エンティティ間の接続を指します。ナレッジ グラフ内のノードは、関係ノードを介して接続され、大きなグラフを形成します。

ナレッジグラフの構築

1. データ型

ナレッジ グラフのデータ タイプには、構造化データ (リレーショナル データベース)、半構造化データ (XML、JSON、百科事典など)、非構造化データ (画像、音声、ビデオ、テキストなど) が含まれます。

2. 論理構造

モデル層: モデル層は、主にオントロジー ライブラリを通じてデータ層上に構築され、データ層内の一連のファクト表現を標準化します。オントロジーは、構造化された知識ベースの概念テンプレートです。オントロジー ライブラリを通じて形成された知識ベースは、強力な階層構造を持つだけでなく、冗長性も低くなっています。

データ層: データ層は主に一連の事実で構成され、知識は事実単位で保存されます。事実を表現するために (エンティティ 1、リレーションシップ、エンティティ 2) や (エンティティ、属性、属性値) などのトリプルを使用する場合は、グラフ データベースをストレージ メディアとして選択できます。

3. 保管方法

RDF (リソース記述フレームワーク): その本質はデータ モデルです。エンティティ/リソースを記述するための統一された標準を提供します。簡単に言えば、物事を表現する方法と手段です。

RDF はノードとエッジで構成されます。ノードはエンティティ/リソースと属性を表し、エッジはエンティティ間の関係とエンティティと属性間の関係を表します。

グラフ データベース:ナレッジ グラフの観点から見ると、グラフ データベースはリレーショナル データベースよりもはるかに柔軟です。

データが少ない場合、リレーショナル データベースは問題にならず、効率も低くありません。ただし、ナレッジ グラフがより複雑になるにつれて、グラフ データベースの利点は大幅に増加します。 2 次および 3 次関連クエリに関しては、グラフ データベースの効率はリレーショナル データベースの数千倍、あるいは数百万倍も高くなります。

4. 技術アーキテクチャ

5. ナレッジグラフ構築プロセス

ナレッジグラフアプリケーション

1. 情報検索

セマンティック検索回答検索型

[原理]ユーザーが自然言語で提起した質問に対して意味的および文法的解析を実行し、それを構造化されたクエリ文に変換して、ナレッジグラフで回答を検索します。

[シナリオ]多数のウェブリンクではなく、質問に対する答えを直接見つける

関係検索

[シナリオ] 2つのエンティティ間の関係を迅速かつ正確に照会する

視覚化

[シーン]概念のすべてのインスタンスが明確かつ直感的に提示されます

2. インテリジェントな推奨

推奨システムは、情報のフィルタリングの重要な手段として、情報過多の問題を解決する最も効果的な方法の 1 つであり、ユーザー指向のインターネット製品の中核技術です。

推奨サービスの使用には 2 つの問題があります。

スパース データを使用する:実際のシナリオでは、ユーザーとアイテム間のインタラクション情報は非常にスパースであることが多いです。

コールド スタートの問題:新しく追加されたユーザーまたはアイテムについては、システムには過去のインタラクション情報がないため、正確にモデル化して推奨することができません。

上記の問題を解決する一般的な方法は、推奨アルゴリズムにいくつかの追加の補助情報を導入することです。

(1)ソーシャルネットワーク:ユーザーが商品に興味を持っている場合、そのユーザーの友人もその商品に興味を持っている可能性があります。

(2)ユーザー/アイテム属性:同じ属性を持つユーザーは同じ種類のアイテムに興味を持っている可能性がある。

画像/動画/音声/テキストなどのマルチメディア情報(マルチメディア):製品写真、映画の予告編、音楽、ニュースの見出しなど。

(3)コンテキスト:ユーザーとアイテムのやり取りの時間、場所、現在のセッション情報など。

ナレッジグラフ…

ナレッジ グラフには、エンティティ間の豊富な意味的関連性が含まれており、推奨システムの補助情報の潜在的なソースとなります。ナレッジグラフは、映画、ニュース、アトラクション、レストラン、ショッピングなど、多くの推奨シナリオで使用できる可能性があります。

正確性:ナレッジ グラフはアイテム間のより意味的な関係を導入し、ユーザーの興味を深く発見できます。

多様性:ナレッジ グラフはさまざまな種類の関係接続を提供するため、推奨結果の多様性が促進され、推奨結果が 1 つのタイプに限定されることが回避されます。

説明可能性:ナレッジグラフは、ユーザーの履歴記録と推奨結果を結び付けることができるため、推奨結果に対するユーザーの満足度と受け入れ度が向上し、推奨システムに対するユーザーの信頼が高まります。

3. 不正行為防止

不一致検証:不一致検証は、借り手の詐欺リスクを判断するために使用できます。

例えば、借り手張三と借り手李思は同じ会社の電話番号を記入しましたが、張三が記入した会社と李思が記入した会社はまったく異なります。これはリスクポイントとなり、監査人は特別な注意を払う必要があります。

例えば、借り手は張三と友達であり、李斯の父親であると言います。当然ですが、友人の友人は父と息子ではないので、矛盾が生じます。

4. その他の産業用途

公安犯罪捜査:主体間の関係を分析し、手がかりを得る等

司法援助:事件の判決等を支援するための法律条項の構造化された表現および照会。

電子商取引:ユーザーの購入意向と製品候補セットを正確に一致させるための製品知識グラフを構築します。

医療診断:薬物分析、病気の診断などのための視覚的な知識表現を提供します。

<<:  ジェフ・ディーンの1万語の記事:2020年のGoogleの10大分野におけるAI技術の発展

>>:  知識が求められるポストディープラーニング時代において、知識グラフをいかに効率的かつ自動的に構築できるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2024年の人工知能の6つの主要な発展トレンド

テクノロジーが支配する急速に進化する世界では、人間の創造性と人工知能 (AI) の魅力的な融合が中心...

2018 年のビッグデータのトレンド: 人工知能... データ分析には視覚化モデルが含まれます...

導入ノートパソコン、スマートフォン、センサーはすべて、モノのインターネット向けに大量のデータを生成し...

将来の人工知能戦争の運用概念に関する研究

[[390910]]このレポートでは、将来の AI 戦争における作戦レベルの防御と攻撃の概念を提案し...

...

毎日のアルゴリズム: 回文部分文字列

[[434467]]文字列が与えられた場合、その文字列に含まれる回文の部分文字列の数を数えることがタ...

機械学習プロジェクトが失敗する9つの理由

この記事では、データ サイエンス プロジェクトが失敗する最も一般的な理由をまとめ、落とし穴を回避する...

NLPer が仕事に戻りました! 2019年の機械学習とNLPの年次レビューを見てみましょう

2019年は機械学習と自然言語処理の分野で急速な発展があった年でした。 DeepMind の科学者 ...

...

...

インテリジェンスの時代: 新たな進歩、新たな傾向、新たな取り組み。第 2 回世界インテリジェンス会議が来月開催されます。

4月18日、北京メディアセンターで第2回世界情報会議の記者会見が開催された。記者会見では、中国共産...

人工知能は人間に取って代わろうとしているのでしょうか、あるいは人間を支配しようとしているのでしょうか?本当にそうなのでしょうか?

生産性が徐々に生産と生活をカバーするようになると、ロボットはすぐに生活のあらゆる分野に参入し、一部の...

人工知能プロジェクト: 注目すべき 7 つのポイント

最近、業界調査会社ガートナーは、AI プロジェクトの 85% は CIO に引き渡されないという大胆...

12 のシナリオ アプリケーション、100 を超えるアルゴリズム、AI はどのようにして経済を征服するのか?

[[328065]] 2020年2月7日、第34回アメリカ人工知能学会年次会議(AAAI 2020...

データセキュリティを保護しながらAIタスクを加速

MIT の研究者は、ディープ ニューラル ネットワーク アクセラレータの最適な設計を効率的に特定し、...