人工知能業界では無視できない技術分野「ナレッジグラフ」

人工知能業界では無視できない技術分野「ナレッジグラフ」

[[384932]]

2012 年に、Google は Metaweb から派生した Knowledge Graph という製品を立ち上げました。これは主に検索エンジンの品質を向上させ、ユーザーの検索エクスペリエンスを向上させるために使用されます。

2020年、ナレッジグラフはブランチ製品から大規模な知識を構築するためのキラーアプリケーションへと進化し、検索、自然言語処理、インテリジェントアシスタント、電子商取引などの分野で重要な役割を果たしています。

過去 8 年間、ビッグデータ時代の到来と人工知能技術の急速な進歩により、ナレッジグラフはますます基本的かつ重要なものになってきました。

では、ナレッジグラフとは一体何でしょうか?

ナレッジグラフとは、知識の発展過程と構造的関係を示す一連のさまざまなグラフィックです。視覚化技術を使用して、知識リソースとそのキャリアを記述し、知識とその相互関係をマイニング、分析、構築、描画、表示します。

ナレッジグラフは、インターネット上の情報を人間の認知世界に近い形で表現できると同時に、インターネット上の膨大な量の情報を整理、管理、理解する能力を向上させます。ナレッジグラフはインターネットのセマンティック検索に活力をもたらし、インテリジェントな質問回答においてもその力を発揮しています。

これは、インターネットの知識によって駆動されるインテリジェントなアプリケーションのためのインフラストラクチャとなっています。ナレッジグラフは、ビッグデータやディープラーニングとともに、インターネットと人工知能の発展の中心的な原動力の 1 つとなっています。 【1】

テキストによる表現は奥が深いように思われるかもしれませんが、実は私たちは日常生活の中でナレッジグラフ技術がもたらす利便性を実感することが多いのです。

たとえば、Baidu で Andy Lau の個人情報を検索すると、図 1 と図 2 の 2 つの表示形式が表示されます。コンテンツの観点から見ると、2 つの形式で表示される情報に大きな違いはありませんが、図 2 の方が直感的に見えます。特にテキストコンテンツが増えると、図 2 のプレゼンテーション形式の利点がより顕著になります。ビッグデータインターネットプラットフォーム上に置くと、図2の表現モードは明らかに処理しやすくなりますが、インターネットやその他のデータプラットフォームで収集された情報は、図1に示すように断片化された情報であることがほとんどであるため、図1のテキストコンテンツを図2に変換するプロセスには、前述のナレッジグラフ技術が関係しています。

例えば、図3では、特定の人物や物事のキーワードの提示をよく見かけますが、実はこの提示形式も、ネットユーザーのコメントなどの断片的な情報をナレッジグラフ技術を使って機械が整理・処理することで形成されています。

2020年のナレッジグラフ技術開発の現状

「2020年中国人工知能特許技術分析レポート」によると、ナレッジグラフ技術全体の特許出願件数は着実に増加傾向を示している。 2012年以降、我が国のナレッジグラフ技術分野における特許出願の成長率は著しく加速しており、図4からわかるように、出願件数は2019年にピークに達し、年間を通じて合計4,966件の関連特許が出願されました。不完全な統計によると、2020年初頭から2020年10月末までに、この分野の特許出願件数は1,942件に達しました。ナレッジグラフ技術は、さまざまな権利者が人工知能業界で競争力を獲得するための強力な武器になりつつあります。 【2】

ナレッジグラフ分野における特許出願人(または企業)の状況をもっとよく理解するために、筆者は北京知的財産公開情報サービスプラットフォームを通じてナレッジグラフ分野の特許出願を検索した。検索結果を図5に示す。検索を通じて、ナレッジグラフ分野では、テンセントテクノロジー(深圳)有限公司、北京百度網絡科技有限公司、平安科技(深圳)有限公司、北京明路ソフトウェアシステムズ有限公司、百度オンラインネットワークテクノロジー(北京)有限公司がそれぞれ上位5位にランクインしていることが判明した。そのうち、テンセントテクノロジーは550件の特許で1位、百度網絡は346件の特許で2位、平安テクノロジーは182件の特許で3位、北京明膠は110件の特許で4位、百度は92件の特許で5位となった。

同時に、著者は国家知識産権局の特許検索・分析ウェブサイトでナレッジグラフ分野の関連特許を検索した。検索結果を図6に示す。北京情報サービスプラットフォームを使用した検索結果と比較すると、特許出願人の上位5社は、百度網絡、平安科技、騰訊科技、海南大学、北京明膠とあまり変わらない。しかし、特許出願件数には若干の差がある。百度網絡は237件で1位、平安科技は136件で2位、騰訊科技は116件で3位、海南大学は64件で4位、北京明膠は59件で5位となっている。

図7からわかるように、2020年のナレッジグラフ分野における特許出願件数による国内省市別ランキングでは、北京と広東が主な出願地域となっている。その中で、北京は特許出願の31%で第1位、広東は特許出願の24%で第2位、浙江は特許出願の11%で第3位となっている。

図8からわかるように、2020年に出願されたナレッジグラフ分野の特許のIPCは主にG06とH04に集中しており、その中でG06F16が21%で第1位、G06K9が17%で第2位、G06N3が14%で第3位となっています。

図9から、2020年のナレッジグラフ分野の特許出願では、人工知能、ナレッジグラフ、特徴ベクトル、機械学習、ディープラーニングなどのキーワードが革新的なワードクラウドになっていることがわかります。

中国ソフトウェアネットワークの不完全な統計によると、中国にはナレッジグラフ製品またはソリューションを提供する主流企業が約38社あります。そのうち、約65%が金融分野、約26%が公共サービスおよび政府関係分野、約26%がエネルギーおよび産業分野にあります。これらは、関与する企業数が最も多い3つの分野です。

図10から、多くの企業がナレッジグラフ技術を利用して、金融、公共サービスと政府関係、医療と製薬、エネルギーと産業、商業など、複数の分野に関与していることがわかります。たとえば、Tencent Cloudはナレッジグラフ技術を使用してモノのインターネットを開発し、医療機器、輸送車両のGPSなどに適用しています。Alibaba Cloudはナレッジグラフ技術を使用して電力分野の運用手順をサポートし、Huawei Cloudはナレッジグラフ技術を使用して石油とガスの探査と開発を支援しています。Minglu Technologyはナレッジグラフ技術を使用して、金融、公共サービスと政府関係、エネルギーと産業、商業に関与しています。Beijing Haizhi Wangju Information Technology Co., Ltd.はナレッジグラフ技術を使用して公安分野での実践を実施しています。

では、ナレッジグラフは実際の業務においてさまざまな分野でどのような役割を果たすのでしょうか?著者は、明陸科技集団知識工学研究所所長の張潔博士に相談しました。張潔博士はチームを率いて、2020年に「知識グラフの自動構築と産業応用」をテーマに第10回呉文軍人工知能科学技術一等賞を受賞しました。張潔博士はこう語った。

Minglu Technology は過去数年間、独自に開発したナレッジグラフ プラットフォームと事前に構築された業界ソリューションを通じて、政府、公安、銀行、保険、証券、鉄道輸送、電力、製造、統合メディア、食品安全などの分野で 200 社を超える業界の顧客にサービスを提供してきました。

ソーシャルメディアの世論分析シナリオでは、ナレッジグラフに基づいて、ユーザーが生成したコメントを背景の製品ナレッジベースと照合できるため、オペレーターはよりきめ細かい製品機能に関するユーザーの世論の傾向を分析しやすくなり、その結果を BI システムに統合してユーザーの需要の洞察を獲得し、クリエイティブなコンテンツの制作を支援し、何千人ものユーザー向けにパーソナライズされた広告を実現できます。

オフライン小売のシナリオでは、販売員はまずMinglueの電子作業バッジを身に着けて販売プロセスをデジタル化し、次に音声認識技術によって販売会話をテキストに変換し、次に自然言語処理技術を使用してトピックを分類し、トピック転送の確率を計算してトピック転送の知識グラフを形成します。最後に、金メダルの販売員のトピックグラフと比較することで、販売員が注文フローの主なリンクをレビューして分析し、販売トークを改善して注文のコンバージョン率を高めるのに役立ちます。当社が開発したHAOグラフシステムは、音声からリアルタイムにグラフを生成する世界初のエンタープライズレベルのナレッジグラフ開発ツールキットです。

金融リスク管理のシナリオでは、個人の信用顧客は親戚、友人、同僚、保証人などの関係を通じてグラフ化でき、法人顧客は株式、保証、資金関係を通じてグラフ化できます。グラフ表現学習アルゴリズムを使用して顧客をベクトル化します。ベクトルにはグラフの構造情報が含まれており、このベクトルは不正防止モデルや信用スコアリング モデルで使用できます。

産業機器のメンテナンスのシナリオでは、センサーから発せられる障害信号の時系列データから障害の一次関係と二次関係をマイニングし、メンテナンス作業指示書の非構造化テキストから因果関係をマイニングして、メンテナンス知識グラフを徐々に組み立て、メンテナンス作業員にメンテナンスのベストプラクティスを提供します。このシステムを適用した後、車両の故障率は約 50% 減少し、メンテナンスは毎日から 8 日ごとに徐々に変更され、運用上の障害が大幅に減少し、手作業が削減され、メンテナンス効率が向上しました。

ナレッジグラフの未来は明るい

統計データによると、ナレッジグラフは一定の技術的進歩を遂げており、電子商取引、公共安全、医療などの分野で徐々に実装されています。では、ナレッジグラフ分野の現在の開発状況と、ナレッジグラフにはどのような利点があるのでしょうか。ナレッジグラフ技術の今後の発展はどのような技術的課題に直面するでしょうか?これらの質問に答えて、張潔博士は次のように答えました。

ナレッジグラフの開発は、テクノロジーの段階的な成熟とデジタル変革の歴史的傾向の恩恵を受けています。近年、ビッグデータや人工知能技術の急速な発展に伴い、多くの伝統産業が新たなデジタル変革に着手しています。2020年の両会では、デジタル変革が政府活動報告に盛り込まれました。インテリジェンスは、企業のデジタル変革における新たな方向性と新たな段階です。業界では一般的に、インテリジェンスのプロセスは、コンピューティング インテリジェンス、知覚インテリジェンス、認知インテリジェンスの 3 つの段階に分けられると考えています。ナレッジ グラフは、知覚インテリジェンスから認知インテリジェンスへの移行における重要なリンクであると考えられており、広く注目されています。ますます多くの企業や組織がナレッジ グラフを構築し、それをビジネス シナリオと組み合わせて適用しています。1 つは、視覚的な洞察、情報検索、推奨システム、タスク ベースの質疑応答などのより一般的な技術アプリケーションです。もう 1 つは、金融詐欺防止、急速に変化する消費財のマーケティング、産業メンテナンスなどの業界特性を持つソリューション ベースのアプリケーションです。

ナレッジグラフの利点は、主に次の点に反映されます。1) 企業内のデータと大量の外部データを接続します。ナレッジグラフは、データタイプの定義が柔軟で、深いレベルの連想クエリを効率的にサポートできるため、企業データの総量を拡大するとともに、データの利用効率を向上させ、ビッグデータの配当を解放します。2) ビッグデータ技術と人工知能技術を結び付けます。ネットワーク構造、時系列、行動対話などの新しいタイプのデータから高レベルの特徴を処理し、下流のアルゴリズムエンジニアに提供することで、エンジニアが特定のビジネスモデルに集中できるようにします。3)ドメイン知識と常識知識を結び付けます。既存の知識システムを統合、補完、推論することで、知識システムの完全性を向上させ、プロセス最適化、意思決定支援、予測分析などの下流アプリケーションに基本的なサービスを提供できます。

ナレッジグラフ技術は幅広い応用の可能性を秘めていますが、現段階ではまだ多くの技術的課題に直面しています。1) 構築コストの問題。構造化データの場合、複雑なデータガバナンスが必要となり、非構造化データの場合、情報抽出プロセスに多くのラベル付け作業が必要になります。2) 推論精度の問題。ナレッジグラフは検索エンジンやレコメンデーションエンジンの精度を向上させることができますが、その独自の応用価値は、ドメイン知識が不完全でデータの総量が大きい場合に高速かつ正確な推論の問題を解決する必要がある推論質問応答にあります。3) 形式的表現の問題。ナレッジ グラフの価値はその応用にあり、応用の難しさは知識推論にあり、知識推論の難しさは知識表現にあります。既存の技術的成果は、ほとんどが事実知識(know-what)に集中していますが、原理知識(know-why)とスキル知識(know-how)の研究には、数学的基礎とベストプラクティスの参照が欠けています。

一部の業界ではデジタル化のプロセスが遅れており、まずはデータオンライン化とデータ蓄積の問題を解決する必要がある。また、ナレッジグラフ技術を適用する前に、デジタル構築とデジタル管理を文化的に重視する必要がある。今後の変化としては、1) 5G、モノのインターネット、知覚技術が徐々に成熟するにつれて、企業内の非構造化データの割合がますます高くなり、音声、画像、動画などのマルチモーダルデータから知識を共同で抽出する需要がますます高まる、2) 業界のノウハウ知識とノウハウ知識を組み合わせることで、人間と機械のコラボレーションによるインテリジェントな意思決定を促進できる、3) 知識集約型産業の企業は知識資産にますます注目し、文書やデータの管理だけでなく、ナレッジグラフ技術に基づくナレッジミドルプラットフォームを構築し、専門家の経験とデータ駆動型の方法を使用して因果関係を発見し、因果推論を行ってビジネス上の意思決定を支援する、などが挙げられます。

蒸気時代から電気時代、そして21世紀の情報化時代に至るまで、科学技術の発展が時代の進歩を牽引し、人工知能は人類をインテリジェント時代へと導く決定的な力となりつつあります。知覚知能から認知知能への移行における重要なリンクと考えられる技術であるナレッジグラフは、将来、より大きく幅広い応用と開発の余地を持つようになると期待しています。

注記:

【1】:業界特許分析レポート - 人工知能の主要技術(第68巻)

[2]:工業情報化部電子知的財産センターの公式WeChatアカウントの記事:「知識グラフ特許レイアウトはAI産業の競争力の向上を加速する」

<<:  無人バスに乗ってみませんか?テクノロジーは未来を変えることができるでしょうか?

>>:  ナレッジグラフから知識推論まで、AIのホットな話題になるのでしょうか?

ブログ    
ブログ    

推薦する

AIは人間よりはるかに優れています。AIが意識を持つようになったら、人間はAIに取って代わられてしまうのでしょうか?

人工知能は、無意識のうちに私たちの生活にほぼ完全に浸透しているようで、人工知能の知能レベルはますます...

チャットボットのアーキテクチャモデルと応答メカニズムについての簡単な説明

[51CTO.com クイック翻訳] 気付きましたか? 人工知能はもはや、少数のテクノロジー企業の単...

2023年世界AI指数ランキング発表:米国と中国が1位と2位、アジア諸国は好成績

英国のメディア組織Tortoise Mediaは最近、2023年の世界AI指数ランキングを発表しまし...

Alibaba の軽量オープンソース Web サーバー Tengine 負荷分散アルゴリズム

序文Alibaba レイヤー 7 トラフィック エントリ アクセス レイヤー (アプリケーション ゲ...

Nature 誌に「室温超伝導体は科学をどう変えるのか?」という記事が掲載されました。

7月末にLK-99が引き起こした熱狂は、8月中旬には徐々に沈静化しました。いくつかの権威ある組織が...

...

Googleが量子コンピューティングAIラボを発表、今後10年のロードマップを公開

[[425546]]エリック・ルセロ博士最近、Google Quantum AIのチーフエンジニアで...

危険な顔認識:「尊厳を保たなければ」私たちは裸になる

[[276736]] AI顔変換ソフトウェアZAOの人気により、顔データアプリケーションのパンドラの...

清華大学は、2D拡散モデルを使用して不完全な3Dオブジェクトを補完する3D再構築の新しい方法、O²-Reconを提案しました。

コンピューター ビジョンでは、オブジェクト レベルの 3D サーフェス再構築テクノロジは多くの課題に...

胡勇 | 人工知能の時代を生き抜き、成長する

[[374681]]機械との競争から第二次機械革命へ人工知能革命は第四次産業革命と呼ばれています。第...

最も人気のある 5 つの人工知能プログラミング言語の比較。1 つだけでも学ぶ価値があります。

ほとんどのソフトウェア アプリケーション開発と同様に、開発者は複数の言語を使用して AI プロジェク...

「オープン性、透明性、倫理」という目標を達成するために、AIアルゴリズムが政府の規制を策定するために使用される。

ニュージーランド政府は、政府機関がアルゴリズムを使用する方法のガイドとなることを目的とした一連の標準...

APP はユーザーのプライバシーと顔認識生体認証情報を深く掘り下げ、「データ疫病」の到来に注意

315 Gala で摘発された企業は、業界内ではほんの少数派です。ユーザーのプライバシーを侵害するア...

人工知能技術はゴミリサイクルに革命的な変化をもたらすかもしれない

新たな研究によると、最先端の人工知能が英国の廃棄物リサイクル方法に革命をもたらす可能性があるという。...

ロボットが石油・ガス生産をより安全にする方法

石油とガスの生産は世界で最も危険な仕事の一つです。石油掘削、掘削作業、保守テストなどの作業により、毎...