ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

[[200112]]

編集者注: チャットボットは目新しいものではありません。Facebook や Microsoft などの多くの主要プラットフォームには独自のチャットボットがあります。しかし、チャットボットの開発はボトルネックに遭遇したようです。この記事の著者である Riza C. Berkan 博士は、チャットボット分野で直面している問題を技術的な観点から解決する方法について論じています。

会話型AI（チャットボット）には、（1）言語スキル（2）知識獲得（3）会話行動という3つの側面の問題が関係しています。これら 3 つは強く相関していますが、人間の脳は、別々の実験や異なる期間でこれらの利点を得るために異なる神経領域を使用する可能性があります。したがって、プロセス全体のコンピュータモデルを開発するには、個別の処理と分散アプローチも必要になります。

ディープラーニングは、機能すると思われるモデルを提供します。ただし、多数のデータ要件に対応するために、すべてのデータを単一のスキーマに統合します。これは、読書による学習方法とも矛盾しています。ディープラーニングとは異なり、新しい記事を読むたびに言語スキルを再学習するわけではありません。言語と知識を別々に扱い、後者が前者と混ざることなく成長できるようにすることは可能でしょうか? もし可能であれば、この半独立性をどのようにシミュレートできるでしょうか?

Deep Cloning Method (DCM) という新しい手法を紹介します。これらの技術的な詳細は独自のもの（特許出願中）ですが、このアプローチには実験する価値のある他の多くのバリエーションが存在する可能性があります。

ディープクローン

DCM は、会話型 AI 専用に設計された新しい機械学習手法です。「ディープ」という用語は、その多層構造のアーキテクチャに由来しています。「クローニング」という用語は、知識を元のドメインから会話システムに転送すること（ドキュメントをチャットのトランスクリプトに変換すること）を指します。 DCMは（1）言語能力と（2）知識獲得を分離しますが、（3）会話行動を別々に扱うことはありません。 DCM は人間の脳の読み取りプロセスにヒントを得たもので、学習は言語実験 (教師あり) ではなく、直接読み取り (教師なし) を通じて行われます。 DCM は、与えられたコンテンツを文ごとに処理し、各文を概念に分解し、大規模なネットワークを通じてこれらの概念が互いにどのように関連しているかを学習します。いくつかのサンプルチャットボットはこのアプローチを使用して開発されており、編集を通じてのみ DCM が読み取れるコンテンツを入力できます。ディープクローニングとディープラーニングの比較は次のとおりです。

神経構造

DCM の核となる革新は、人工言語ニューロンの概念です。このアイデアは生物学からヒントを得たもので、脳の特定の領域には、他の領域が画像や他の感覚に敏感であるのと同様に、言語入力に敏感なニューロンが含まれていることが知られています。さらに、言語に敏感なニューロンも、言語の役割と互換性のある異なる構造を持つ可能性があります。

一方、ディープラーニングではどのアプリケーションでも同じニューロンが使用され、典型的なニューロンを下の図に示します。さまざまなネットワークのニューロンモデルにはバリエーションがありますが、いずれも自然言語処理に関係する特定の役割とは関係がありません。これらのニューロンには、入力層から伝播されるデジタル入力が必要です。したがって、この操作が適切に機能するためには自然言語を数値に変換する必要があり、このアプローチによっては、この変換が無意味になる可能性があります。

DCM では、分解プロセスを通じて 6 つの異なるニューロンタイプが識別されました。黒いニューロンはコンテンツ（文章）を表し、赤いニューロンはイベントの概念を表し、青いニューロンはオブジェクト（会話のトピック）を表します。緑色のニューロンは各文の種類（次元）を表し、最終的には黒色のニューロンが質問に答えるのに役立ちます。

ネットワーク構造

DCM ネットワークは、各文を読み取り、特定のルールセットに従って接続を行うことで成長します。最初のルールは、類似したニューロンの接続を繰り返すことです。このルールの唯一の例外は、コンテンツトラッキングに従う黒ニューロンです。 2 番目のルールは、イベントとオブジェクトの接続 (赤から青) です。ネットワークの成長は、システムによって読み取られるコンテンツの量に正比例します。

全体を読んだ後、最終的なネットワークは複数のレイヤー、複数のネットワーク (高速道路と呼ばれる) になります。基本的に主要な高速道路は 4 つあります (黒、赤、青、オレンジ)。最終的なネットワークはさらに処理され、繰り返されるニューロンが個々のニューロンに圧縮されました。この最終プロセスでは、各イベントコンセプトが多数の機器に接続されたイベントベースのオントロジーが生成されます。リコールプロセスでは、特定の質問 (または文) に最も一致する概念を見つけるために 4 つの高速道路を通過する必要があります。推論を通じて質問の答えとして最後の黒いニューロンを見つけます。

要約する

ディープラーニングとディープクローニングの比較は次のとおりです。