ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

[[200112]]

編集者注: チャットボットは目新しいものではありません。Facebook や Microsoft などの多くの主要プラットフォームには独自のチャットボットがあります。しかし、チャットボットの開発はボトルネックに遭遇したようです。この記事の著者である Riza C. Berkan 博士は、チャットボット分野で直面している問題を技術的な観点から解決する方法について論じています。

会話型AI(チャットボット)には、(1)言語スキル(2)知識獲得(3)会話行動という3つの側面の問題が関係しています。 これら 3 つは強く相関していますが、人間の脳は、別々の実験や異なる期間でこれらの利点を得るために異なる神経領域を使用する可能性があります。 したがって、プロセス全体のコンピュータ モデルを開発するには、個別の処理と分散アプローチも必要になります。

ディープラーニングは、機能すると思われるモデルを提供します。 ただし、多数のデータ要件に対応するために、すべてのデータを単一のスキーマに統合します。 これは、読書による学習方法とも矛盾しています。ディープラーニングとは異なり、新しい記事を読むたびに言語スキルを再学習するわけではありません。言語と知識を別々に扱い、後者が前者と混ざることなく成長できるようにすることは可能でしょうか? もし可能であれば、この半独立性をどのようにシミュレートできるでしょうか?

Deep Cloning Method (DCM) という新しい手法を紹介します。 これらの技術的な詳細は独自のもの(特許出願中)ですが、このアプローチには実験する価値のある他の多くのバリエーションが存在する可能性があります。

ディープクローン

DCM は、会話型 AI 専用に設計された新しい機械学習手法です。 「ディープ」という用語は、その多層構造のアーキテクチャに由来しています。 「クローニング」という用語は、知識を元のドメインから会話システムに転送すること(ドキュメントをチャットのトランスクリプトに変換すること)を指します。 DCMは(1)言語能力と(2)知識獲得を分離しますが、(3)会話行動を別々に扱うことはありません。 DCM は人間の脳の読み取りプロセスにヒントを得たもので、学習は言語実験 (教師あり) ではなく、直接読み取り (教師なし) を通じて行われます。 DCM は、与えられたコンテンツを文ごとに処理し、各文を概念に分解し、大規模なネットワークを通じてこれらの概念が互いにどのように関連しているかを学習します。 いくつかのサンプル チャットボットはこのアプローチを使用して開発されており、編集を通じてのみ DCM が読み取れるコンテンツを入力できます。 ディープクローニングとディープラーニングの比較は次のとおりです。

神経構造

DCM の核となる革新は、人工言語ニューロンの概念です。 このアイデアは生物学からヒントを得たもので、脳の特定の領域には、他の領域が画像や他の感覚に敏感であるのと同様に、言語入力に敏感なニューロンが含まれていることが知られています。 さらに、言語に敏感なニューロンも、言語の役割と互換性のある異なる構造を持つ可能性があります。

一方、ディープラーニングではどのアプリケーションでも同じニューロンが使用され、典型的なニューロンを下の図に示します。さまざまなネットワークのニューロン モデルにはバリエーションがありますが、いずれも自然言語処理に関係する特定の役割とは関係がありません。 これらのニューロンには、入力層から伝播されるデジタル入力が必要です。 したがって、この操作が適切に機能するためには自然言語を数値に変換する必要があり、このアプローチによっては、この変換が無意味になる可能性があります。

DCM では、分解プロセスを通じて 6 つの異なるニューロン タイプが識別されました。 黒いニューロンはコンテンツ(文章)を表し、赤いニューロンはイベントの概念を表し、青いニューロンはオブジェクト(会話のトピック)を表します。緑色のニューロンは各文の種類(次元)を表し、最終的には黒色のニューロンが質問に答えるのに役立ちます。

ネットワーク構造

DCM ネットワークは、各文を読み取り、特定のルールセットに従って接続を行うことで成長します。 最初のルールは、類似したニューロンの接続を繰り返すことです。 このルールの唯一の例外は、コンテンツ トラッキングに従う黒ニューロンです。 2 番目のルールは、イベントとオブジェクトの接続 (赤から青) です。 ネットワークの成長は、システムによって読み取られるコンテンツの量に正比例します。

全体を読んだ後、最終的なネットワークは複数のレイヤー、複数のネットワーク (高速道路と呼ばれる) になります。 基本的に主要な高速道路は 4 つあります (黒、赤、青、オレンジ)。 最終的なネットワークはさらに処理され、繰り返されるニューロンが個々のニューロンに圧縮されました。 この最終プロセスでは、各イベント コンセプトが多数の機器に接続されたイベント ベースのオントロジーが生成されます。 リコールプロセスでは、特定の質問 (または文) に最も一致する概念を見つけるために 4 つの高速道路を通過する必要があります。推論を通じて質問の答えとして最後の黒いニューロンを見つけます。

要約する

ディープラーニングとディープクローニングの比較は次のとおりです。

  • ディープラーニングには、オントロジー処理を必要とする個別のステップに分解されないという利点があります。
  • ディープクローニングは分解プロセスの品質に依存します。
  • ディープクローニングには、データサイズが小さく、単一ステップで収束できるという利点があります。
  • ディープラーニングはブラックボックスですが、ディープクローニングは透過的で即座に変更できます。

ディープクローニングに必要なデータはコンテンツ知識のみですが、ディープラーニングでは言語検出と長いトレーニングサイクルのために大量のデータが必要になる場合があります。

<<:  フロントエンドの面接でよく聞かれるアルゴリズムに関する質問

>>:  テックネオテクノロジーサロ​​ン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究

ブログ    
ブログ    
ブログ    

推薦する

人工知能が爆発的に進化しています。この「鉄の飯碗」を手に入れるための新しいガイドをぜひ保存してください!

近年の人工知能の発展スピードは驚異的で、あらゆる分野で専門的なAIが登場しています。上海では以前、無...

...

JavaScript チュートリアル: Web アプリケーションに顔検出機能を追加する

[51CTO.com クイック翻訳] 先週、annyang を使用してマップ インターフェースに音声...

企業がAI対応データベースを使用してAI導入を加速する方法

今日、企業や IT プロフェッショナルは、これまで以上にデータベースに高い期待を寄せています。データ...

重力波検出からRNAシークエンシングまで、AIが科学的発見を加速させる方法

[[433235]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

LLMLingua: LlamaIndex を統合してプロンプトを圧縮し、大規模な言語モデルに効率的な推論を提供します。

大規模言語モデル (LLM) の出現により、複数の分野でイノベーションが促進されました。しかし、思考...

AIが「ツール人」を救う: RPA+AIがすべてを自動化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

PaddlePaddle と TensorFlow の比較分析

この記事では主に、フレームワークの概要、システム アーキテクチャ、プログラミング モデル、分散アーキ...

説明可能なAIと説明可能な機械学習:ブラックボックスに光を当てる

人工知能(AI)や機械学習の分野では、「ブラックボックス」という概念が常に大きな注目を集めています。...

不正行為防止スパムテキスト認識のためのZhihuのディープラーニング実践の詳細な説明

背景今年8月時点で、知乎の登録ユーザー数は2億人を突破した。私たちはスパムの管理において、より大きな...

...

人工知能はプログラムを記述するためにコードを「盗む」ほど賢いが、プログラマーは職を失うことを心配する必要はない

人工知能システムはますます賢くなってきています。囲碁をしたり株を取引したりできるだけでなく、今ではコ...

...

...