編集者注: チャットボットは目新しいものではありません。Facebook や Microsoft などの多くの主要プラットフォームには独自のチャットボットがあります。しかし、チャットボットの開発はボトルネックに遭遇したようです。この記事の著者である Riza C. Berkan 博士は、チャットボット分野で直面している問題を技術的な観点から解決する方法について論じています。 会話型AI(チャットボット)には、(1)言語スキル(2)知識獲得(3)会話行動という3つの側面の問題が関係しています。 これら 3 つは強く相関していますが、人間の脳は、別々の実験や異なる期間でこれらの利点を得るために異なる神経領域を使用する可能性があります。 したがって、プロセス全体のコンピュータ モデルを開発するには、個別の処理と分散アプローチも必要になります。 ディープラーニングは、機能すると思われるモデルを提供します。 ただし、多数のデータ要件に対応するために、すべてのデータを単一のスキーマに統合します。 これは、読書による学習方法とも矛盾しています。ディープラーニングとは異なり、新しい記事を読むたびに言語スキルを再学習するわけではありません。言語と知識を別々に扱い、後者が前者と混ざることなく成長できるようにすることは可能でしょうか? もし可能であれば、この半独立性をどのようにシミュレートできるでしょうか? Deep Cloning Method (DCM) という新しい手法を紹介します。 これらの技術的な詳細は独自のもの(特許出願中)ですが、このアプローチには実験する価値のある他の多くのバリエーションが存在する可能性があります。 ディープクローン DCM は、会話型 AI 専用に設計された新しい機械学習手法です。 「ディープ」という用語は、その多層構造のアーキテクチャに由来しています。 「クローニング」という用語は、知識を元のドメインから会話システムに転送すること(ドキュメントをチャットのトランスクリプトに変換すること)を指します。 DCMは(1)言語能力と(2)知識獲得を分離しますが、(3)会話行動を別々に扱うことはありません。 DCM は人間の脳の読み取りプロセスにヒントを得たもので、学習は言語実験 (教師あり) ではなく、直接読み取り (教師なし) を通じて行われます。 DCM は、与えられたコンテンツを文ごとに処理し、各文を概念に分解し、大規模なネットワークを通じてこれらの概念が互いにどのように関連しているかを学習します。 いくつかのサンプル チャットボットはこのアプローチを使用して開発されており、編集を通じてのみ DCM が読み取れるコンテンツを入力できます。 ディープクローニングとディープラーニングの比較は次のとおりです。 神経構造 DCM の核となる革新は、人工言語ニューロンの概念です。 このアイデアは生物学からヒントを得たもので、脳の特定の領域には、他の領域が画像や他の感覚に敏感であるのと同様に、言語入力に敏感なニューロンが含まれていることが知られています。 さらに、言語に敏感なニューロンも、言語の役割と互換性のある異なる構造を持つ可能性があります。 一方、ディープラーニングではどのアプリケーションでも同じニューロンが使用され、典型的なニューロンを下の図に示します。さまざまなネットワークのニューロン モデルにはバリエーションがありますが、いずれも自然言語処理に関係する特定の役割とは関係がありません。 これらのニューロンには、入力層から伝播されるデジタル入力が必要です。 したがって、この操作が適切に機能するためには自然言語を数値に変換する必要があり、このアプローチによっては、この変換が無意味になる可能性があります。 DCM では、分解プロセスを通じて 6 つの異なるニューロン タイプが識別されました。 黒いニューロンはコンテンツ(文章)を表し、赤いニューロンはイベントの概念を表し、青いニューロンはオブジェクト(会話のトピック)を表します。緑色のニューロンは各文の種類(次元)を表し、最終的には黒色のニューロンが質問に答えるのに役立ちます。 ネットワーク構造 DCM ネットワークは、各文を読み取り、特定のルールセットに従って接続を行うことで成長します。 最初のルールは、類似したニューロンの接続を繰り返すことです。 このルールの唯一の例外は、コンテンツ トラッキングに従う黒ニューロンです。 2 番目のルールは、イベントとオブジェクトの接続 (赤から青) です。 ネットワークの成長は、システムによって読み取られるコンテンツの量に正比例します。 全体を読んだ後、最終的なネットワークは複数のレイヤー、複数のネットワーク (高速道路と呼ばれる) になります。 基本的に主要な高速道路は 4 つあります (黒、赤、青、オレンジ)。 最終的なネットワークはさらに処理され、繰り返されるニューロンが個々のニューロンに圧縮されました。 この最終プロセスでは、各イベント コンセプトが多数の機器に接続されたイベント ベースのオントロジーが生成されます。 リコールプロセスでは、特定の質問 (または文) に最も一致する概念を見つけるために 4 つの高速道路を通過する必要があります。推論を通じて質問の答えとして最後の黒いニューロンを見つけます。 要約する ディープラーニングとディープクローニングの比較は次のとおりです。
ディープクローニングに必要なデータはコンテンツ知識のみですが、ディープラーニングでは言語検出と長いトレーニングサイクルのために大量のデータが必要になる場合があります。 |
<<: フロントエンドの面接でよく聞かれるアルゴリズムに関する質問
>>: テックネオテクノロジーサロン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究
顔認識監視会社Clearview AIは、裁判所との和解により、ほとんどの民間企業による同社のサービ...
人工知能と新型コロナウイルスには共通点がないように思えますが、本質的には同じものです。 [[4391...
現代速報(記者:季宇江南)未成年者がオンラインゲームに依存しないようにするため、依存防止制度が生まれ...
新たな医学研究から宇宙の新たな理解まで、新しいモデルは科学界に衝撃を与えました。世界中のほとんどの人...
[[318438]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
1. 要件の説明Linux システムのソース ディレクトリには、同じサフィックスを持つファイルがいく...
2024 年に向けて、業界では建物の管理と保守の方法に影響を与えるいくつかの刺激的な変化が起こるでし...
JLLの新しいグローバルデータセンター展望によると、クラウドコンピューティングと人工知能(AI)の大...
私たちは、アルゴリズムの時間計算量や空間計算量についてよく考えます。時間や空間が十分にある場合、その...
翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟ディープラーニング モデルの初期の成功は、大量のメモリと ...
大規模な自然言語処理モデル(ChatGPT など)の急速な発展により、AI ツールは現在、調査、電子...
1 ニューラルネットワークにはさまざまな問題がある従来のプログラムには、よく知られたエラー、抜け穴、...