会話型ロボットと聞くと、私と同じように、SiriやAlexaとの会話をすぐに思い浮かべますか?時には笑ったり泣いたりすることもあるかもしれませんが、私たちの生活に大きな利便性をもたらしてくれることは間違いありません。しかし、このような会話型 AI をトレーニングする際の難しさは、高品質の会話データをどのように取得するかにあります。これまでは、トレーニングデータとして大量の人間の会話を収集する必要があり、時間と労力がかかっていました。それで、もっと良い方法はあるのでしょうか? 昨年読んだ、対話補完ソリューションを紹介した非常に興味深い論文を突然思い出しました。今日は、通常の文書をチャット記録に変換するのに役立つ、会話完了というまったく新しい方法を紹介します。この革新的なテクノロジーを探り、それがどのように境界を打ち破り、あらゆる文書を「話す」ことを可能にするのかを見てみましょう。 まず、「インペインティング」という用語について見てみましょう。これは実際には画像処理から借用されたもので、その本来の意味は、周囲のピクセル情報を使用して、画像の欠落部分や破損部分を補完することです。本稿では、既存の会話内容を利用して会話の欠落部分を推測し補完するものとして理解することができます。それは、私たちが絵画を見るとき、欠けている部分があれば、その部分がどう見えるかを想像して、絵画をより完成度の高いものにするのと同じです。ダイアログ補完でも同じことを行います。既存のダイアログ コンテンツを使用して、欠落している部分を推測し、会話全体をよりスムーズで完全なものにします。 この論文に何が書いてあるか見てみましょう。 導入会話型ロボットのトレーニングには、大量の高品質な会話が必要ですが、そのようなデータを見つけるのは困難な場合がよくあります。そこで、論文の著者らは、普通の記事を私たちの日常のチャットのような対話に適応させる「対話補完」と呼ばれる新しい手法を考案した。このようにして、多種多様な記事から大量の会話コンテンツをキャプチャできます。具体的には、記事内のすべての文が人の発言とみなされ、ロボットは他の人の答えや質問を推測する必要があります。 トレーニング部分ダイアログ補完(インペインティング)では、エンコーダー/デコーダー モデルである T5 と呼ばれる生成モデルが使用されます。このモデルのトレーニング方法は、これまでに見てきた BERT モデルと多少似ていますが、重要な違いが 1 つあります。BERT は文中の個々の単語をマスクしてモデルをトレーニングしますが、ここでは音声全体をマスクしてモデルをトレーニングします。 たとえば、次の会話を考えてみましょう。
対話完了タスクでは、次のように完全な発話が不明瞭になることがあります。
モデルのタスクは、欠落している発話(この場合は、「私は元気です、ありがとう。あなたはどうですか?」)を予測することです。トレーニングに使用される損失関数は、部分的な対話を与えられた場合に元の発話の負の対数確率を最小化することを目的としています。 推論段階推論フェーズでは、トレーニングされた補完モデルを使用して記事を会話に変換します。次のような記事があるとします。 この記事は、仮想的な会話の中で著者が述べた一連の発言として解釈されます。会話は最初次のようになります。
疑問符は会話の欠落部分を表します。これらの欠落部分を埋めることが会話完了モデル設計の目的です。対話補完モデルを使用した後、会話は次のようになります。
記事と対話の例 別の記事を見てみましょう: 対話補完モデルを使用した後、会話は次のようになります。
要約する「会話補完」はチャット履歴の空白部分を埋めるようなものです。普通の記事を人々の日常会話のようなチャット記録に変換するのに役立ちます。これは、豊富で現実的な会話コンテンツを多数提供するため、チャットボットをトレーニングするのに最適な方法です。したがって、この技術はチャットボットの開発に大いに役立つ可能性があります。 |
<<: TSの父による新しいプロジェクトTypechatはフロントエンドの未来を告げる
>>: スマートフォンアプリケーションにおける人工知能の役割
人工知能の応用は、予想外の場所に現れるかもしれません。人工知能ソフトウェアの市場にいる場合、自社製品...
AGI からどれくらい離れているのでしょうか? ChatGPTによって引き起こされた新たなAI爆発...
[[158318]]ほぼすべてのトップクラスのインターネット企業やソフトウェア企業は、ソフトウェアエ...
百度は第1回デジタルチャイナサミットで、中国の商用グレードの無人バス「アポロ」の試乗を一般公開すると...
近年、コア技術の継続的な進歩と市場需要の継続的な解放により、ドローン産業は急速に発展しています。アプ...
人工知能 (AI) や機械学習 (ML) プロジェクトを適用する組織が増えるにつれて、これらのプロジ...
機械学習は複雑な分野ですが、データの取得、モデルのトレーニング、予測の提供、将来の結果の改善のプロセ...
今日のさまざまな業界における人工知能の影響を見てみましょう。 [[421328]] 1. 自動車産業...
翻訳者 |ブガッティレビュー | Chonglouこの革命の中心にあるのは、ベクター データベースの...
近年、都市部の駐車場の問題はますます顕著になっており、混乱した駐車が頻繁に発生し、人々の移動や生活に...
12月7日から8日にかけて、中華人民共和国教育部、中国ユネスコ国家委員会、ユネスコの共催による「20...
実践により、人工知能 (AI) が適切に導入されなければ多くのリスクをもたらすことがわかっているため...
事件は解決しました!先週、Redditは、匿名の企業が同社のユーザーコンテンツにアクセスしてAIモデ...