音声によるやりとりをより自然にするにはどうすればよいでしょうか?まずはこれら 6 つの重要な知識ポイントをマスターしましょう。

音声によるやりとりをより自然にするにはどうすればよいでしょうか?まずはこれら 6 つの重要な知識ポイントをマスターしましょう。

最近、ロボットに関する非常に良い記事をいくつか読んだので、自分の考えを書き留めながら翻訳してみようと思いました。日々の仕事では、ロボット プラットフォーム、マルチラウンド シナリオ、さまざまなパーサーに没頭しています。さまざまな角度からの刺激が必要であり、新しいアイデアが生まれるかもしれません。

[[284133]]

△ Unsplash の Franck V. による写真

今日の記事は、Anna Prist の Medium の投稿「チャットボットの音声を自然にする方法」です。

まずは、ロボットの会話をデザインする際にアンナさんが挙げた6つのポイントをまとめてみましょう。

  • コンテキスト(ロボットは会話中にコンテキストを理解する必要があります)
  • 個性(ロボットには独自の個性が必要です)
  • 簡潔(ロボットの文言は簡潔かつ明確である必要があります)
  • 柔軟性(ユーザーの表現の多様性を考慮する必要がある)
  • 自然さ(丁寧な表現など、人間の会話における自然な表現の使用)
  • イニシアチブ(会話をリードし、会話を終わらせない)

私たちはテクノロジーの急速な革新に慣れすぎていて、テクノロジーがなければ未来がどうなるか想像もできません。私たちが前進し続けるにつれて、インタラクティブ デバイスとインタラクティブ デザインは常に改善されていきます。これらの小説や映画のおかげで、私たちは機械とやりとりする方法を知っています。トム・クルーズが映画でやったように、音声コマンド、ジェスチャー、仮想スクリーンを使うことができます。

(YouTubeで「マイノリティ・リポートのジェスチャーベースのユーザーインターフェース」と検索すると視聴できます)

日常のやり取りでは、タッチ、音声、ジェスチャーなどのやり取り方法が使用されますが、これらは私たちにとって簡単で、学習する必要はありません。 「自然」という言葉が使われているのは、相互作用が人間の行動の基本的な部分だからです。私たちは生まれて最初の日から、自然に周囲のあらゆるものと関わり、物を掴んだり動かしたり、話したりコミュニケーションをとったりしようとします。これらのインタラクション方法は、人間とコンピュータのインタラクションにも自然に反映されます。

マイクロソフトの主席研究員であるビル・バクストン氏はかつて、音声ユーザーインターフェースは、特に車の運転時には最も自然なユーザーインターフェースかもしれないと述べました。当然ですが、ハンドルに手を置き、前方の道路に注意を払っているときです。音を通じて大量の情報を伝達することができ、これが現在の状況で最も効果的なコミュニケーション(インタラクション)方法となります。技術の進歩により、私たちは機械とコミュニケーションをとり、対話することが可能になりました。

音声は人間に共通するスキルなので、ユーザーがすでに音声を習得していると想定できます。 VUI 開発者にとっての次の課題は、会話/スキル/動作を作成し、チャットボット/仮想アシスタントがコミュニケーションして役立つようにトレーニングすることです。

この課題は非常に困難です。なぜなら、機械が人間の意図を理解するには、会話の文脈にも接続して理解する必要があるからです。自然に聞こえるためには、個性なども必要です。以下に、チャットボットや仮想アシスタントを作成するために使用できるヒントをいくつか示します。

コンテクスト

人間は文脈をとても自然に使うので、それについて考える必要すらありません。私たちは、さまざまな場所で、さまざまな人々やさまざまな方法でコミュニケーションをとる方法を自然に知ることができます。私たちは、子ども、両親、友人、同僚と話すときには、それぞれ異なる口調やアプローチを使います。私たちは、家では大声で率直に話すことができますが、公共の場では外見を保ち、口調や言葉遣いに注意します。

チャットボットや仮想アシスタントには、このような状況に関する知識や認識がありません。これが、この「コンテキスト」について言及する理由です。ユーザーのクエリ記録/回答、ユーザーの承認後に取得された情報、ユーザーが表現した情報などの基本的なデータ情報。ロボットがすでに知っていることについて質問したり、経験豊富なユーザーに初心者向けのガイダンスを提供し続けたりしないでください。

人格

チャットボットや仮想アシスタントに個性があると、自然に聞こえます。たとえば、Alexa は非常に興味深く、さまざまなことについて独自の意見を持っています。さらに、国によってその見解や好みは異なる場合があります。たとえば、アメリカで「どんなビールが好きか」と尋ねるのと、ドイツで尋ねるのでは違います。 Amazon の開発者が Alexa の開発に着手したとき、彼らが望んだのは、Alexa が感情のない機械のように聞こえないようにすることだけでした。しかし、こんなに多くの人がアレクサの性格に夢中になるとは思っていませんでした。 Alexa は、その個性により、ユーザーとのやり取りにおける信頼も高めます。この原則により、応答を自動的に生成する機能が多少制限されますが、ユーザー エクスペリエンスにとって重要です。

簡潔

単語が短いと認知負荷が軽減され、時間が節約され、より自然に聞こえます。ユーザーがすでに知っている事実や指示を省略し、本当に重要な情報を提示するためにテキストを短くします。ロボットにディスプレイがある場合は、画面に情報を表示して要約したり非表示にしたりすることもできます。

柔軟性

会話中にユーザーがいつでも情報を変更することを想定する必要があります。ユーザーもさまざまな方法で質問に答えます。

自然

ロボットの会話は、繰り返しや官語を避け、自然なものでなければなりません。暗黙的な確認とアクティブな監視テクニックを可能な限り使用して、取得した重要な情報とコンテンツをユーザーに伝えます。また、「さようなら」「ありがとう」「お願いします」などの丁寧な表現も忘れないでください。

積極的

ユーザーが次に何をすべきかわからない状況を回避するには、監視ダイアログ ボックスで抜け道 (次のステップ) を考慮する必要があります。たとえば、質問や誘導サインを通じて会話を進めたり、関連するボタンの説明を提供したりします。

会話の設計は技術開発のレベルによって制限されますが、これらのテクニックを使用すると、ある程度会話を簡単かつ自然にすることができます。この分野はまだ比較的新しいため、私たちは皆、試行錯誤から学ぶ必要があります。そのため、間違いを恐れないでください。

覚えておいてください、良い会話は自然な会話です。

上記は翻訳内容です

他の

次に、さらにいくつかの点についてお話ししたいと思います。

ロボットの性格について

ロボットと会話する場合、一般的には、オープンドメイン チャット、タスク主導の会話、質疑応答 (FAQ)、推奨の 4 種類の会話が行われます。

しかし、多くの場合、これらの異なるタイプのサポートは異なるチームから提供されます。それぞれのチームがロボットに異なる機能を与えました。このロボットがユーザーと会話をすると、ユーザーは明らかに不自然に感じるでしょう。ちょっと考えてみましょう。友達とチャットしているときに、相手が突然友達の彼氏/彼女になって、タイピングしたり話したりし始めたら、たいていはそれを感じます。

柔軟性について

人間の言語表現は実に柔軟で豊かです。同じ単語でも、文脈や語調によって意味が異なります。そのため、ロボットが人間の言語を理解するのは非常に困難です。

シーンについて

同じ機能であっても、シナリオが異なれば人間には異なる要件があります。たとえば、最近私が Tmall Genie とやり取りしたときに感じたことはこれです。

時々、午前 2 時頃など遅く寝ることがあります。その場合は、「Tmall Genie、午前 8 時にアラームを設定して」と言います。すると、Tmall Genie が元の音量で応答します。はい、日中に楽しく大音量で音楽を聴いていたら、Tmall Genie の非常に大きな声に怖がっていたでしょう (私は何度も怖がったことがあります)。

それで、私は音量をどんどん下げていきました。ところが、朝7時59分頃、突然Tmall Genieが「アラームが鳴ります」と普通の音量で(すでに音量を下げていたにもかかわらず)言ったので、この文章で突然目が覚めてしまいました...

そのため、アラームの設定などの機能については、さまざまなシナリオでより自然で、配慮があり、スマートなものになることを願っています。

さて、今日はここまでです。

<<:  アヴネットは18年連続で「トップ10ベスト国際ブランドディストリビューター」の称号を獲得しました。

>>:  2020年職場のAIスキルランキング:TensorFlowが人気上昇、Pythonが最も人気、マーケティング部門も学習中

ブログ    
ブログ    
ブログ    

推薦する

上海交通大学卒業生によるソロ作品! 50年間のゼロ進歩アルゴリズム問題が解決された

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Python 向けトップ 3 機械学習ライブラリ

[51CTO.com クイック翻訳] 難しいデータサイエンスを習得しなくても、機械学習の世界で成功で...

機械学習、データサイエンス、人工知能、ディープラーニング、統計の違いを理解する

この記事では、データ サイエンティスト兼アナリストの Vincent Granville が、データ...

...

...

...

2020 年の予測: 今年はサイバー犯罪サービスが普及する年になるか?

業界メディアeWEEKの2020年の予測:人工知能と機械学習の「中毒」についての予測も見られ、これが...

Zhiyuan が世界最大の中国語と英語のベクトルモデルトレーニングデータセットをリリースしました。最大3億のテキストペアまで拡張可能

9月15日、北京人工知能産業サミットおよび中関村科学城科学技術イノベーションコンテスト授賞式において...

AIがクラウドコンピューティングを再定義し、ビジネス効率を向上させる方法

長年にわたり、クラウド コンピューティングは現代のビジネスに欠かせないツールとなり、2020 年には...

...

スマートインフラがコミュニティを良くする5つの方法

フロスト&サリバンによる最近の分析によると、スマートシティ技術への世界的な投資は2025年までに22...

AIが再び人間に勝つ:たった1枚の自撮り写真から人の性格を判別

[[327813]]新たな研究によると、人工知能(AI)は、自撮り写真だけに基づいて人の性格を識別す...

...