愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

AppleがSiriを発表してから7年、そしてジェフ・ベゾスがスタートレックにインスピレーションを得てAlexaを立ち上げてから3年が経った。

実際、人工知能をベースにしたインタラクティブなインターフェースは数十年前から登場しています。 1966 年、MIT のジョセフ・ワイゼンバウム教授は、今日の会話型 AI の原型として広く認められている ELIZA を発表しました。

数十年後、アンドリュー・レナードは Wired のレポートで、「ロボットは大きな存在になるだろう」と宣言し、そのようなテクノロジーはすぐに「CD の最安値を探したり、母のために花を摘んだり、モザンビークの最新動向をレポートし続けたりするのを手伝ってくれるようになるだろう」と述べた。この記事は 1996 年に発表されたため、使用された例はずっと時代遅れの CD だった。

[[201016]]

現在、Slack、Starbucks、Mastercard、Macy’s などの企業は、顧客サービス、コネクテッド ホーム、オンラインでの花の注文など、さまざまな分野で会話型インターフェースを使用するようになっています。

このテクノロジーの価値や将来性に懐疑的な方は、2019 年の Gartner の予測をご覧ください。市場調査会社は、仮想パーソナル アシスタントが「ユーザーとデバイスのやり取り方法を変え、生活のあらゆる場面に浸透する」と考えています。

すべての会話型 AI が同じように作成されるわけではありませんし、そうあるべきでもありません。会話型 AI には、仮想パーソナル アシスタント (Alexa、Siri、Cortana、Google Home) とプロフェッショナル アシスタント (X.ai、Skipflag) が含まれます。これらは、一連のルール エンジンに基づいて開発することも、機械学習技術を使用することもできます。使用例は、特定の単純なタスク (Taco Bell の TacoBot) から一般的な広範囲のサービス (Alex、Siri、Cortana、Google Home) まで多岐にわたります。

多くの組織は、パートナーが提供するテクノロジーに依存しながら、個人または職場の環境で会話型インターフェースを導入することを検討しています。しかし、テクノロジー以外にも考慮すべき点はまだたくさんあります。これを「ハウツー ガイド」と呼ぶのはまだ早いですが、会話型 AI を試用または導入することを検討する際に組織が考慮すべき事項をいくつか挙げます。

1. 明確な答えがある小さな領域から始める

「それは製品やブランドに関することです」と、Slack の開発者関係担当ディレクターのアミール・シェバト氏は言う。「『ボットを作っている』と考えるのではなく、『どんなサービスを提供するのか』と考えるべきです」

それを超えて、シェバット氏らは、大量のデータで緩和または解決できる困難な問題を探すことが最善の出発点だと主張している。成功するボットはすべて同じことをすべきだと言っているわけではありませんが、重要なのは、明確な答えがある小さな領域から始めて、ユーザーが楽しめるとは思っていないようなエクスペリエンスを設計することです。

2. 目標がインタラクションパターンを決定する

一部の会話は音声によるやり取りに適しています。たとえば、車を運転しているときや、自宅で暖房をつけているときなどです。しかし、銀行残高を尋ねるような状況では、正確な個人情報をテキストで入力する必要があるかもしれません。しかし、ユーザーがボットと対話できるようにする方法は他にもあります。次の図は、成功した相互作用の 2 つの例を示しています。

「ロボットは話したりタイプしたりすることしかできないという誤解をまだ多くの人が抱いている」とマイクロソフトのクリス・マリンズ氏は語った。実際、ロボットはさまざまな方法(または形式)で人々と対話したり、情報を伝達したりできます。

  • 音声(Alexa、Siri、Google Home)
  • タイピング(チャットアプリのボット)
  • キーボードサポートを通じてヒントを提供し、入力オプションを絞り込む
  • 視覚情報を表示するカード

「最も成功するケースでは、これらのモデルのハイブリッドが勝利するでしょう」とマリンズ氏は言います。「音声は、ある場合には最適です。しかし、タイピングは、別の場合には最適です。そして、時にはカードやキーボードのサポートを使用したいこともあります。会話モデルを決定することは、解決するのが非常に難しい問題であり、まだ誰もそれを正しく理解できていません。」

3. 慎重な計画と複数の背景の明確な選択

顧客が小売業者に「近くの店で電動ドリルを見つけられる場所はどこですか?」のような質問をした場合、開発者は顧客の所在地を考慮する必要があります。彼女は店内にいますか? 携帯電話を使用していますか、それとも自宅のコンピューターを使用していますか? 開発者は複数のシナリオとエクスペリエンスを設計する必要があります。

このプロセスは、スコープ設定プロセス中にさまざまなインタラクション モードを想定する必要があるため、困難です。 「人間とのやりとりは非常に複雑で、会話のパターンを判断するのは難しい」とマリンズ氏は語った。最良の結果を達成するには、プロジェクト チームが最初から選択を行う必要があります。

4. 継続的なインタラクションには、コンテキストの継続的な理解が必要です。

「ビヨンセのレモネードを再生して」や「銀行残高を確認して」といった単一のコマンドを理解することは一つのことですが、人間とチャットボット間のやり取りをプログラムすることは別のことです。このため、人間とロボットの間の複数のインタラクション(「ターン」)は非常に複雑で開発が難しく、コンテキストを完全に理解する必要があります。

以下の画像は、単純な支払いのやり取りに内在する複雑さを示す Kasisto の例です。

ラウンド1:

  • ユーザーは Kai (チャットボット) に Emily に 5 ドルを支払うように依頼します。
  • カイは、ユーザーの連絡先リストにエミリーという名前の人が 2 人いることを発見し、どちらのエミリーなのかを尋ねました。

第2ラウンド:

  • ユーザーは話題を変えて、自分の口座にいくらお金が残っているかを尋ねました。
  • カイはそれに応えて、「どこまで話してたっけ?」と言い、エミリーに5ドル払うという当初の話題を続けた。

一見すると、これは非常に単純なやり取りのように見えますが、エンジニアリングの観点からは、コンテキストと言語に対する深い理解が必要です。

  • まず、Kai はユーザーの目的 (この場合は、誰かに支払うこと) を認識して追跡する必要があります。
  • 次に、カイは誰に支払うかを決めなければなりません。ユーザーに Emily という名前の友人が 2 人いることが判明した場合、問い合わせを通じて具体的な支払い対象を決定する必要があります。
  • 3番目に、カイは、独立して現れる「ノイビグ」という単語が、前の会話の内容を指し、エミリー・ノイビグに支払うことを意味することを理解する必要があります。
  • 4 番目に、Kai は「私の口座にはいくらお金がありますか?」という文の意味を解釈し、これが完全に新しい要求であり、前の 2 つのやり取りとは異なることを理解する必要があります。
  • 最後に、この新しい要求に答え、会話を続けて元の要求(エミリーに 5 ドルを支払う)を完了する必要があります。

この会話は、目的の明確化、応答の絞り込み、深い専門知識がすべてチャットボット開発にとって重要である理由を示しています。自然な方法で表現されたユーザーの意図を理解することは複雑ですが、効果的なエクスペリエンスを提供したい場合には重要だからです。

5. EQはIQと同じくらい重要

優れた知性と明確なユーザー意図は、ボットの成功の唯一の要素ではありません。感情を感知し、適切な言葉と口調を選択することも、快適な会話体験を確保するための鍵となります。その結果、多くの研究室やスタートアップ企業が、写真、音声、テキスト、ビデオを通じて感情状態を検出できるソフトウェアを開発しています。 。

SRIインターナショナルの音声技術研究研究所は、音声信号を通じて話者の感情を感知できると主張するSenSay Analyticsプラットフォームを開発した。これは、ユーザーが混乱しているかどうかを把握して、対話できる人間を提供する方法、およびユーザーが受け入れやすいかどうかを把握して、関連するコンテンツを提供する方法です。

6. ブランディングの機会は小さいが効果的

ブランディングはロボットの成功の重要な要素です。ボットの実行が不十分だと評判が損なわれる可能性がありますが、強力なブランドの存在はボットの成功にもつながります。 「会話型インターフェースでブランド化できる機会は比較的少ないと思います」とAdobeのLars Trieloff氏は言う。「ですから、日常的なやりとりでブランドを活用しましょう。1つのことを本当にうまくやり遂げ、まさに顧客が望んでいるものであることを確認してください。」

会話型インターフェースの活用はまだ初期段階にあり、道のりはまだまだ長いです。しかし、会話型 AI、つまり人間と機械のやり取りをよりよく模倣できるプログラムは、今後も存在し続けるでしょう。今は原始的に思えるかもしれませんが、データ サイエンス、自然言語技術、機械学習、その他のテクノロジの進歩により、最終的には、よりスムーズな人間とコンピューターのインタラクションに必要な環境が構築されるでしょう。

会話によるやりとりは、人間同士のやりとりと同等かそれ以上になるでしょうか? やりとりの種類によっては、機械を介して行うことが決して容易ではないかもしれません。しかし、いくつかの用途では、それは可能かもしれません。私たちは多くの革新を目にしてきましたが、それはまだ表面をなぞったに過ぎません。

未来学者でクリエイティブストラテジストのモニカ・ビエルスキテ氏が言うように、確かなことが一つあります。「私たちはスクリーンのない未来に突入しています。」彼女は「将来、全世界が私たちのデスクトップになるだろう」と予測しています。

<<:  2017年世界ロボット会議エクスプレス:無人スーパーマーケットロボットがデビュー

>>:  トラフィックを30%削減し、鮮明度を向上: MITが新しいAIビデオキャッシュアルゴリズムを提案

推薦する

教師なし機械学習は産業オートメーションにどのようなメリットをもたらすのでしょうか?

現代の産業環境にはセンサーやスマート コンポーネントが満載されており、それらすべてが組み合わさって大...

AIはスペインの流行において重要な役割を果たし、新規感染者の死亡率を半減させた。

[[361228]]スペインは、感染者数が170万人を超え、欧州で新型コロナウイルスのパンデミック...

ICLR 2022|スピードこそすべて!完全なバイナリ化 BiBERT による超圧縮

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能が教育改革にどのように貢献しているかをご覧ください

人工知能によってもたらされる将来の教育の変革と発展は、新たな機会を生み出すだけでなく、より大きな課題...

Orange3 の探索: データ マイニングと機械学習の新しい世界を開きます。

Orange3 は、豊富なデータ処理、分析、モデリング機能を提供する強力なオープンソースのデータ視...

GPT-X に基づく製品コピーライティングと画像生成の実践

I. はじめに1. 2022年末に人気が高まったOpenAIとAIGC 2022年はAIの歴史におい...

シングルを保存: このオブジェクトジェネレーターは、将来のオブジェクトがどのように見えるかを確認するのに役立ちます

将来の妻や夫がどんな人か分からないですか?さあ、まずはAIを使って予測してみましょう。 [[3123...

黄仁訓氏の予測: AGI は 5 年以内に実現される可能性があります。米国は中国のニーズを完全に満たして「サプライチェーンの独立」を達成するまでにまだ10年ある

最近、ニューヨークタイムズの年次ディールブックサミットで、黄仁勲氏は、汎用人工知能(AGI)を「かな...

マシンビジョンは人工知能を複数の業界に根付かせる

インターネットと人工知能が2019年全国人民代表大会で最もホットな話題の一つになることは間違いありま...

大規模なモデルを効率的に展開するにはどうすればよいでしょうか? CMU の最新の LLM 推論と MLSys 最適化テクノロジーに関する 10,000 語のレビュー

人工知能(AI)の急速な発展を背景に、大規模言語モデル(LLM)は、言語関連のタスクにおける優れたパ...

医療機器における人工知能:これらは新たな産業アプリケーションです

人工知能により、研究者や製造業者は生活の質を向上させることができます。 [[419960]]人工知能...

「ブラックミラー」に匹敵する-AI技術が母親に亡くなった娘の姿を見せた

現在、外国の科学技術チームがAI技術を利用して、唯一の子供を亡くした母親の長年の願いを叶えた。彼らは...

インテリジェントオートメーションにおける人工知能の重要な役割

パンデミックによる職場の変化により、バックオフィス業務や生産活動を改善できるロボティック・プロセス・...

GenAI 時代の 12 の新しい仕事

GenAI は人間に取って代わるのではなく、熟練労働者、つまり GenAI を管理し最大限に活用する...

脳コンピューターインターフェースの新発見!眠りに落ちた後、脳は起きている時の経験を再生する

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...