人工知能教師向けの類似質問の作成

人工知能教師向けの類似質問の作成

類似の質問とは何ですか? また、なぜ類似の質問を書く必要があるのですか?

類似質問はロボット教育を改善するための手段です。類似質問は、元のコーパスと同様に、ロボット学習の対象であり、モデルトレーニングの材料を提供します。

[[442545]]

類似の質問は、ユーザー ログ、業界データの再利用、インターネットからのクロール関連の質問だけではロボットのトレーニングを完了できない場合に使用する最も基本的かつ最も厳しい手段です。

つまり、元のコーパスのアーカイブ化が完了すると、顧客から尋ねられた元の質問と、対応するシナリオに分類された対応する回答を取得できるようになります。しかし、実際のトレーニングプロセスでは、特定のタイプのシナリオが元のコーパスでカバーされていないことが判明する場合があります。このとき、これまでのサービス経験とビジネスシナリオに基づいて、これらの不足しているシナリオのコーパスの質問と回答のペアを補足する必要があります。

欠落しているシナリオコーパスの質問と回答のペアを補足する場合は、次の原則に注意する必要があります。

  • 実際のビジネスシナリオと組み合わせる必要があります。
  • ユーザーの考えに合わせて補足する必要があります。

ビジネスシナリオを単に要約するだけでは十分ではありません。たとえば、返品シナリオには音声チャットがないため、「返品処理」ではなく、「返品するにはどうすればよいですか?」「商品を返品するにはどうすればよいですか?」「商品を返品したいのですが、どうすればよいですか?」などのユーザーフレンドリーな質問方法で記述する必要があります。

ロボットの正しい動作ロジックは、顧客からのさまざまな質問を一般的な標準的な質問に一致させることです。したがって、アーカイブされたコーパスの標準化は、本質的には、クライアントの元のコーパスを標準コーパスに変換するプロセスです。

類似の質問を書く利点は次のとおりです。

  • 操作は簡単で、製品システムで編集および追加して送信するか、EXCEL を使用して一括操作およびインポートするだけです。
  • すぐに機能します。ロングテールの FAQ の質問を教育するために同様の質問を手動で作成すると、ロボットがすぐに包括的な教育レベルに到達できるようになります。

もちろん、同様の質問の書き方には次のような欠点もあります。

  • 作業負荷が大きい。一般的に、オンラインビジネス向けの FAQ は数百、数千あり、そのほとんどはロングテールの質問です。これらすべてを手動で類似の質問を追加して学習させると、作業負荷が膨大になります。
  • 制限: 類似の質問の書き方は人によって異なります。同じ FAQ に対して、人によって異なる類似の質問を思いつく場合があります。一般的に、手動で作成された類似の質問では、実際のユーザーの無限の質問をカバーすることはできません。

したがって、類似の質問をより適切に記述し、効率を向上させるために、類似の質問は次の原則と仕様に従うことができます。

1. 質問と回答のペアの意味に基づいて、この知識ポイントに関する顧客の相談をシミュレートし、この知識ポイントを使用して同様の文章で尋ねられた質問に回答します。

たとえば、会社の給与水準はいくらですか?

シミュレーションユーザーは、「御社の給与はいくらですか?」や「御社の福利厚生は何ですか?」などの質問をすることができます。

2. 口語的な言葉を使い、固定されたテンプレートの使用は避けてください。

たとえば、会社の給与水準はいくらですか?

口頭での質問としては、「採用活動をしていると聞きましたが、給与は高いですか?」などがあります。

3. キーワードは異なる方法で尋ねる必要があり(一般的に、文中の内容語の意味は機能語の意味よりも大きく、n,v >> adj >> adv >> 様相助詞)、尋ね方を変えながら文の構造を変える必要があります。

たとえば、会社の給与水準はいくらですか?

この質問と回答のキーワードは「給与」と「レベル」です。キーワードは「御社の福利厚生はどのようなものですか?」や「給与状況について知りたいです」などに変更することができます。

4. 意味が類似する 2 つの質問と回答のペアについては、類似の質問を追加するときに、区別する特徴語を強調するように注意する必要があります。

例: モバイルバンキングを使用して送金する方法と、公式ウェブサイトで送金する方法

「モバイル バンキング」と「公式 Web サイト」は、これら 2 つの質問と回答のペアを意味的に区別する特徴であり、データを書き込むときに強調する必要があります。

5. 回答を使用して知識ポイントの理解に役立て、同様の異なる質問をすることはできますが、回答のみに基づいて質問を作成し、標準的な質問の意味から逸脱することはできません。

たとえば、報告電話番号は何ですか? 回答: 報告ホットライン: XXXXX。また、カスタマーサービス番号955XXに電話してフィードバックを送ることもできます。

回答に基づいて、「010-58289XXX は報告電話番号ですか?」のような質問をすることができます。

また、類似の質問に答える際には、顧客から尋ねられた同じ質問を単に何度も言い換えるのではなく、顧客が実際に尋ねるシナリオに基づいて補足する必要があることにも留意することが重要です。

のように:

  • 遠隔出金の手数料はいくらですか?
  • 遠隔出金の手数料はいくらですか?
  • 他の場所からお金を引き出す場合の手数料はいくらですか?
  • 他の場所からお金を引き出す場合、手数料はかかりますか?

その代わり:

  • 出張中ですが、出金手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?

これは同様の質問を補足する正しい方法です。

市外引出の場合、市外=他の場所、引出=お金を引き出すことです。顧客サービスの観点から、文言の一貫性と標準化を確保するために、通常は「市外」と「引出」と言いますが、顧客は「市外」と「引出」と言うことがよくあります。このような状況に対応するために、類似の質問を補充する必要があります。文中の類似の質問を補充するだけでなく、文中のキーワードに対して同義語や類似語を補充する必要があります。具体的な補充方法は、各カスタマーサービスセンターロボットの背景設定要件に応じて実行する必要があります。たとえば、一部のロボットは、ビジネスシナリオコーミングで同義語と類似語の補充を別途行います。つまり、ビジネスシナリオの入力では、トレーナーが同義語のトレーニングシナリオ単語を補充する必要があります。一部のロボットは辞書として独立して存在し、キーワードを独立して補充できます。

同様の質問を補足する場合、次の問題が発生する可能性があります。

  1. 類似の質問を補足する作業量は膨大です。
  2. 類似の質問は人によって異なります。固定された人だけが類似の質問を完了できるようにすると、固定された考え方が形成されやすく、最終的な類似の質問の使いやすさが低下します。
  3. 同じ質問に対して類似の質問は無数にあり、ユーザーが実際に尋ねる類似の質問を完全に網羅することは困難です。

いくつかの提案:

解決策1: 大量の元の顧客ログを読み、同様の質問を書く

トレーナーは、類似の質問を書く前に、元のクライアントのログを大量に読み、自分の考えをクライアントの考えに当てはめて、クライアントの質問をシミュレートする必要があります。これは、書かれた類似の質問がクライアントの質問と最も一致するようにするためです。

ソリューション 2: カスタマー サービス センターの人間とカスタマー サービス ロボットの質問知識コンテスト (限定範囲)

カスタマーサービスセンターを動員し、多数の手動カスタマーサービススタッフに類似問題知識コンテストを開催してもらい、多数の手動カスタマーサービススタッフが類似問題の作成プロセスに参加できるようにします。作成する前に、類似問題の作成の原則と仕様を明確にし、誤った類似問題の書き方の例を提供する必要があります。

解決策3: ルール言語は同様の問題をカバーする

プログラミングのルールを使用して、「天気の状況を確認したい」などの同様の質問に対する正規表現を記述します。正規表現を使用して書かれた同様の質問は次のようになります: ${date}${city}の天気[予報|状態|ステータス]を[聞いてください|確認してください|教えてください]。[どのように|どのように|良いですか]。

解決策4: 類似質問自動生成システムを開発する

類似の質問を書く上記の方法はすべて、トレーナーによる手動操作に依存しています。では、類似の質問を書くのにロボットを利用できるようになるのでしょうか? 答えはイエスですが、コストを考慮する必要があります。

<<:  ロボティック プロセス オートメーション (RPA) を構築するための基本知識とベスト プラクティス

>>:  アリババDAMOアカデミーが2022年のトップ10テクノロジートレンドを発表:人工知能が風力・太陽光発電の送電網接続の問題を解決する可能性

ブログ    
ブログ    

推薦する

超まとめ! 200以上の便利な機械学習、NLP、Pythonチュートリアル

[[244555]]ビッグデータダイジェスト制作編集者: グアグア、アイリーンこの投稿には、私がこれ...

...

Java でアルゴリズムを実装する場合は、再帰に注意してください。

現象:再帰は、アルゴリズムの原理をうまく説明できる古典的なアルゴリズム実装です。再帰は、アルゴリズム...

AIを活用した臨床モニタリングシステムの台頭

[[355709]]現在、医療システムもさまざまな方法で人工知能の利点を取り入れています。人工知能(...

マイクロソフトの自動運転戦略:自動車を製造するのではなく、企業に技術サポートとクラウドサービスを提供する

ゼネラル・モーターズ傘下の自動運転車開発会社クルーズは、マイクロソフト、ゼネラル・モーターズ、ホンダ...

...

人工知能は繊維産業の生産プロセスをデジタル化し、自動化するだろう

デジタル変革への最善のアプローチを知りたいですか? 全体的なテクノロジーを明らかにすることはできませ...

...

...

AI時代に医療データの品質が重要な理由

効果的な医療データ分析においては、データの品質は主観的なものになります。データから得られる情報の正確...

AIGC時代のビデオ普及モデル、復旦チームらが分野初のレビューを発表

AI 生成コンテンツは、現在の人工知能分野で最もホットなトピックの 1 つとなっており、この分野の最...

5分でわかるReLU: 最も人気のある活性化関数

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...