会話型ロボットをよりスマートにするために製品設計を最適化するにはどうすればよいでしょうか?

会話型ロボットをよりスマートにするために製品設計を最適化するにはどうすればよいでしょうか?

01.人間は日々、環境、社会、他の人々、物と密接に関わっています。このタイプの接続は、一方向、双方向、アクティブ、パッシブのいずれかであり、各タイプの接続には、情報の交換を完了するための特定の「通信言語」があります。

[[329465]]

人々が互いにコミュニケーションをとる主な方法には、言語、テキスト、動作、態度、表現、音などがあります。また、人々と物体は視覚、触覚、嗅覚、音などを通じてコミュニケーションをとることができます。通常、最もタイムリーで効率的なコミュニケーション方法は、[視覚 + 触覚 + 聴覚] の迅速な応答と持続可能な組み合わせです。

第三の技術の波の到来とともに、人々の生活は次第に大きく変化し、転覆さえしています。このプロセスの進化に気づくのは難しいかもしれませんが、人間の活動範囲は、固定された狭い空間から全世界に直接移行し始めています。近くにあるものという概念は徐々に消えており、円はいつでも極小から極大に切り替えることができます。

人間同士のつながりはますます少なくなり、親子の関係でさえも、もはや密接な関係ではなくなりました。人間と物とのつながりは飛躍的に増加しています。たとえば、携帯電話やコンピューターは、ほとんどの人が毎日長時間接触する必要があるアイテムになっています。

では、なぜ人間はインテリジェントな会話型ロボットを必要とするのでしょうか?

インテリジェントな会話型ロボットは、人間と物体の間の極めて人間に近いコミュニケーション媒体であり、人間のようなコミュニケーション方法を通じて個人が目標を達成するのに役立ちます。この種のコミュニケーションはプライベートなものであり、一般的に個人が主導権と制御権を持ち、心配することなく自由に自分を表現できます。

02. SF作品に登場するロボットであれ、大企業が実用化している会話型ロボット製品であれ、近い将来に理想的な知能ロボットがあなたの生活に登場し、利便性を提供してくれるだろうと世界は言い続けています。

これらの製品は今どれほど効果的でしょうか? iPhone の Siri、Tmall Genie、Xiao Ai、あるいは特定のアプリの会話型ロボット機能を体験したことがあるなら、これらの製品のほとんどがまったく役に立たないことがすぐにわかるでしょう。使用時に「知的障害者」のように感じられることもあり、人間のようなレベルの「知能」にはまったく到達できません。その結果、業界の多くの同僚は、人工知能の知能はその人工性の量と同じくらいだと冗談を言い始めました。

なぜこのようなことが起こるのでしょうか?

本質的には、機械学習もディープラーニングも、人間が幼少期から成人期にかけて習得してきた常識と推論能力を獲得することはできません。これらの能力は、単純なテキストや会話だけでなく、より複雑な社会環境、ルール、生活認識などからも得られます。

そのため、囲碁の達人AlphaGoのような単一のタスクは、学習内容が比較的単純なため超人的なレベルに到達できますが、会話型ロボット製品ははるかに複雑です。会話型ロボットがユーザーの期待に応え、「インテリジェント」に見えるようにするには、AI製品マネージャーが製品を設計する前に、より多くのことを知る必要があります。

03. AIプロダクトマネージャーがインテリジェントな会話型ロボット製品を設計するための準備:

1. 業界を理解し、何をすべきかを知る

ここでの業界とは、物理分野の業界とロボット分野の業界の 2 つの部分を指します。

物理分野の産業は主にビジネスレベルを指します。たとえば、テイクアウト注文ロボット、医療指導ロボット、アフターサービスロボット、伝染病質疑応答ロボット、銀行インテリジェントアシスタントなどを作りたい場合などです。このビジネス分野におけるユーザーの現在の行動習慣を理解し、詳細の探索に注意を払い、その場で重要な分野固有の情報と重要なポイントを必ず分析して探索します。

ロボット工学分野は、ロボットの現在の応用分野です。

1) FAQボット

コア: まず、知識ベースの質問と回答のペア (QApair) を確立します。次に、アルゴリズム モデルに基づいて、可能な候補セットの回答の検索、呼び出し、スコアリングを実行し、最後に最上位の回答 (1 つ以上) を返します。

一般的な用途: 一般的なオンライン顧客サービス ロボット。

2) ナレッジグラフ対話ロボット(KG-BOT)

コア:ナレッジグラフの構築は、トリプルを構築することで構造化/非構造化情報を統合し、ビジネス分野の特定の情報をグラフ化することで、エンティティの関連付けを通じて「推論」に似た回答を提供します。

一般的な応用: ヤオミンの妻はどこの出身か尋ねる。

3) タスクベース対話ロボット(TASK-BOT)

コア: キースロット、非必須スロット、および対話プロセスの設計。タスクを指定してコアスロットを設計することで、スロットが満たされたときに結果を返すことができます。そうでない場合は、ユーザーが重要な情報を提供するように誘導するために、複数回の会話が行われます。

一般的な用途: テイクアウト注文ロボット (コアスロットは、レストラン名、料理、食事人数、連絡先、連絡先情報などです。具体的なデザインは、プラットフォームのニーズに応じて調整できます)

4) チャットボット

コア: 過去のチャット記録に基づくモデルトレーニングでは、機密情報や返信を処理する必要があります。同時に、言語設計はより人間的で、温かみがあり、ユーモアのあるものにする必要があります。

一般的な用途: 現在、独立したチャットロボットは一般的にほとんどなく、そのほとんどは他のタイプのロボットの補足的なシナリオです。

5) 会話型ボットのルーティング

コア: 上記のすべての会話型ロボットの組み合わせ。ルート配分は、ユーザーの意図認識に基づいて完了し、それが単一ラウンドの指示的回答なのか、複数ラウンドのタスクベースの回答なのか、それとも単なる単純なチャットなのかを確認します。難しさは、意図認識と対話管理 (DM) の精度にあります。そうでなければ、1 つのミスが発生すると、すべてが間違ってしまい、回復できなくなります。

一般的なアプリケーション: Siri、Xiaoai、Xiaodu、Xiaoice

2. 技術、業界レベル+社内レベルの理解

AI製品マネージャーは、現在の技術分野における最新のブレークスルーと実用化の実施計画に精通している必要があります。また、大手企業の技術がどのような機能を実現できるか、製品範囲のどの境界に到達できるか、さらに企業の現在の技術レベルも把握している必要があります。よりスマートな製品体験のために外部の第三者が提供する先進技術を購入するべきか、現在達成可能な技術範囲内で製品を設計してコストを節約すべきか、これらはすべてAI製品マネージャーが理解し、判断する必要があることです。

あなたが設計したロボット製品は、オンラインになった後、どんな質問にも答えるべきだ、と上司に言われたら、会話は本物の人間と同じくらい自然でスムーズ、そしてスマートでなければなりません。すると、2 つの選択肢があります。事実と理由を上司に説明して起こすか、ただ辞めるかです。結局のところ、上司は短期間で 100 人の人材を雇って「手動」の作業を行わせることはありません (ただし、1,000 個の規則的なルールを作成する人材を 100 人雇ったとしても、それを達成するのは困難です)。

3. 人間の言語を理解し、日常会話の習慣についての洞察を得る

会話型ロボット製品の場合、「会話」は当然ながら非常に重要なモジュールです。ロボットの応答をいかに人間に近い会話型製品に設計するかは、製品マネージャーのより深い人間的配慮の反映です。人間の言語を理解し、人々の日常会話の習慣を発見し、それらの興味深い点を見つけなければ、設計されたロボット製品は単なるコールドコードのソフトウェアまたはマシンになり、ユーザーに気に入られない可能性があります。

実現可能な解決策は、会話型ロボットに擬人化された性格を与え、特別なイメージをデザインし、それに適した言語をデザインすることです。そうすることで、ユーザーはロボットを気に入り、使い慣れ、最終的には覚えて頼りにするようになります。

4. 境界をマスターし、製品設計を実行する

最後に、ビジネス分野の特性を理解し、テクノロジーの限界をマスターしたら、設計するロボット製品の限界も定義できるようになります。境界内で、製品設計の利点を活用して会話体験を最大化します。技術の欠陥は製品設計によって補われ、その結果、技術のアップグレードによってより完全な製品体験が実現します。

<<:  AIを使用してC++、Java、Pythonコードを翻訳し、最大成功率は80.9%です。

>>:  モデル圧縮率95%、MIT Han Songらが新しいLite Transformerを提案

ブログ    
ブログ    

推薦する

顔認識の今後の発展は、どうすればより「面子を保つ」ことができるでしょうか?

顔認識技術の利用が増えるにつれ、さまざまなリスクが徐々に明らかになってきています。 CCTVの「3....

eMule プロトコルの DHT アルゴリズム

BT プロトコルと eMule プロトコルのアルゴリズムにはいくつかの違いがあり、この 2 つを併用...

復旦大学の論文は、3体のSFシーンを実現:体にディスプレイ画面を装着し、ナビゲートやチャットも可能

誰もが歩くディスプレイ画面であり、これは単なる SF のワンシーンではありません。羅吉が最も感動した...

ディープラーニングフレームワークの競争: TNN vs. MNN、NCNNは依然として定番

近年、「オープンソース」は開発者コミュニティにおける新たなトレンドとなっています。特にディープラーニ...

12 のシナリオ アプリケーション、100 を超えるアルゴリズム、AI はどのようにして経済を征服するのか?

[[328065]] 2020年2月7日、第34回アメリカ人工知能学会年次会議(AAAI 2020...

15年以内に恐竜を繁殖させる、マスクは恐竜を​​月に送りたいのか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

クアルコム副社長ライナー・クレメント氏:「5G+AI+クラウド」は将来の産業をどのように変えるのでしょうか?

2019年国際産業インターネット革新・開発フォーラムがこのほど、第2回中国国際輸入博覧会で開催され...

...

...

ディープラーニング入門: オートエンコーダから変分オートエンコーダまで

オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(AN...

人工知能がリスク管理分野に参入すると、生身の人間は職を失うことになるのでしょうか?

スティーブ・ジョブズの「電話の再発明」は携帯電話を再定義しただけでなく、世界を変え、人類をモバイルイ...

言葉を発することなくSiriに命令しましょう!清華大学の卒業生が「無言言語認識」ネックレスを開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アリババ、量子アルゴリズムとエラー訂正の探究をサポートする量子シミュレータ「Taizhang 2.0」をオープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google の医療モデルが Nature に掲載、Med-PaLM が重要な秘密を明らかに! AI医師は人間と同等の能力を発揮する

5月のI/Oカンファレンスでは、Med-PaLM 2が大幅にアップグレードされ、エキスパートレベルに...

データセンターにおけるロボットの使用はどのように増加するのでしょうか?

[[407824]]調査によると、ロボットがデータセンターに導入されつつありますが、データセンター...