プログラマーを怒らせると何が起こるでしょうか?アリババDAMOアカデミーの専門家は嫌がらせ電話に耐えられず、「Erha」AIを開発した

プログラマーを怒らせると何が起こるでしょうか?アリババDAMOアカデミーの専門家は嫌がらせ電話に耐えられず、「Erha」AIを開発した

[[259716]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

プログラマーを怒らせないでください。プログラマーを怒らせないでください。プログラマーを怒らせないでください。

たとえ、年間 40 億件もの電話をかけてくるロボットの嫌がらせ発信者であってもです。

3.15ガラでロボットが嫌がらせ電話をかける闇産業チェーンが暴露された後、人々は衝撃を受け、世論は騒然となり、AI実践者は悲嘆に暮れた。

意外なことに、最先端の AI 技術が、悪意を持った企業によってダークサイドへと導かれつつあります。

しかし数時間後、アリババはロボットの問題はロボットに任せるべきだとして、嫌がらせ電話を防ぐためのAI技術の導入を発表した。

公開されたビデオデモでは、アリババAIラボが嫌がらせ防止通話AIを立ち上げ、営業電話の最中に、人間の女性営業担当者がプロセス全体をまったく把握していなかったことが示されました...

その後、アリババはAlipayミニプログラムとTmall Genieアプリでもオープンエクスペリエンスを開始し、好評を博しました。

もちろん、Nie Zaiqing 氏は、自分のアマチュア プロジェクトがこれほど広く注目されるとは予想していませんでした。

アリババAIラボの音声アシスタントのトップ科学者であり、アリババAI北京R&Dセンターの責任者、そしてマイクロソフトリサーチアジアの元トップ研究者は、プロジェクトの当初の意図を次のように説明した。

頻繁に嫌がらせの電話を受けるのは本当に迷惑です。さらに、チーム会議がさまざまな電話によって嫌がらせや中断を受けることが多く、会議が開催できないことがあります。そこで、テクノロジーでこの問題を解決できないかと考えました。

こうしてアリの嫌がらせ対策コールAI「エルハ」が誕生した。

機械同士が戦えるようにする

Alibaba AI Lab では、このインテリジェントな嫌がらせ防止通話テクノロジーのプロジェクト コード名は「Erha」です。

ユーザーが携帯電話でこのサービスを有効にすると、嫌がらせの電話を受けたときに、その電話を直接ロボットに転送することができます。

アリババは「Erha」の動作状況を示すデモ動画も公開した。

ローンを販売する女性営業マンが電話に出ると、1分以内にエルハさんは流暢に答えただけでなく、受動態から能動態に切り替えて「北京でローンを組むことはできますか?」「最大でいくら借りられますか?」と尋ねました。

彼女は会話の最中に「からかって」さえいた。「前にも電話したことがあるでしょう、聞き覚えがあるような気がします」。会話中ずっと、女性販売員は自分がロボットと話していることに気づいていなかった。

***「Erha」AIも女性販売員から「WeChat ID」を尋ねられた。

このビデオが公開されるとすぐに、Weiboで話題になった。

「タイトルを読んでいなかったら、ロボットがいるとは思わなかっただろう」と驚く人もいました。

「機械戦争」を始めるために、いくつかの小さな提案をした人がいました。

AI研究者からのコメントもある。例えば、清華大学の劉志遠氏は、嫌がらせを防ぐだけでなく、偽装してデータセットを収集することもできると述べ、この技術の応用を称賛した。

また、アリババAI研究所傘下のTmall Genieは、このロボットは多くの人の「チューリングテスト」に合格したロボットだとも発表した。今ならTmall Genieアプリを開いたり、アリペイでTmall Genieを検索したりして、「Erha」をからかうことができる。

つまり、AI の問題は AI によって解決されているのです。

技術原理: インテリジェントチャット

アリババAI北京研究開発センター所長の聶在青博士は、「Erha」の背後で使用されている主な技術はインテリジェントチャット技術であると説明した。

いわゆる「インテリジェント チャット」では、ユーザーのリクエストを理解し、強力なナレッジ グラフを使用してチャットのナレッジ ポイントを作成する必要があります。ユーザーとコミュニケーションをとることで、ナレッジ グラフ内の知識をユーザーに浸透させ、同時にユーザーからのフィードバックを導くことができます。

このプロセスでは、AIがユーザーと会話すればするほど、AIは多くの知識を学習し、ユーザーも会話を通じてお互いから学び、徐々にAIを友人とみなすようになります。

より具体的には、インテリジェント チャットでは、タスクを完了するために非常に高い精度を必要としないため、深層強化学習を使用して対話戦略を学習します。

そのため、AI がミスを犯したとしても、それほど問題にはなりません。ユーザーは、応答に不満を感じるだけです (所有者のタスクを 100% の正確さで完了することが求められるタスク完了時とは異なります)。

強化学習を通じて、次回の対話戦略アルゴリズムは、そのようなユーザーとどのようにチャットすればよいかをよりよく理解できるようになります。

垂直的な技術応用の観点から分類すると、音声認識、NLP、ナレッジグラフ、音声合成(TTS)などの技術がプロセス内で横断的に使用されます。

Nie Zaiqing氏は次のように説明した。

まず、音声認識技術を使用してユーザーの音声をテキストに変換します。

次に、自然言語理解技術を使用して、発信者の意図と特定のスロット値を抽出します。

そして、精密なナレッジグラフに対応し、「Erha」はユーザーの入力を現実世界の人や物と結び付けることができます。

次に、ユーザーの現在の入力内容と過去のやり取りからのコンテキスト情報に基づいて、Erha は次の文が発信者からの質問に対する回答になるか、発信者への質問になるかを決定する必要があります。

***、Erha はテキストを人間の音声に変換するために音声コラボレーション テクノロジー (TTS) も使用する必要があります。

しかし、それは明確に聞こえ、手順も明確ですが、真実と偽りの区別を難しくすることは容易ではありません。

真実と偽りを区別しにくくするにはどうすればよいでしょうか?

Nie Zaiqing は、次の 3 つの側面が核となるべきだと考えています。

***、ユーザーのすべての単語をキャッチします。

ユーザーの入力スペースが非常に大きいため、発信者が話すすべての単語を理解してインテリジェントに応答することは困難です。

「Erha」の知識分野にない質問に対して、Alibaba AIは現在、ChitChat技術を使用して、インターネット上の公開人間対話ライブラリから最も適切な応答を見つけます。これは、情報検索に基づいて、上位の関連応答を見つける方法です。

目的は、電話をかけた人が「Erha」について知らない可能性があることを隠蔽することです。

次に、関連する質問を積極的にします。

これは会話戦略を学ぶ仕事であり、発信者に「Erha」が彼らの言うことを本当に理解できること、そして会話の文脈が理解されている場合にのみ尋ねられる適切な質問をできることを伝える必要があります。

受動的に応答するだけでは、簡単に発見されてしまいます。

この課題は非常に大きい。Nie Zaiqing 氏は 2018 年に AAAI で論文 (CoChat: タスク完了のためのボットと人間のコラボレーションの実現) を共同発表した。この論文の核心は、チャットボットの対話戦略学習フレームワークを提案し、「Erha」のようなチャットボットがさまざまなシナリオで学習を継続できるようにすることである。

教師あり学習、オンライン学習、深層強化学習(感情分析を使用して報酬と罰のフィードバック信号を提供する)が含まれます。さまざまなチャットボットは、独自のシナリオ要件に応じて、さまざまな学習戦略を選択できます。

たとえば、人間の作業員がいるカスタマーサービスの分野では、オンライン学習をより頻繁に使用できます。Erha のようなロボットは、教師あり学習から始めることができ、深層強化学習は継続的に改善することができます。

そして、人間との継続的な対話を通じて、「Erha」AI は深層強化学習を通じて目標をよりよく達成するためにどのように質問すればよいかをますますよく理解するようになります。

***、実際の声、イントネーション、休止。

販売促進のための嫌がらせ電話を受けた場合、最初に電話に出た人が声からロボットだと判断すると、会話を続けなくなります。

そこで「Erha」は音声合成(TTS)の分野で多くの成果を上げました。

Alibaba AI *** アルゴリズムは、Tacotron とニューラル ネットワーク ベースのボコーダー アルゴリズムを使用して、非常にリアルな人間の声を合成しますが、残念ながら、大部分のケースではチューリング テストに合格できません。

そのため、「Erha」は現在、非常に高頻度の返信には実際の人物による録音を使用するという移行計画を採用しています。しかし、このプログラムは今後も衰退し続けることは間違いありません。

そして、「Erha」はもともと単なる課外プロジェクトだったことは注目に値します。

[[259718]]

プログラマーを怒らせないで

「Erha」を開発する当初の意図は、実は、ますます頻繁になる嫌がらせ電話に対する怒りからでした。

聶在青さんは、ずっと同じ電話番号を使っていたため、漏洩はどんどん深刻になり、嫌がらせの電話を頻繁に受けるようになったと語った。

それはチームの仕事にも影響を及ぼしました。会議中、同僚たちはさまざまな電話に邪魔されることが多く、会議が終わってしまうことがありました。そこで、テクノロジーを使ってこの問題を解決する方法を考え始めました。

さらに腹立たしいのは、大量の嫌がらせ電話が機械によって自動的にかけられ、そのコストがどんどん下がっていることだ。

さらに、適切な時期、適切な場所、適切な人々でもあります。

[[259719]]

Alibaba AI Labでは、Nie ZaiqingのチームがTmall Genieのアルゴリズムを担当しており、関連する才能あるチームはすべて、音声認識、NLP、ナレッジグラフなど、チェーン全体をカバーしています。

また、音声アシスタントと同様に、インテリジェントな会話のための基本的なアルゴリズムも普遍的です。

そこで彼らは、興味に駆られて「課外」プロジェクトを始めました。参加したエンジニアたちはとても満足していました。一方ではほっとした気持ちで、他方ではその背後にある意義を理解していました。

その後は順調に進み、今月初めにようやく企業に申請書を提出し、プロジェクトがスタートしました。

今年の3.15ガラでロボットによる嫌がらせ電話がこれほど注目を集めるとは予想していませんでした。

そこでチームは研究開発の成果を公開することに決め、「Erha」は正式に舞台裏から姿を現した。

一夜にして成功する。

[[259720]]

AI電話秘書

しかし、「Erha」は嫌がらせの電話に対処するためだけに存在しているのでしょうか?

いいえ。

聶在青氏は、「二哈」のさらなる目標は、みんなのAI電話秘書になることだと語った。嫌がらせ電話への対応を手助けするほか、忙しいときに発信者の主な意図を尋ねたり、予約の手配を手伝ったりすることもできる。

[[259721]]

さらに、電話対応や議題に重点を置いたこれまでの秘書アシスタントと比べ、「Erha」のような AI 電話秘書は、パーソナライズされた TTS を使用して、所有者にとって非常にリアルな音声を模倣できます。

また、このような目標は達成不可能な「ビジョン」ではありません。

少なくとも現時点では、Erha を使用して AI コール転送を実装することは、もはや技術的な課題ではありません。

AI は、電話に出るのが難しい場合に電話に応答し、それをテキストに変換して「報告」するのに役立ちます。

あなたはそのような AI サービスにお金を払うつもりですか?

<<:  フロントエンド人工知能: 機械学習による関数方程式の導出 - プラチナ III

>>:  2019年の人工知能の給与水準、給与水準分析チャート、わかりやすい

推薦する

人工知能業界データ分析:中国のネットユーザーの76.8%が2020年の人工知能トラフィックアプリケーションシナリオに満足している

政策の推進と資本の注目により、人工知能産業は今後も急速な発展傾向を維持するでしょう。投資家は人工知能...

人工知能は人類の終焉をもたらすのでしょうか? AIに対する5つの実存的脅威

私たちは現在、この地球上で最も知的な種であり、他のすべての生命は生き続けるために私たちの善意に依存し...

機械学習とディープラーニングの5つの主な違い

前回のシリーズの記事「機械学習とディープラーニングの違いは何でしょうか?」に続き、簡単に説明した後、...

機械学習と予測アプリケーションに必要な50のAPI

[[231536]] API は、ソフトウェア プログラムを構築するためのプロトコルとツールのセッ...

インテリジェントな顧客サービス チャット モジュールの 3 つのソリューションを比較すると、どれが気に入りましたか?

現在のインテリジェント顧客サービス市場とその NLP 分野において、チャット モジュールは非常に重要...

スマート製造を活用して持続可能な工場フロアを構築するにはどうすればよいでしょうか?

自動車メーカーは、施設を近代化し、事業運営をより持続可能にするために、スマート製造戦略を採用していま...

畳み込みニューラルネットワークの父:人工知能が動画から常識を学ぶための次のステップ

志東西(公式アカウント:zhidxcom)起源ディープラーニング分野の大物として、ヤン・ルカン氏は近...

...

私の国における AI チップ開発の現状と見通しはどうですか?

近年、人工知能(AI)技術の発展に伴い、多数のAIメーカーが登場しています。 AIにとって、データ、...

スマートビルにはスマートクリーニングが必要な理由

スマートビルへの移行はヨーロッパ全土で加速しています。あらゆる業界の組織が顧客と従業員のエクスペリエ...

Golang か Python か? AIに適した言語はどれですか?

近年、AIが勢いを増し、多くの革新的な企業がAI分野に参入し始めました。同時に、コンピュータハードウ...

米国、人工知能に関する大統領令を発表

人工知能には大きな可能性があり、その可能性と危険性の両方を兼ね備えています。 AI を責任を持って使...

オッペンハイマーの「彼女は消えた」!物理学界のファーストレディ、呉健雄はマンハッタン計画の重要な問題を解決した

長い待ち時間を経て、ついに『オッペンハイマー』が国内で公開される。ノーラン監督は映画の細部と品質に細...

...

GPTは「贅沢」すぎるが、代替案が多数用意されており、展開の問題を心配する必要はもうない

近年、生成的事前トレーニング済みモデル (GPT など) の台頭により、自然言語処理の分野に革命が起...