多言語AI分析は、顧客体験の可能性を解き放ち、ビジネスの成長を促す鍵となる

多言語AI分析は、顧客体験の可能性を解き放ち、ビジネスの成長を促す鍵となる

テキスト分析は、顧客が話す言語に関係なく、顧客の意見のあらゆる例を発見して注釈を付けることができる強力な分野です。

言語の制限なしにテキストを分析できる AI の可能性は、ビジネスを取り巻く膨大な量の非構造化データに気づきつつある経営幹部にとって、重要な(しかし見落とされがちな)問題です。

結局のところ、非構造化データ (UD) とは、スプレッドシートのような形式で構造化されていないデータであり、さまざまなソーシャル メディア プラットフォーム、ブログ、Web サイトのコメント、コール センターの通話、プライベート チャットなどで大量に見つかることが多く、このデータは、顧客体験 (CX) の向上に関心のある企業にとって、より価値のある膨大なリソースとなります。

ほとんどのデータは構造化されていません。 MIT の推定によると、今日のデータの 80% ~ 90% は非構造化データであり、その数は急速に増加しています。そしてこの事実は、テクノロジーと専門知識に投資した企業が顧客の意見をすべて収集し、分析できることを意味します。

ここでテキスト分析 AI が役立ちます。これにより、あらゆるプラットフォームで企業のブランドについてコメントするすべての顧客、その考え、意見、アイデアに、これまでにないほどアクセスできるようになります。これにより、企業は最初に対処する必要がある顧客の問題点を正確かつ迅速に特定し、顧客離れを減らすことができます。

この普遍性を考えると、言語にとらわれない考え方の価値を認識することが特に重要です。分析と注釈を英語の観点のみに限定すると(他の観点が存在する場合)、非構造化データの規模と、そのようなテキスト分析の一般化可能性が損なわれます。

そのため、多言語 AI 分析の仕組みと、顧客の意見を包括的に把握する能力を理解する必要があります。

自然言語処理の力

AI 駆動型テキスト分析の基盤は、機械学習 (ML) と自然言語処理 (NLP) の組み合わせです。

機械学習は、人間の学習を模倣しようとする人工知能へのアプローチです。従来のプログラミングでは人間が作成したルールを実行する必要がありますが、機械学習ではデータ分析を使用して推論に使用できる非常に複雑なパターンを学習するため、機械学習は問題を解決し、複雑なタスクを実行するのに非常に優れています。

一方、自然言語処理 (NLP) は言語の処理に関係します。実際、これは機械学習によってサポートされる複雑なタスクの 1 つとして理解できます。

この文脈では、自然言語処理 (NLP) の用途は多岐にわたります。特定の用語や単語がテキストに出現する頻度をカウントするなど、より単純な目的に使用できます。あるいは、与えられたテキストの雰囲気や感情を判断するという、より困難な課題に取り組むこともできます。

明らかに、これらは両方とも、入手可能なすべての顧客の意見を詳細に理解したい企業にとって非常に役立ちます。

自然言語処理 (NLP) をこのように使用することで、企業は大量のデータを評価して、自社のブランドがオンラインまたはオフラインでどのくらいの頻度で話題になっているかを把握できるほか、コメントが肯定的か否定的か、あるいはより微妙な感情の範囲に関連しているかを理解できるようになります。

多言語アプローチ

重要なのは、このアプローチの利点はすべての顧客の意見を組み込むことができることです。テキスト分析はサンプルや選択ではなく、すべての意見に適用されます。

しかし、この目標を達成するには、特定の意見が表現される言語を制限することはできず、特に企業が多国籍組織である場合は、AI が完全に言語に依存しないことが必要になります。

これは、教師なし機械学習と教師あり機械学習の両方を使用することで実現できます。教師あり機械学習とは、関連するアルゴリズムがトレーニング データに注釈を付ける人間によって「トレーニング」されることを意味し、大量のデータ (ビッグ データとも呼ばれる) を伴うタスクに関しては、AI は人間よりも優れた結果を出すことができます。

すべての言語のニーズが満たされるように、研究者はさまざまな言語のネイティブスピーカー約 300 名からなるチームを活用して、非構造化データを読み取り、理解し、手動で注釈を付けました。たとえば、ツイートが肯定的か否定的か、件名が皮肉的かどうか、さらには電子メールやチャット メッセージの内容が示唆するカスタマー ジャーニーを判断するなどです。

AI が母国語でトレーニングされ(英語への翻訳や英語を使用した機械学習モデルは不要)、目標(感情の構築やトピックの特定など)を高い精度で達成すると、結果を英語で簡単に視覚化できるため、CX プロフェッショナルや顧客維持マネージャーなどが顧客が理解できる言語ですべての顧客の意見を把握できるようになります。

最も重要なのは、人工知能の精度は継続的に向上できるということです。たとえば、人間がツイートの小さなサブセットに特定の感情を注釈付けすると、その精度を測定できます。ツイートの言語に関係なく、コンテンツの 80% ~ 90% 以上がアルゴリズムと一致していることがわかります。

感情表現の主観的な性質を考えると、これは AI テクノロジーがいかに強力になったかを示しています。

非構造化データの山から針を見つける

非構造化データ (UD) はあらゆる場所に存在し、定義上サンプルに基づく意見しか提供できない世論調査ではなく、すべての顧客の意見を理解する機会を提供します。

しかし、消費者の意見への自由なアクセスを真に実現するためには、多国籍企業は AI の専門家や技術者を雇うだけでなく、自社の AI システムが英語と同じ高い精度ですべての関連言語のデータに基づいてトレーニングされるようにする必要があります。

これにより、テキスト分析はソースに依存しないだけでなく、言語にも依存しなくなります。ビジネス リーダーが、顧客の視点、問題点、利益を詳細かつ正確かつ包括的に理解していると自信を持って主張できるようにします。

<<:  人工知能向け開発言語5つを比較するとどれが優れているのか?

>>:  MIT、「上級数学」ソルバーの強化版をリリース:7つのコースの正解率は81%

ブログ    
ブログ    
ブログ    

推薦する

LLaMAが使用するオープンソースデータセットは棚から削除されました。これには約20万冊の本が含まれており、OpenAIデータセットに匹敵します。

オープンソースのデータセットは著作権侵害のため棚から削除されました。例えば、LLaMA、GPT-J ...

...

...

...

これほどリアルな効果を生み出すために、原作者を何人食べなければならなかったのですか?文生図はビジュアル「盗作」の疑い

少し前、ニューヨーク・タイムズ紙は、OpenAI が自社のコンテンツを人工知能開発のために違法に使用...

年末総括:セキュリティ業界は2020年にCOVID-19パンデミックの課題に対処するのに貢献した

新型コロナウイルス感染症のパンデミックは、セキュリティ業界を含む世界中のあらゆる業界のあらゆる側面に...

シンプルで使いやすいPythonの顔認識アルゴリズムをいくつかまとめます

こんにちは、みんな。今日は、シンプルで使いやすい顔認識アルゴリズムをいくつかまとめます。顔認識はコン...

...

2020 年の人工知能とディープラーニングの 5 つの将来トレンド

近年、人工知能は頻繁に話題になっていますが、まだ真の実現には程遠い状況です。 [[314350]]人...

ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

Transformer アーキテクチャは、現代の機械学習で広く使用されています。 Attention...

Mobvoi Guo Xiao: 自動運転の中核要素の実現と車両インタラクションにおけるAIの応用

[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフト...

オープンソースモデルの新記録:Mixtral 8x7B Instructを超えるモデルが登場

Llama、Llama 2 から Mixtral 8x7B まで、オープンソース モデルのパフォーマ...

JD Search EE リンクの進化

検索システムにはヘッド効果が存在する可能性が高く、高品質のミッドテールおよびロングテール製品が十分な...

...

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...