GenAIの有効性に影響を与える主な問題

GenAIの有効性に影響を与える主な問題

企業は GenAI をビジネスに適用しようとすると、多くの抵抗と予想外の変更管理の問題に直面します。上級管理職に GenAI の導入を約束してもらえても、中間管理職や業界関係者は GenAI のアプローチに抵抗します。職を失ったり、仕事のやり方を根本的に考え直さなければならない可能性があるため、抵抗を感じる人もいるのは当然ですが、企業は AI ツールを使用する際にランダムな答えと決定論的な答えのどちらを求めるかという問題に苦慮しているため、かなりの抵抗が生じています。

AIの答えは確率的である

GenAI は確率的な回答、つまり最も可能性の高い回答または次のステップを提供します。そのため、手紙や文章を作成するときに、最も可能性の高い次の単語、フレーズ、またはアイデアを提供しますが、最も可能性の高い回答は正しい回答とは異なります。確かに、これは多くの場合正解であり、大量のトレーニング データが利用できることを考慮すると、良い答えである可能性は高いですが、正解とは大きく異なります。

この問題をさらに複雑にしているのは、答えがどのように導き出されたかの監査証跡を残すという課題です。GenAI 実装で直面する課題の多くは、決定論的な答えを必要とするアプリケーションと、その答えがどのように導き出されたかを完全に説明する必要性から生じます。回答の確実性が求められる、または求められると認識されている場合、企業やその従業員は、結果の有用性や信頼性に疑問が生じるため、これらのアプリケーションに抵抗します。

AI がアシスタントとして提供され、人間が最終的な回答の判断を求められる場合でも、説明不足と支援に関する不確実性が不信感と抵抗を生み出し、このことが当てはまることが証明されています。

GenAI が確率的な回答を提供するという事実は、それが価値がないことを意味するわけではありません。それが価値あるものになるユースケースは数多くありますが、企業がこの回答を決定論的な回答を必要とする問題に適用すると、それは嘘をついているように見えます。

企業が GenAI をビジネスに適用しようとすると、決定論的な回答が必要なのに確率的な回答を使用することになり、フラストレーションを感じます。そのため、まず確率を使って機械学習を行う必要があり (例: 緑の葉があるから木である)、次に回答の妥当性に影響する問題があるかどうかをテストする必要があります (例: 秋の紅葉)。

AIの確率モデルに適した分野はどれですか?

企業は GenAI をプログラミングにどのように導入すべきでしょうか? テクノロジー業界からは、GenAI または AI がプログラミングを学習し、プログラマーの熟練度や効率生産性を大幅に向上できるという大胆な予測が出てきています。興味深いことです。

コーディングの世界では、これはすぐに効果を発揮します。たとえば、テスト スクリプトの開発自体を確率モデルで処理できます。ここで重要なのは、企業が多くの条件をテストし、できるだけ広く深くスクリプトを生成できることです。コードとセキュリティの脆弱性に対する効果的なテストを作成することは、本質的に確率的な作業であるため、GenAI は優れており、実践者が簡単に導入できます。

一方、実際のコード開発には役立ちません。ビジネスではコードが 100% 正確であることを求めており、より決定論的な答えが求められます。ただし、コード開発のナレッジ管理のサポートに優れており、優れたスターター セットも作成できるため、生産性が大幅に向上します。

GenAI のもう 1 つの優れた点は、知識を統合または要約することであるため、知識管理の分野は GenAI に最適です。

たとえば、顧客関係管理機能において、Salesforce は Einstein 製品や、顧客のニーズ情報から情報を合成または集約するように設計されたその他の製品で大きな進歩を遂げており、営業担当者が知識をより効果的に管理できるようにすることは、GenAI の非常に効果的なユースケースです。

マーケティングは、確率的な回答が優れているもう 1 つの分野です。たとえば、この顧客に対して次に取るべき最善のアクションは何でしょうか。顧客データを整理して顧客の問題に対する最善の解決策を決定する場合、GenAI は即座に大きな影響を与えることができ、強力なツールとなる可能性があります。

対照的に、請求処理などのプロセスでは、次のような決定論的な答えが必要です。この医療請求に対して適切な金額を得るにはどうすればよいか。これには決定論的な答えが必要であり、ほとんどの場合に正しい答えを得るだけでは十分ではなく、常に正しい答えを得る必要があります。

次の質問をすることは、GenAI を使用し、フラストレーションや抵抗を軽減するための効果的なスタートです。

  • すぐに効果的に活用できる場所はどこですか?
  • 他のテクノロジーと統合する必要があるのはどこですか?
  • どこで使用してはいけないのでしょうか?

人的要因についてはどうでしょうか?

確率的な答えは問題解決に役立つ便利なツールですが、出発点となります。ただし、通常はチェーンから人間を排除するのではなく、特に企業が決定論的な答えを得る必要があると判断した場合、より洗練されたツールを人間に提供します。

企業が AI ツールを使用してデータの整理と集約を行っている場合、摩擦が軽減されるので便利ですが、意思決定に使用した場合、その決定が必ずしも正しいとは限らず、AI ツールがどのように答えを出したのかわからないため、確認方法がわからないため、人々はその決定に不安を感じる可能性があります。

これらの困難から抜け出す方法は何でしょうか?

解決策は、自動化または支援される作業だけでなく、それが残りの人間の作業にどのように影響するかをより徹底的に理解し、下流の作業やその他の意図しない結果に関するガイダンスと支援を提供することです。

これには、ツールを適用する場所の成熟度がさらに必要であり、ユーザーは思慮深く影響を十分に考慮する必要があり、製品の成熟度を評価する際には、個人や企業が抵抗して抑制しないように、意図しない結果を考慮する必要があります。

このような思考プロセスを必要とする質問には次のようなものがあります。

  • 自動化されるタスクだけでなく、自動化される人の役割の影響も考慮することが重要です。
  • 必要な生産性の向上により、そのタスクを実行する人数が減るという現実を慎重に考慮してください。どうしてそんなことを考えたんですか?
  • 人々がこのツールを信頼できるようにするには、どのようにテストすればよいかを考えます。破壊的な新技術がもたらす不確実性が増すほど、人々はそれを信頼しなくなるでしょう。
  • 全面的な変更に進む前に、AI ツールを試験的に導入してそのメリットを実証する方法を検討してください。

最後に

GenAI との 1 年間にわたる必死の実験を経て、業界では何千ものパイロットを成功裏に実施しましたが、資金調達、変更管理、適応における無数の課題によって妨げられたため、これらのパイロットのほとんどは実稼働に移行できませんでした。

しかし、GenAI が適している分野では、急速に実稼働に移行し、大きな利益を生み出しており、これらの実稼働ユースケースの成功は、ツールの選択やその他の要因よりも、ユースケースと GenAI の性質の適合性によって左右されるようです。

さらに、ほとんどのビジネス機能において、GenAI は生産的な役割を果たしており、そのほぼすべてが適切なサブ機能に重点を置いているようです。実験への莫大な投資を考慮すると、ほとんどの企業にとって GenAI が自社にとって効果的な領域を見つける最も効果的な方法は、GenAI がパイロットから本番環境へと正常に移行したユースケースを調べることかもしれません。このような進歩がすでに大規模に起こっている場合、企業は適合性が良好であると確信でき、労力と資金を無駄にするリスクを大幅に軽減できます。

<<:  OpenAIはGPT-4が怠惰になったことを認める:当面修正することはできない

>>:  集団雷雨!自動化された攻撃により、主要な言語モデルを1分で脱獄できる

ブログ    
ブログ    

推薦する

...

マット・カッツのブログ投稿: Google のアルゴリズムの最新の変更点 10 件

Google が今年の夏に関連ビデオを公開したことに続くもの。昨日、Google の主任検索エンジニ...

ディープラーニングによる時系列モデルの評価

技術概要:今回は主に教師なし特徴学習とディープラーニングの最近の発展と、時系列モデル問題におけるそれ...

Meta主任AI研究者ヤン・リクン氏:今日のAIは愚かであり、規制当局は我々に干渉すべきではない

ソーシャルメディアFacebookの親会社Metaの主任人工知能研究者ヤン・ルカン氏は10月20日、...

次世代AIの導入が急増する中、新たな研究がデータの信頼性の問題を警告

信頼できる人工知能(AI)データ企業であるClouderaの新しい調査によると、米国の組織の半数以上...

...

トランスフォーマーに挑むマンバの起源とは?著者の博士論文はSSMの進化の道筋を明らかにしている

大型模型の分野では、トランスフォーマーが全容を一手に引き受けています。しかし、モデルのサイズが拡大し...

...

人工知能を活用して顧客サービス体験を向上させる 5 つの方法

人々がデジタルの世界に移行するにつれて、組織と顧客の関係はここ数年で変化してきました。顧客の期待はか...

...

...

マルチモーダルな大型モデルの幻覚が 30% 減少しました。 USTCらが初の錯視補正フレームワーク「Woodpecker」を提案

視覚幻覚は、マルチモーダル大規模言語モデル (MLLM) でよく見られる典型的な問題です。簡単に言え...

機械学習入門メソッドの最も価値のあるコレクションを今日あなたと共有します

元のタイトル: 機械学習を始める方法!動画紹介: https://v.qq.com/iframe/p...

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

[[405016]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

ロボティック・プロセス・オートメーション技術の需要が急増

Adroit Market Research によると、世界のロボットプロセス自動化技術市場は 20...