AI バイアス: なぜ起こるのか、そして企業はどのように修正できるのか

AI バイアス: なぜ起こるのか、そして企業はどのように修正できるのか

ビジネスや社会で AI の利用が広まるにつれ、企業は機械モデルに現れる人間の偏見に注意を払う必要があります。企業は人間の知性を活用して、アルゴリズムのトレーニングに必要なさまざまなデータと入力を取得できます。

[[343633]]

データセット内の偏りを回避する方法があります。

人工知能 (AI) アルゴリズムをトレーニングする場合、データの入力に依存します。これは特にビジネス環境に当てはまります。ビジネス環境では、AI の目的が顧客とのやり取り、自動化システムの管理、人間の意思決定の模倣である可能性があります。結果が目的と一致することは非常に重要です。しかし、AI が指示やリクエストに応答する方法に歪みをもたらす可能性のある偏りに企業が対処できることが重要です。

新製品の設計と開発の段階は、企業がテストを実行し、欠陥を特定して排除できるため、非常に重要です。何らかの理由で設計上の欠陥が見落とされたり、製品が故障したりした場合でも、すぐに解決できます。故障したデバイスはリコールされ、ソフトウェアの問題を修正するためのアップデートやパッチが発行されます。これは典型的なソフトウェアリリースでは問題ありませんが、人工知能アルゴリズムの取り扱いはそれほど簡単ではありません。

AI アルゴリズムは、機械学習 (ML) に基づいて非常に特殊なタスクを実行するように設計された、非常に複雑なシステムです。 AI が運用を開始した後に生み出される偏見を解消しようとすると、コストと時間がかかる可能性があります。また、「学習」するテクノロジーにとっては直感に反する行為でもあります。設計および開発段階で逸脱を検出して排除するプロセスを導入する方が効果的です。

偏見はビジネスに悪影響を及ぼす

人工知能の基本的な目的と機能は、その基礎となるアルゴリズムに組み込まれています。 AI が固有の偏見を持つようになると、アルゴリズムに悪影響を与えることになります。これは、AI が提供することが期待される精度と効率に重大な影響を及ぼし、AI が商業ニーズを満たす能力を制限する可能性があり、いずれもビジネスにとって悪影響となります。

開発者の善意にもかかわらず、偏見は常に AI アルゴリズムに侵入する方法を見つけます。他の学習プロセスと同様に、生徒は教師の影響を受けます。認定機関が提供する教育の範囲は、その機関が提供するコースによって異なります。当然のことながら、カリキュラムが多様になればなるほど、生徒の考え方はよりオープンになります。同様に、より大規模で多様なデータセットは、より正確で効率的な AI アルゴリズムを生成するのに役立ち、よりスマートな意思決定が可能になります。

トレーニングデータとテスト結果

成功する AI アルゴリズムはすべて、トレーニング データに基づいて構築されます。ただし、ビジネス要件を満たすためのデータの調達は、特にそれらの要件に大衆市場のニーズを満たすことが含まれる場合、ロジスティクスとオーバーヘッドの面で大きな課題をもたらす可能性があります。

開発者、ソフトウェア エンジニア、品質保証スペシャリストで構成される社内チームは、通常、同じ年齢、性別、経歴の人で構成されます。バイアスは、データの収集とデータのラベル付けの際によく発生します。したがって、AI アルゴリズムを構築するときは、アルゴリズムのトレーニングに使用するデータの提供を 1 人の人物またはグループに依存しないことが最善です。アルゴリズムを適切にトレーニングするには、さまざまな種類のデータと入力が必要です。

AI アルゴリズムに、最終的にサービスを提供する顧客に近い人々や体験を提供するモデルを使用する方が効率的です。企業はこのモデルを使用して、実際の状況に対応し、偏見が発生する場所を検出し、その潜在的な影響を軽減するためのアルゴリズムをトレーニングできます。

コミュニティ構築アルゴリズム

トレーニング データの取得と実装が成功するかどうかは、データ自体の量、品質、多様性によって決まります。企業がこのデータを取得して処理する唯一の方法は、多様な参加者を活用することです。企業は、性別、民族、母国語、場所、スキル、地理、その他の適用可能なフィルターなど、特定の人口統計情報を提供するコミュニティから選択できる必要があります。

実際、効果的なアルゴリズムを開発するには大量のデータが必要です。ほとんどの企業には、大規模なデータを取得する能力がありません。新しいソフトウェアやサービスを提供するには、専用のリソースからのサポートが必要です。メディアおよび放送サービス向けのインテリジェント音声アシスタントをトレーニングする最近のプロジェクトでは、100,000 を超えるさまざまな音声が必要でした。これらの発話は最終的に、アルゴリズムをトレーニングするために遠隔で集められた 972 人の人間によって提供されました。驚くべき偉業は、音声は研究室である程度までシミュレートできるものの、AI がさまざまな実際の声やアクセントにさらされる必要があることです。

スピーチトレーニングはカリキュラムのほんの一面にすぎません。クラウドソーシング ソリューションは、企業が手書き文書を読み取るための AI アルゴリズムをトレーニングするのにも役立ちます。最近の別のプロジェクトでは、何千もの手書きサンプルが必要でした。もう一度言いますが、アルゴリズムには可能な限り幅広い固有のサンプルが必要なので、量が重要な要素となります。 1,000 人を超える参加者がリモートで集まり、手書きの文書を配布し、さまざまなコンテンツに対する需要に応えました。

公正な結果

AI の最終結果の精度を低下させる可能性のある意図しないバイアスを除去することが重要です。完璧になることは決してありませんが、AI は継続的に学習し、最良のマシン モデルは大規模で多様なデータ セットに基づくものになります。最善の戦略は、量、品質、多様性を提供するプールからトレーニング データを取得することです。トレーニング データに多様性がない場合、アルゴリズムは幅広い可能性を認識できず、アルゴリズムは効果がありません。リモート コミュニティにより、企業はこのデータにアクセスし、社内の開発およびテスト機能を補完できます。クラウドソーシングによるテストは、音声、テキスト、画像、生体認証を学習および認識する AI アルゴリズムのトレーニングに使用でき、さまざまな顧客セグメントのニーズを満たす強力な出力を企業に提供します。

<<:  インテリジェントビル通信システムの構成と要件

>>:  AIと機械学習が克服すべき3つのハードル

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Node.jsを使用してテキストコンテンツをセグメント化し、キーワードを抽出する

Zhongcheng が翻訳した記事にはタグが付けられています。ユーザーはタグに基づいて興味のある記...

AIの過去と現在を理解するのに役立つ、60年間の技術の簡単な歴史

[[269852]]人類の進化の歴史は、人類が道具を作り、使用してきた歴史です。さまざまな道具は人類...

自動運転車の長所と短所

長年にわたる技術の進歩により、交通はより便利になりました。 IoT アプリケーションなどの自動車技術...

人工知能が製造業のデジタル変革を推進

製造業における人工知能がデジタル変革を推進製造業における人工知能はデジタル変革を可能にし、より効果的...

...

AIは金融犯罪者と戦う技術である

犯罪の手法がより巧妙になるにつれ、マネーロンダリングとの戦いは世界中のすべての金融機関にとって大きな...

Javaの組み込みソートアルゴリズムをどうやって克服したか

Java 8 では、組み込みのソート アルゴリズムが大幅に最適化されました。整数やその他のプリミティ...

中国の人工知能チップ市場の分析と展望

技術の進歩はあらゆる産業革命の原動力となってきましたが、人類社会は人工知能技術の進歩により、いわゆる...

...

AI システムを監査する際に尋ねるべき 9 つの質問

翻訳: ブガッティ企画:千山ほとんどの企業は、記録システムの IT 監査を毎年実施しています。しかし...

...

GoogleはAIを使って「ヘッドフォンケーブル」をトレーニングし、タッチスクリーンのほとんどの機能を実現

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

人工知能はどれくらい普及しているのでしょうか?国内初となる人工知能講座が小中学校で実施されました!

5月5日、教育部が主催する第3回全国基礎教育情報化応用展示会・交流活動において、北京市朝陽区で人工...