アマゾン、AIが女性の求職者に低い評価を与えたため研究チームを解散に追い込まれる

[[246043]]

アマゾンの機械学習チームは2014年以来、優秀な人材の求職活動をよりスマートにすることを目指して、求職者の履歴書を審査するコンピュータープログラムを秘密裏に開発し、使用してきた。しかし、アマゾンは昨年初め、新しい採用システムが女性に有利ではないことを専門家が発見したことを受けて、最終的に研究チームを解散した。

効率性向上の必要性が機械学習の応用を推進する

自動化は、倉庫内と価格決定の両方において、Amazon の電子商取引における優位性の鍵となっている。低コストのコンピューティング能力の普及により、テクノロジー分野では機械学習の人気が高まっています。アマゾンのスマート採用の実験は、世界最大のオンライン小売業者にとって重要な時期に始まる。

規制当局への提出書類によると、アマゾンの全世界の従業員数は2015年6月以降3倍以上に増え、57万人を超えた。人事部門の増大する作業負荷を軽減し、業務効率を向上させるため、アマゾンのエディンバラエンジニアリングセンターは、ネットワーク情報を素早く把握し、採用する価値のある候補者を見つける人工知能技術の開発を目標とした研究開発チームを設立しました。

同社の実験的な採用ツールは、買い物客がアマゾンで販売されている製品を評価するのと同様に、人工知能を使用して求職者を1つ星から5つ星のスケールで評価します。研究者たちは、この採用ソフトウェアが「100件の履歴書をソフトウェアに入力すると、上位5件が吐き出され、企業はそれらの候補者を優先的に採用できる」という目標を達成できることを期待している。

人工知能採用ソフトウェアは女子より男子を優遇

アマゾンのコンピューターモデルは、過去10年間に同社に提出された履歴書を研究し、固有のパターンを特定し、それを使用して応募者を審査するように訓練された。しかし、2015年以降、アマゾンは、ソフトウェア開発やその他の技術職の応募者を評価する際に、自社の採用システムが性別に中立的ではないことに気づいた。応募者の大多数が男性だったため、これはテクノロジー業界全体における男性優位の現実を反映しています。

研究チームは、特定の職務と役職に焦点を当てた 500 個のコンピュータモデルを作成しました。彼らは各モデルに、過去の応募者の履歴書に登場した約5万語の用語を認識するように教えました。これらのアルゴリズムは、さまざまなコンピュータコードを書く能力など、IT アプリケーションで一般的に求められるスキルにはほとんど意味を持ちません。代わりに、このテクノロジーは、「実行した」や「捉えた」など、男性のエンジニアの履歴書によく見られる動詞を使って自分自身を説明する候補者を優遇します。

実際、アマゾンのシステムは、男性の候補者が望ましいという結論を自ら学習した。この制度では、「女子チェスクラブのキャプテン」など、「女性」という言葉を含む履歴書は不利になった。この制度により、女子大学2校の卒業生の評価も引き下げられた。

Amazon は、特定の用語に対して中立的になるようにプログラムを更新しようと努めてきました。しかし、だからといって機械が差別的となる可能性のある方法で候補者を分類しないという保証にはならない。

性別による偏見だけが問題なわけではない。モデルの判断を裏付けるデータにも欠陥があり、不適格な候補者がさまざまな仕事に推薦されることが多かった。アマゾンは、幹部らがプロジェクトへの信頼を失ったため、昨年初めに最終的にチームを解散した。

アルゴリズムの公平性への道のりはまだ長い

人材ソフトウェア会社キャリアメーカーが2017年に実施した調査によると、米国の人事マネージャーの約55%が、今後5年以内に人工知能が仕事の日常的な一部になると答えています。

雇用主は長い間、テクノロジーを活用して採用網を広げ、人間の採用担当者の主観的な意見への依存を減らすことを夢見てきました。しかし、アマゾンの失敗は、採用プロセスの自動化を目指す大企業の増加に教訓を与えている。

カーネギーメロン大学の機械学習の専門家は、アルゴリズムが公平で、真に理解可能で、説明可能であることを保証するにはまだ長い道のりがあると述べた。

MITテクノロジーレビューは、この事件に関する報告書の中で、人工知能は本質的に偏りのないものとみなすことはできないと指摘した。偏ったデータでシステムをトレーニングすると、アルゴリズムも偏ることになります。このような不公平な AI 採用計画が実施される前に検出されなければ、ビジネスにおける長年の多様性の問題は解決されるどころか、永続化してしまうでしょう。

<<: Keras または TensorFlow?プログラマーはディープラーニングフレームワークをどのように選択すべきでしょうか?

>>: データサイエンスプロジェクトに Scikit-learn Python ライブラリを使用する方法