ヘルスケアにおける機械学習の悪影響

Marzyeh Ghassemi 助教授は、医療データに隠れたバイアスが人工知能のアプローチにどのように影響するかを調査します。

Marzyeh Ghassemi 氏は、MIT でコンピューターサイエンスの学位を取得しながら、人工知能の機械学習技術を臨床データに適用して患者の転帰を予測する方法に関する論文をいくつか執筆しました。「博士課程の終わりになって初めて、委員会のメンバーの一人が『あなたのモデルがさまざまな集団でどのように機能するかを確認したことがありますか?』と尋ねました。」

この質問は、以前にすべての患者モデルの全体的なパフォーマンスを評価したことがあるガセミ氏にとって目から鱗が落ちるような内容でした。さらに詳しく調べてみると、黒人女性の出身グループではモデルの働き方が異なること、さらに悪いこともあることに彼女は驚いた。「健康格差がそのままモデルの違いにつながるとは、事前には考えていませんでした」と彼女は語った。「私はMITの女性少数派コンピューター科学者なので、他の多くの人もこのことに気づいていないと考えるのが妥当です。」

1月14日にPatterns誌に掲載された論文の中で、ガセミ氏（2017年に博士号を取得し、現在はMITの電気工学・コンピューターサイエンス学部と医療工学科学研究所（IMES）の助教授）とボストン大学の共著者であるエレイン・オカニエン・ンソエシー氏は、医療におけるAI利用の見通しについて警告を発している。「この技術を慎重に使用すれば、医療パフォーマンスを向上させ、不平等を減らすことができる可能性がある」とガセミ氏は指摘する。「しかし、注意しなければ、この技術は医療を悪化させる可能性がある。」

AI は大量のデータを処理および分析することで自らをトレーニングすることが多いため、すべてはデータに帰着します。しかし、医師が得るデータは気まぐれな人間によって生成されたものであり、医師が知らないうちに、医師が関わる患者の年齢、性別、人種によって判断が曇ってしまう可能性がある。

さらに、病状そのものについては依然として大きな不確実性が残っています。「同じ医学部で10年間研修を受けた医師でも、患者に対する診断結果が一致しないことが多い」とガセミ氏は言う。これは、物体認識タスクなどの機械学習アルゴリズムの既存のアプリケーションとは異なります。なぜなら、世界中のほとんどの人が犬は犬であることに同意するからです。

機械学習アルゴリズムは、ルールと「勝利条件」が明確に定義されているチェスや囲碁などのゲームをマスターする際にも優れたパフォーマンスを発揮します。しかし、医師たちは患者を治療するためのルールについて必ずしも同意しているわけではなく、「健康」の基準についても広範な合意が得られていない。「医師は病気がどういうことか知っています」とガセミ氏は説明した。「私たちは、最も病気のときの人々に関するデータを最も多く持っています。しかし、健康な人に関するデータはそれほど多くありません。なぜなら、人々は健康なときには医師の診察を受ける可能性が低いからです。」

機械的な装置であっても、データのギャップや処理の矛盾が生じる可能性があります。たとえば、パルスオキシメーターは主に肌の色の薄い人向けに調整されており、肌の色の濃い人の血中酸素濃度を正確に測定することはできません。これらの欠乏症は、酸素レベルが低いときに最も深刻になり、正確な測定値が最も重要になります。同様に、金属対金属の人工股関節置換術では、女性はより大きなリスクに直面する、とガセミとンソエシは書いている。「その理由の一部は、インプラントの設計において解剖学的な違いが考慮されていないためだ」。こうした事実は、コンピューターモデルに入力されたデータに隠れている可能性があり、その結果が損なわれる可能性がある。

ガセミ氏は、機械学習アルゴリズムの成果物はコンピューターから得られるものであり、それが「客観性のかすかな光」をもたらすと述べた。しかし、これは欺瞞的で危険な場合があります。なぜなら、コンピューターに入力される大量のデータ内のエラーを見つけることは、無能な可能性のある（あるいは人種差別的な）医師のアドバイスを無視することよりも難しいからです。「問題は機械学習そのものではない」と彼女は主張した。「それは人間です。人間の介護者は完璧ではないため、悪いデータを生成することがあります。」

それでも彼女は、機械学習が医療においてより効果的で公平な推奨と実践につながると信じています。ヘルスケアにおける機械学習の可能性を実現するための鍵は、データ品質を向上させることですが、これは簡単なことではありません。「最も優れた成績を収めている医師からデータを集め、それを訓練や経験の少ない他の医師と共有できたらどうなるか想像してみてください」とガセミ氏は言う。「私たちはこのデータを収集し、監査する必要があるのです。」

ここでの課題は、データ収集に対するインセンティブや報酬がないことだ、と彼女は指摘した。「このための資金を調達したり、学生に時間を費やすよう依頼したりするのは簡単ではありません。データ提供者は『データを何百万ドルで企業に販売できるのに、なぜ無料でデータを配布しなければならないのか』と言うかもしれません。しかし研究者は『私の機関のデータにアクセスするには、どのようなライセンスを取得する必要がありますか』といった質問に悩まされることなく、データにアクセスできる必要があります。」

「より良い医療を実現する唯一の方法は、より良いデータを入手することです」とガセミ氏は言う。「そして、より良いデータを入手する唯一の方法は、データの公開を奨励することです。」

それは単なるデータ収集の問題ではありません。誰がデータを収集し、レビューするかという問題もあります。ガセミ氏は、臨床医、統計学者、医療倫理学者、コンピューター科学者など多様な研究者グループを招集し、まず多様な患者データを収集し、次に「1つの高度な医療現場だけでなく、幅広い医療現場に展開できる公平で合理的な医療改善策の開発に重点を置く」ことを推奨している。

彼女は、この記事の目的は、技術者が機械学習の専門知識を医療に持ち込むことを阻止することではないと述べた。「特定のコンピュータモデルを承認する前に、生じつつある治療上のギャップと、考慮すべきその他の複雑な要因を認識するだけでよいのです。」

<<: 興味深い微表情とAI技術

>>: アンドリュー・ン：AIはビッグデータから「スモールデータ」に移行する時が来た