ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者らがチャットボットGPT-4と高度なデータ分析ツールADAを使用して、「未確認」の科学的主張を裏付けるための偽の臨床試験データセットを作成したと報じた。 IT ホーム 注: ADA は、統計分析を実行し、視覚的なデータを作成するために使用できる、Python と組み合わせたモデルです。 報道によると、論文の著者らは、GPT-4とADAに角膜炎患者のデータセットを生成し、「視力と眼の画像検査の点では、深部前角膜移植術(DALK)の方が全層角膜移植術(PK)よりも優れている」という結論を裏付けるよう依頼したという。 AIが生成したデータには、男性参加者160人と女性参加者140人の実験結果が含まれており、上記の結論を裏付けましたが、この結果は実際の臨床試験で示された結果とは一致しませんでした。 専門家らは偽造データセットを詳細に調査し、明らかな捏造の兆候を発見した。 「少なくとも表面的にはもっともらしく見えるデータセットを作成するのは簡単だ。そして、訓練を受けていない目には、それが本物のデータセットに『違いない』と映る」と、英国マンチェスター大学の生物統計学者ジャック・ウィルキンソン氏は言う。 研究の著者らは、データセットを「綿密に調べた結果」には欠陥があったことを認めたが、データセットをざっと見ただけでは、データ内の人間以外の情報源を「特定するのは困難」になるだろうと述べた。 AIによって捏造された「信頼できるデータ」により、研究者やジャーナル編集者の間で学術研究の誠実性に対する懸念が高まっている。ジャーナル「EMBO Reports」の編集長ベルント・プルベラー氏は、「現実世界の査読では、データの包括的な再分析が行われないことが多く、そのため、AIを使用して慎重に設計された整合性の抜け穴を検出する可能性は低い」と述べた。同氏は、ジャーナルはAIによって生成された合成データを識別するために品質チェックを更新する必要があると付け加えた。 |
<<: チャットボット開発の三銃士: LLAMA、LangChain、Python
[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使...
機械学習は、ビジネスを急速に成長させたい小売業者にとって急速に必要不可欠なものになりつつありますが、...
編集者注: Chentao CapitalのエグゼクティブゼネラルマネージャーであるHe Xiong...
現在の科学技術分野で最もホットな技術の一つとして、人工知能は業界内外の多くの人々の注目を集めています...
昨年後半から、インターネット業界の人々は生活がますます困難になっていると感じています。かつてセルフメ...
この記事では、モデルのパフォーマンスを評価する際のデータ漏洩の問題と、データ漏洩を回避する方法につい...
庚子年の初めに、突然の疫病が中国全土に広がり、人々は突然「2003年を夢見ている」ような気分になった...
[[248841]]マイクロソフトの創業者で、現在は自身の財団を通じて慈善事業にも取り組んでいるビル...
人工知能は、人間の知能の拡張と拡大をシミュレートするための理論、方法、技術、アプリケーション システ...
衛星から都市計画まで、人工知能の進歩は新たな洞察をもたらしています。 [[270081]]宇宙技術と...
[[327734]]ユーザーポートレートに基づいた広告は、広告効果を最適化し、精密なマーケティングを...
人工知能は組織内で大きな変化をもたらしますが、変化とともに、AI が仕事を奪ってしまうのではないかと...