研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者らがチャットボットGPT-4と高度なデータ分析ツールADAを使用して、「未確認」の科学的主張を裏付けるための偽の臨床試験データセットを作成したと報じた。

IT ホーム 注: ADA は、統計分析を実行し、視覚的なデータを作成するために使用できる、Python と組み合わせたモデルです。

報道によると、論文の著者らは、GPT-4とADAに角膜炎患者のデータセットを生成し、「視力と眼の画像検査の点では、深部前角膜移植術(DALK)の方が全層角膜移植術(PK)よりも優れている」という結論を裏付けるよう依頼したという。

AIが生成したデータには、男性参加者160人と女性参加者140人の実験結果が含まれており、上記の結論を裏付けましたが、この結果は実際の臨床試験で示された結果とは一致しませんでした

専門家らは偽造データセットを詳細に調査し、明らかな捏造の兆候を発見した。 「少なくとも表面的にはもっともらしく見えるデータセットを作成するのは簡単だ。そして、訓練を受けていない目には、それが本物のデータセットに『違いない』と映る」と、英国マンチェスター大学の生物統計学者ジャック・ウィルキンソン氏は言う。

研究の著者らは、データセットを「綿密に調べた結果」には欠陥があったことを認めたが、データセットをざっと見ただけでは、データ内の人間以外の情報源を「特定するのは困難」になるだろうと述べた。

AIによって捏造された「信頼できるデータ」により、研究者やジャーナル編集者の間で学術研究の誠実性に対する懸念が高まっている。ジャーナル「EMBO Reports」の編集長ベルント・プルベラー氏は、「現実世界の査読では、データの包括的な再分析が行われないことが多く、そのため、AIを使用して慎重に設計された整合性の抜け穴を検出する可能性は低い」と述べた。同氏、ジャーナルはAIによって生成された合成データを識別するために品質チェックを更新する必要があると付け加えた。

<<:  チャットボット開発の三銃士: LLAMA、LangChain、Python

>>: 

ブログ    
ブログ    

推薦する

今後 20 年以内に、完全自動運転のコネクテッドカーが登場するでしょうか?

20 年後の旅行と交通の未来はどうなるでしょうか? おそらく、この質問への答えははるかに複雑です。...

人工知能は人類のより良い生活を可能にする

新世代人工知能の活発な発展は、科学技術革新と産業のアップグレードと変革の産業推進の焦点となり、経済社...

LeCun 氏と xAI 共同創設者の衝突: GPT-4 の主要な推論欠陥に対する解決策はないのか?ネットユーザー:人間も「ランダムなオウム」

最近、ルカン氏を含む一群の大物が再びLLMを攻撃し始めた。最新のブレークスルーは、LLM にはまった...

人工知能の簡単な歴史 | (2)ディープラーニング、人工知能の新たな盛り上がり

ヤネン・ルカンと畳み込みニューラルネットワークヒントン教授の話をした後は、ディープラーニング分野のも...

ガートナー: 2020 年の人工知能の成熟度曲線、どのテクノロジーが価値があるか

1. ガートナー: 2018 年から 2020 年までの AI 成熟度曲線の概要最近、世界的に有名な...

インテリジェントな人間とコンピュータの相互作用とは何ですか?

これは非常に興味深い質問であり、知性と人間とコンピューターの相互作用の両方が関係しており、さらに重要...

...

農業用トラクターと自動運転技術が出会うとき

ラスベガスで開催された2022年コンシューマーエレクトロニクスショー(CES)で、ジョンディアは、ジ...

「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた

アドビの共同創業者ジョン・ワーノック氏が19日、82歳で亡くなった。本日、Adobe は公式に発表を...

ヘルスケア AI が有用であることをどうやって保証するのでしょうか?

ヘルスケアビジネスの大局において、予測モデルは血液検査、X 線検査、MRI と同じ役割を果たします。...

...

少なくとも 8 つのトップカンファレンス論文! NvidiaのLLM研究科学者の求人数は非常に多く、元Google Brainの科学者を驚かせるほどである。

機械学習の分野で仕事を見つけるのはどれくらい難しいですか? NVIDIA の大規模モデル研究科学者の...

ByteDance Wanka Cluster の技術詳細が明らかに: GPT-3 トレーニングが 2 日間で完了、コンピューティング パワーの使用率は Nvidia Megatron-LM を上回る

Sora のテクノロジーの分析が進むにつれて、 AI インフラストラクチャの重要性がますます明らかに...

インタビュアー: 負荷分散アルゴリズムを理解していますか?

前回の記事では、ポーリング、ランダム、最小接続の 3 つの負荷分散アルゴリズムについて説明しました。...

人工知能に関する長期的および短期的な懸念

人工知能(AI)技術の発展により、いつか「超人」的なAIが出現する日は来るのでしょうか?もしそうなれ...