米パデュー大学の調査によると、OpenAIが開発した人工知能チャットボット「ChatGPT」は、ソフトウェアプログラミングの質問に答える際に誤り率が半分以上あり、質問者の3分の1を騙す可能性があることが判明した。 研究チームは、Stack Overflow ウェブサイト上の 517 件の質問に対する ChatGPT の回答を分析し、その正確性、一貫性、包括性、簡潔性を評価しました。また、回答の言語と感情の分析を実施し、12人のボランティア参加者を対象にアンケート調査を実施しました。調査報告書では、 ChatGPT の回答の言語スタイルは良好であったものの、回答の 52% が誤りであり、77% が長すぎると結論付けられました。参加者は、明らかな場合のみ、回答の誤りを認識することができました。そうしないと、ChatGPT のフレンドリーで権威があり、詳細な言語スタイルに惑わされてしまいます。 Stack Overflow は、プログラマー向けの質疑応答サービスを提供する Web サイトであり、開発者がコード スニペットを入手して問題を解決するための重要な情報源と考えられています。しかし、近年、同サイトはトラフィックの減少、コンテンツの質の低下、ユーザーの信頼の低下といった問題にも直面している。 SimilarWebの4月のレポートによると、同サイトの月間トラフィックは2022年1月以降6%減少し、3月には13.9%減少しており、その減少の理由の1つはChatGPTだった可能性がある。 Stack OverflowはSimilarWebの評価に異議を唱え、そのトラフィックは検索アルゴリズムとChatGPTへの関心の高まりの影響を受けたと述べた。 OpenAIは、自社のChatGPTウェブサイトで、同社のソフトウェアが「人物、場所、事実について不正確な情報を生成する可能性がある」と認めた。記事執筆時点で、同社はまだパデュー大学の研究に反応していない。 |
<<: もう終わりですか? LK-99は単なる強磁性体であり、超伝導体ではない。北京大学などの研究論文が発表された。
コンピューター ビジョン モデルのパフォーマンスが低下する理由は、アーキテクチャ設計上の欠陥、代表的...
大型模型の分野では、トランスフォーマーが全容を一手に引き受けています。しかし、モデルのサイズが拡大し...
十分なデータがあれば、愛する人が亡くなった後でも、その人の意識を生かし続けることができます。それは何...
大型モデルが再び「爆発」した。昨夜、法律モデルChatLawがZhihuのホット検索リストのトップに...
COVID-19が世界を席巻したとき、人工知能はなぜ大きな空白を埋めることができるのか?教育、セキュ...
近年、教師あり学習によるディープラーニングも大きな成功を収めています。画像分類から言語翻訳まで、その...
[[399217]]この記事はWeChatの公開アカウント「Zhibin's Python...
人工知能は複雑な囲碁のゲームでは簡単に人間に勝つことができますが、科学的な発見に役立つのでしょうか?...
建設業界へのドローンの導入は、高度な建設手順を合理化することで業界に大きな変化をもたらしました。建設...
2023年は大きな言語モデルと着実な普及の年です。時系列の分野ではそれほど大きな成果は得られていませ...
最新世代の言語モデル (特に GPT-4、PaLM、LLaMa) は、自然言語処理と生成の限界を押し...
ご存知のとおり、オープンソースの大規模言語モデル (LLM) とその派生モデル (LLaMA や V...
数年間この業界に携わってきたデータ サイエンティストとして、私は LinkedIn や QuoLa ...
新型コロナウイルスは間違いなく2020年で最もホットな話題であり、流行の防止はすべての国にとって最優...