調査によると、ChatGPTはプログラミングの質問に答える際に50%以上のエラー率があることが判明

調査によると、ChatGPTはプログラミングの質問に答える際に50%以上のエラー率があることが判明

米パデュー大学の調査によると、OpenAIが開発した人工知能チャットボット「ChatGPT」は、ソフトウェアプログラミングの質問に答える際に誤り率が半分以上あり、質問者の3分の1を騙す可能性があることが判明した。

研究チームは、Stack Overflow ウェブサイト上の 517 件の質問に対する ChatGPT の回答を分析し、その正確性、一貫性、包括性、簡潔性を評価しました。また、回答の言語と感情の分析を実施し、12人のボランティア参加者を対象にアンケート調査を実施しました。調査報告書では、 ChatGPT の回答の言語スタイルは良好であったものの、回答の 52% が誤りであり、77% が長すぎると結論付けられました。参加者は、明らかな場合のみ、回答の誤りを認識することができました。そうしないと、ChatGPT のフレンドリーで権威があり、詳細な言語スタイルに惑わされてしまいます。

Stack Overflow は、プログラマー向けの質疑応答サービスを提供する Web サイトであり、開発者がコード スニペットを入手して問題を解決するための重要な情報源と考えられています。しかし、近年、同サイトはトラフィックの減少、コンテンツの質の低下、ユーザーの信頼の低下といった問題にも直面している。 SimilarWebの4月のレポートによると、同サイトの月間トラフィックは2022年1月以降6%減少し、3月には13.9%減少しており、その減少の理由の1つはChatGPTだった可能性がある。 Stack OverflowはSimilarWebの評価に異議を唱え、そのトラフィックは検索アルゴリズムとChatGPTへの関心の高まりの影響を受けたと述べた。

OpenAIは、自社のChatGPTウェブサイトで、同社のソフトウェアが「人物、場所、事実について不正確な情報を生成する可能性がある」と認めた。記事執筆時点で、同社はまだパデュー大学の研究に反応していない。

<<:  もう終わりですか? LK-99は単なる強磁性体であり、超伝導体ではない。北京大学などの研究論文が発表された。

>>: 

ブログ    
ブログ    

推薦する

CV モデルが動作しないのはなぜですか?理由がこんなに単純だとは思いませんでした...

コンピューター ビジョン モデルのパフォーマンスが低下する理由は、アーキテクチャ設計上の欠陥、代表的...

...

トランスフォーマーに挑むマンバの起源とは?著者の博士論文はSSMの進化の道筋を明らかにしている

大型模型の分野では、トランスフォーマーが全容を一手に引き受けています。しかし、モデルのサイズが拡大し...

AIを使って死後の意識を蘇らせることは信頼できるのか?デジタル不滅には経済計算が必要

十分なデータがあれば、愛する人が亡くなった後でも、その人の意識を生かし続けることができます。それは何...

北京大学の法律モデルChatLawがサーバー爆発:張三の裁判方法を教えます

大型モデルが再び「爆発」した。昨夜、法律モデルChatLawがZhihuのホット検索リストのトップに...

ソフトウェアは世界を飲み込んでいるが、AIはソフトウェアを飲み込んでいる

COVID-19が世界を席巻したとき、人工知能はなぜ大きな空白を埋めることができるのか?教育、セキュ...

自己教師あり学習の概要と3つの主要分野における現状

近年、教師あり学習によるディープラーニングも大きな成功を収めています。画像分類から言語翻訳まで、その...

自然言語処理ライブラリ - Snownlp

[[399217]]この記事はWeChatの公開アカウント「Zhibin's Python...

AIが科学研究を「行う」ことを学習し、ネイチャー誌に発表。知湖ネットユーザー:水を見るのは耐えられない

人工知能は複雑な囲碁のゲームでは簡単に人間に勝つことができますが、科学的な発見に役立つのでしょうか?...

建設業界におけるドローン

建設業界へのドローンの導入は、高度な建設手順を合理化することで業界に大きな変化をもたらしました。建設...

時系列予測におけるディープラーニングの概要と今後の方向性の分析

2023年は大きな言語モデルと着実な普及の年です。時系列の分野ではそれほど大きな成果は得られていませ...

スタンフォード大学とOpenAIがメタプロンプティングを提案し、最も強力なゼロショットプロンプティング技術が誕生した。

最新世代の言語モデル (特に GPT-4、PaLM、LLaMa) は、自然言語処理と生成の限界を押し...

大規模モデルは16,000以上の実世界のAPIを習得しており、清華大学などのToolLLMのツール使用能力はChatGPTに劣らない。

ご存知のとおり、オープンソースの大規模言語モデル (LLM) とその派生モデル (LLaMA や V...

データサイエンティストにとって最も重要なアルゴリズムと統計モデル

数年間この業界に携わってきたデータ サイエンティストとして、私は LinkedIn や QuoLa ...

人工知能は伝染病との戦いにおいてどのような役割を果たすのでしょうか?

新型コロナウイルスは間違いなく2020年で最もホットな話題であり、流行の防止はすべての国にとって最優...