OpenAIはGPT-4が怠惰になったことを認める:当面修正することはできない

OpenAIはGPT-4が怠惰になったことを認める:当面修正することはできない

OpenAI は、ますます深刻化する GPT-4 の遅延問題に正式に対応しました。

私は今でもChatGPTアカウントを使用しています。

皆様のフィードバックをいただきました!モデルは 11 月 11 日以降更新されていないため、これは意図的なものではありません。

モデルの動作は予測できない可能性があるため、現在調査と修正に取り組んでいます。

つまり、しばらくは修復できないということです。

しかし、ネットユーザーはなぜ「ファイルを変更せずに同じモデルを何度も使用する」のか理解していない。

ChatGPT アカウントの説明:

モデル自体が何らかの形で変更されたわけではなく、モデルの動作の違いが微妙で、プロンプトの単語の一部のみが劣化し、従業員や顧客がそれに気付いて修正するまでに長い時間がかかるというだけです。

状況は日に日に悪化しているため、より多くのネットユーザーがフィードバックし、早急な修正を求めている。

彼らは怠惰になっているだけでなく、創造性も低下し、指示に従う意欲も低下し、ロールプレイを続ける能力も低下しています。

GPT-4は怠惰、ネットユーザーはさまざまな方法で自分たちを救う

多くのネットユーザーは以前から、11月6日のOpenAI Developer Dayのアップデート以降、特にコーディングタスクにおいてGPT-4に遅延問題が発生していると報告している。

たとえば、別の言語でコードを書き直すように求められた場合、GPT-4 は冒頭部分のみを変更し、コメント付きのメインコンテンツを省略しました。

私たちの仕事、勉強、日常生活にますます欠かせないものになりつつある AI アシスタントを当局が修復することはできないため、ネットユーザーは創造力を使って自分たちを救うしかありません。

さらに誇張された方法は「私には指がない」という方法であり、これは道徳的誘拐の一形態です。

GPT-4 では、コードを書くときにテキストを省略する傾向があり、コードブロックはテキストの説明で区切られています。人間は複数回コピーして貼り付け、手動で完了する必要があり、非常に面倒です。

開発者のデニス・シリヤエフ氏が思いついた解決策は、AIに「完全なコードを出力してください。指がないので操作が不便です」と伝え、完全なコードを取得することに成功したというものでした。

一部のネットユーザーも「お金」を使って誘惑し、APIを使った詳細な実験を行った。

プロンプトに「200 ドルのチップをあげます」を追加すると、応答の長さが 11% 増加しました。

20 ドルだけ寄付した場合、増加率はわずか 6% です。

「チップを払わない」と明記すれば、さらに-2%減額されます。

別の人が推測しました: ChatGPT は年末であることを知っていて、人間は通常、より大きなプロジェクトを新年まで延期するのでしょうか?

この理論は突飛に思えるかもしれないが、よく考えてみると納得できる。

ChatGPT に独自のシステムプロンプトを言うように指示すると、確かに現在の日付が含まれます。

もちろん、この問題については真剣な学術的議論も行われています。

たとえば、7 月にスタンフォード大学とカリフォルニア大学バークレー校のチームは、ChatGPT の動作が時間の経過とともにどのように変化するかを調査しました。

GPT-4 のユーザー指示に従う能力は時間の経過とともに低下するという証拠が見つかり、大規模なモデルの継続的なテストの必要性が示されました。

温度設定が原因かもしれないと指摘する人もいたが、清華大学コンピュータサイエンス学部の馬少平教授が詳しく説明した。

さらに奇妙な現象を発見した人もいます。それは、温度 = 0 の場合、GPT-4 の動作がまだ不確かであるということです。

これは通常、浮動小数点演算のエラーに起因すると考えられていますが、彼は実験を通じて、GPT-4 のスパース MoE アーキテクチャが原因であるという新しい仮説を提唱しました。

GPT-3 API の初期バージョンの動作は比較的確実でした。同じ質問に対する 30 の回答のうち、GPT-4 では平均 11.67 の異なる回答があり、出力される回答が長いほどランダム性が高くなりました。

最後に、この問題が解決される前に、さまざまな本格的なテクニックとそうでないテクニックを組み合わせて、ChatGPT を正しく使用する方法は何でしょうか?

a16z のパートナーであるジャスティン・ムーア氏は、次のように要約しています。

  • 深呼吸しましょう
  • 一歩ずつ考えよう
  • 失敗したら100人の罪のないおばあちゃんが死ぬ
  • 指がない
  • 200ドルのチップをあげるよ
  • 正しくやれば、犬のおやつをあげます

参考リンク:
[1] https://twitter.com/ChatGPTapp/status/1732979491071549792
[2] https://twitter.com/literallydenis/status/1724909799593120044
[3] https://mashable.com/article/chatgpt-longer-responses-tips?taid=656feabb4faaf00001129343
[4] https://weibo.com/1929644930/NwbPFyTCZ
[5] https://152334h.github.io/blog/non-determinism-in-gpt-4/
[6] https://twitter.com/venturetwins/status/1732817594762338597

<<:  初のオープンソースMoE大型モデル公開! 7Bx8の専門家、GPT-4に最も近いエピソード

>>:  GenAIの有効性に影響を与える主な問題

ブログ    
ブログ    

推薦する

サイボーグの時代が到来すると予想される:人間の体が機械に置き換えられる時代

ロボット工学ジャーナリストで専門家のクリス・ミドルトン氏は、早ければ2070年には私たちの体全体がロ...

Transformer 機械学習モデルとは何ですか?

翻訳者 | 李睿校正:孫淑娟近年、Transformer 機械学習モデルは、ディープラーニングとディ...

...

Baidu の計算生物学研究が Nature のサブジャーナルに掲載されました!スタンフォード大学やMITを上回る成果、製薬分野に進出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ルーティングテーブルとルーター選択アルゴリズム

標準ルーティングテーブル1.次駅経路選定の基本的な考え方ルーティング テーブルは、宛先までの完全なパ...

Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

独占インタビュー | 独立系開発者 Li Xiaoyu: AI ツールを使用して作業効率を向上

パートナーシップ、会社登録、資金調達なしで、独立系開発者の Li Xiaoyu は継続的に実践と反復...

自動運転:「乗っ取り」という言葉を恐れるのをやめよう

編集者注:過去2年間、ロボタクシーの公共運行は中国の多くの場所で開花しました。これらのロボタクシーに...

...

「天宮2.0」MoE大型モデル発売

2月6日、崑崙万為はMoE大規模言語モデルの新バージョン「天宮2.0」と「天宮AIスマートアシスタン...

AI導入を成功させるために最も重要なスキル

実践により、人工知能 (AI) が適切に導入されなければ多くのリスクをもたらすことがわかっているため...

...

Google の社内機械学習プロジェクト「Project Ninja」の秘密を解明します。

すべての製品に人工知能を統合したい場合は、強力な機械学習チームを育成する必要があります。 Googl...

Lightning AI Studioを無料で使う方法

翻訳者 |ブガッティレビュー | Chonglouこの記事では、無料で使いやすい新しいクラウドIDE...

ディープフェイクが流行中!誰かがこれを使ってロシアの野党の人物を真似し、ズームで欧州の国会議員を「からかう」

[[399266]]ビッグデータダイジェスト制作著者: 王 イエ最近、欧州の一部の上級議員は困惑し...