GPT-4の知能は突然低下した。OpenAIがアーキテクチャを再設計し、コストを削減して効率を高めるためにMOEを使用したことが明らかになった。公式の噂は否定されたが、ネットユーザーはそれを信じなかった。

GPT-4の知能は突然低下した。OpenAIがアーキテクチャを再設計し、コストを削減して効率を高めるためにMOEを使用したことが明らかになった。公式の噂は否定されたが、ネットユーザーはそれを信じなかった。

最近、多くの OpenAI ユーザーから、GPT-4 が愚かになったという報告がありました。

写真

GPT-4 は 5 月以降、より速くコンテンツを生成するようになったと一般的に考えられていますが、コンテンツの品質は著しく低下しています。

OpenAI フォーラムには、2 か月前に同じプロンプトで生成されたコンテンツと比較すると、GPT-4 の機能は最大でも GPT-3.6 になったと述べて、独自に生成したコンテンツを投稿したユーザーもいます。

写真

彼らは皆、毎月支払わなければならない20ドルを残念に思っていると述べました。

写真

しかし、GPT-4 のヘビーユーザーからの苦情を数多く読んだ後、私は突然ため息をつき始めました。

GPT-4 は確かにはるかに先を行っています。

このリードは、他の企業の大規模モデルが数日ごとに更新バージョンをリリースし、できるだけ早く OpenAI に追いつこうと残業するほどのレベルに達しています。

一方、自社はひっそりと「コスト削減と効率アップ」と「逆アップグレード」を進め、大型モデル界における「反崩壊モデル」となった。

パフォーマンス低下の考えられる原因

ユーザーは、GPT-4 のパフォーマンスの低下について合意に達し、GPT-4 の「低下」の理由について議論し始めているようです。

海外メディアの報道によると、言語モデル分野の専門家の中には、OpenAIが大規模モデルのように動作するが実行コストが低い複数の小規模なGPT-4モデルを作成していると推測する人もいる。

Sharon Zhouという専門家によると、OpenAIはGPT-4を構築するためにMixture of Experts(MOE)と呼ばれるフレームワークを使用したとのことです。

それぞれの小規模なエキスパート モデルは、異なるタスクと主題領域でトレーニングされます。

生物学専用のミニ GPT-4 モデルや、物理学、化学などの分野専用のミニ モデルが存在する可能性があります。

GPT-4 ユーザーが質問すると、新しいシステムが判断を下し、プロンプトを 1 つまたは複数の専門家モデルに送信します。

「このアイデアはしばらく前から存在しており、自然な流れだ」と周氏は語った。

周氏はこの状況を、船のさまざまな部品が徐々に交換され、船全体がゆっくりと新しい船になる「テセウスの船」に例えた。

「OpenAIはGPT-4を小型船の艦隊に変えています」と彼女は語った。

私の観点からすると、これは新しいモデルですが、多くの人はこの変更を気にしないかもしれません。 「

今週、GPT-4に関する大量のパラメータ詳細がオンラインで漏洩した後、多くの有力者も、そこに記載されているMoEの部分について独自のコメントを出しました。

アレン人工知能研究所の創設CEO、オーレン・エツィオーニ氏は、外国メディアとのインタビューで次のように述べた。「これらの推測はおおよそ正確だと思うが、確実に確認する方法はない。」

MOE を使用する主な理由は、発電応答の向上と、応答の低コスト化、高速化の 2 つであると説明しました。

エツィオーニ氏は次のように付け加えた。「専門家のモデルを適切に組み合わせれば、両方の長所を活かすことができますが、何事にも言えることですが、通常はコストと品質の間にトレードオフがあります。」

この仮説が真実であれば、OpenAI はコストを削減するために実際にある程度の品質を犠牲にした可能性があります。

もうひとつの証拠は、OpenAI の創設者である Greg Brockman 氏が、自身が参加した研究の中で MOE の技術的道筋について言及したことがあることです。

「専門家混合(MoE)アプローチを使用すると、ネットワークのごく一部だけが一度に使用され、1つの入力に対する出力が計算されます。これにより、計算コストを増やすことなく、より多くのパラメータを追加できます」とブロックマン氏と同僚のリリアン・ウェン氏は論文に記しています。

写真

パフォーマンスの低下は有害なコンテンツの削除に関連している可能性があります

大物たちの技術的な観点からの分析に加え、ネットユーザーたちもさまざまな角度から推測した。

一部のネットユーザーは、OpenAIの比較的保守的な倫理方針がモデルの応答の質を低下させた可能性があると考えている。

公式 OpenAI フォーラムの GPT 関連のサブフォーラムでは、ChatGPT のパフォーマンスが「低下した」と考える人たちの中に、OpenAI が新しいコンテンツ制限を採用する前は、ChatGPT は Prompt の包括性の点で大きく変化していたと述べる人が多かった。

これは、OpenAI が安全上の理由からモデルの出力機能と範囲を制御した可能性があるという見解を間接的に裏付けています。

写真

YCombinatorでの議論の中で、一部のネットユーザーは、OpenAIが安全性の問題に対する懸念を発表し始めてから、モデルのパフォーマンスがどんどん悪化していると指摘した。

GPT-4 が最初にリリースしたレポートにある、TikZ (TikZ はおそらく LaTex でグラフィック要素を作成するための最も複雑で強力なツールです) を使用してユニコーンを描くタスクを例に挙げてみましょう。GPT-4 のその後のリリースでは、レポートの結果を再現することが難しく、パフォーマンスはどんどん悪化しました。

写真

一方、ネットユーザーは、GPT-4 のパフォーマンスが低下した理由は、安全上の理由から人間が一連の矛盾した信念を GPT-4 に植え付けたことにあるのではないかと考えています。

安全上の理由から「悪い考え」を排除するというこのアプローチは、明らかに GPT-4 が物事をより深く理解することを妨げるでしょう。

写真

実際、OpenAI は暴力、人種差別、ヘイトスピーチなどの悪意のある行為を防ぐためにさまざまなフィルターを設定しています。

ただし、これらのフィルターは、小説の執筆、ブレーンストーミング、その他の創造的な作業などの通常の使用を妨げることがよくあります。

これらの変更の影響を測定することは困難ですが、OpenAI の創設者 Sam Altman 氏は、ポリシーの制限がユーザーエクスペリエンスに支障をきたすことを認めました。

写真

さらに、5月29日に行われたHumanloopの共同設立者Raza氏とSam Altman氏との会話の中で、Altman氏はOpenAIは現在GPUの数によって厳しく制限されていると述べた。

写真

ChatGPT のユーザー数が 1 億人を突破し、月間アクティブ回数が 18 億回に達したため、OpenAI のサーバーは頻繁に過負荷状態になりました。

コンピューティング能力の不足により、多くの短期計画が遅れただけでなく、GPT の回答コンテンツの信頼性について顧客から多くの苦情や論争が発生しました。

おそらくその理由は、この世代のネットユーザーにあるのだろうか?

公式技術スポークスマンであるLogan.GPTからの回答では、APIモードではGPT-4の品質は低下していないと述べられました。

写真

写真

写真

ちょうど昨日、OpenAIの製品担当副社長ピーター・ウェリンダー氏がこの噂についてコメントした。

写真

「いいえ、GPT-4 を愚かにしたわけではありません。むしろその逆です。新しいバージョンを以前のバージョンよりも賢くしたのです。」

ネットユーザーからの質問に対して、彼は「使い続けるうちに、以前は気づかなかった問題に気づき始める」と理解している。

つまり、GPT-4 は以前ほど強力ではなかったということであり、現在の GPT-4 こそが真の強みであるということです。

ちょっとベルサイユ宮殿のような雰囲気があります。

予想通り、ネットユーザーはあまり納得せず、ツイートに反応し続けました。

写真

変更していないと言いながら、どのバージョンも優れていると言います。矛盾していませんか?

写真

あなたが述べた仮定は正しくありません。同じ質問に対して、7 月の回答は 6 月の回答よりも悪いのです。

しかし、一部のネットユーザーは、GPT-4 のパフォーマンス低下について異なる説明をしています。

知覚劣化の心理学的観点から見ると、GPT-4 の最初の露出によってもたらされた驚きが消え、それが徐々に私たちの日常生活に浸透していくと、人々はその機能に慣れていくでしょう。

目新しさが薄れてくると、ユーザーの許容度は低下し、技術的欠陥や使用上の欠陥に注意を向けるようになります。

写真

さらに、GPT-4のパフォーマンスが低下したとRedditに投稿したネットユーザーは、最近のアップデートで、その日尋ねた質問は自分の精神状態に影響された可能性があると示唆した。なぜなら、それ以降GPT-4は順調に動作しているからだ。

写真

参考文献:

https://the-decoder.com/openai-comments-on-reports-of-gpt-4-performance-loss/

<<:  xAI Twitterライブ放送:GoogleやOpenAIと直接競合する

>>:  GPT-4 は宇宙のすべてのデータを消費します! OpenAI、データ不足で相次いで訴訟に直面、カリフォルニア大学バークレー校教授が警告

ブログ    
ブログ    

推薦する

ジャック・マーとイーロン・マスクは「愛し合い、憎み合っている」:人間とテクノロジーの競争の勝者は誰か?

8月29日、国家発展改革委員会、科学技術部、工業情報化部、中国サイバースペース管理局、中国科学院、...

百度の自動運転タクシーが長沙で運行開始!乗客は百度地図を通じて電話をかけ、無料の試乗を受けることができる。

4月20日の最新ニュースは、百度がApollp Robotaxi自動運転タクシーサービスの全面オー...

ガベージクリーニングは必須 - Java ガベージコレクションアルゴリズム

1. Javaガベージコレクションアルゴリズムの核となる考え方Java 言語は、使用中のオブジェクト...

AI を活用して災害による損失を評価し、救助活動を支援する

地震、ハリケーン、洪水などの自然災害は、広大な地域と何百万人もの人々に影響を及ぼし、物流上の大きな課...

MITジェネシス核融合が世界記録を更新!高温超伝導磁石が恒星のエネルギーを解放、人工太陽が誕生するのか?

クリーンエネルギーの聖杯は征服されたのか? 「MITチームは、一夜にして核融合炉のワット当たりコスト...

ロボットは労働者を完全に置き換えるのでしょうか?心配しないでください。人間と機械の組み合わせだけが仕事の疲れを軽減できます

英国の著名な分析機関オックスフォード・エコノミクスが発表したデータによると、今から10年後の2030...

ハイブリッドエキスパートの限界を押し上げる: わずか 0.32% のパラメータ更新でモデルを微調整

ご存知のとおり、大規模なモデルのトレーニングにはコストがかかりますが、事前トレーニング済みのモデルを...

...

人工知能2.0の時代、機械にスマートな脳を搭載する方法

[[419760]] 「クラブアップルの木は、その赤みがかった色にもかかわらず、霧雨の中にひとりぼっ...

...

...

スペルミスを心配する必要はありません。Microsoft Edge ブラウザに新しいウェブ「スマート検索」AI 機能が追加されます。

8月23日、Microsoft Edgeブラウザは、ユーザーがウェブ上で関連コンテンツを簡単に検索...

現在の AI の誇大宣伝が行き詰まったらどうなるでしょうか?

AI が行き詰まった場合、サイバーセキュリティ業界は従来の方法、特に人間主導の方法に大きく依存し続...

ICML 優勝者 Lu Yucheng: 分散型機械学習の理論的な限界は何ですか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

顔認識がまた失敗しました。アクセス制御システムは引き続き使用できますか?

旅行がますます便利になるにつれ、旅行の際には携帯電話だけを持って行けばよくなります。これは、モバイル...