ChatGPT の実際のパラメータはわずか 200 億であり、これは Microsoft によって初めて公開されました。ネットユーザー:OpenAIがオープンソースに不安を感じるのも無理はない

ChatGPT の実際のパラメータはわずか 200 億であり、これは Microsoft によって初めて公開されました。ネットユーザー:OpenAIがオープンソースに不安を感じるのも無理はない

突然、大規模なモデリングコミュニティ全体が同じことについて話すようになりました。

マイクロソフトの論文に掲載された「一見すると特筆すべき点がない」統計チャートが、実は秘密を明かしていた。

世界を席巻したChatGPTは、たった200億のパラメータを持つ大規模なモデルを持っているのでしょうか? ? ?

論文が発表されると、国内外で大きな注目を集めた。


多くのネットユーザーはまだそれを信じていません。スペルが間違っていないのは確かですか?

一部のネットユーザーはこう言った。「OpenAIがオープンソースに対してそれほど神経質になるのも無理はない」あるいは、これは OpenAI がオープンソース化するための準備なのかもしれません。

偶然にも、ほんの数日前、一部のネットユーザーが GitHub Copilot API で疑わしい新しい GPT-4 モデルcopilot-gpt-4-2 を発見し、そのモデルに含まれる知識は 2023 年 3 月に更新されました。

この論文には何が書いてあるのですか?

秘密が漏洩しているだけでなく、この論文自体も読む価値があります。コード生成に拡散モデルを使用する業界初の論文だからです。

研究チームは次のようなシナリオを想定しました。

開発者がコードの最後の行だけを変更できる場合、関数をゼロから記述するには何回かかるでしょうか?

自然言語からコードを生成する自己回帰モデルにも同様の制限があり、以前に生成されたトークンを再検討するのは容易ではありません。

Microsoft の研究者は、エンコード/デコード アーキテクチャを使用する CODEFUSION を提案しました。主にエンコーダー、デコーダー、ノイズ除去装置、分類ヘッドで構成されます。自然言語入力を連続表現にエンコードし、その追加条件を拡散モデルに入力して、ガウス ノイズを使用した反復的なノイズ除去を行います。

文法的に正しいコードを生成するために、ノイズ除去後にデコーダーでコード トークンが取得され、CODEFUSION はコードの連続パラグラフ ノイズ除去 (CPD) タスクによって事前トレーニングされます。

CODEFUSION は、Python、Bash、Excel 条件付き書式 (CF) ルールの 3 つの言語タスクで評価されました。

結果によると、7,500 万パラメータの規模での CODEFUSION のパフォーマンスは、200 億パラメータの GPT-3.5-turbo のパフォーマンスに近く、より多様なコードも生成します。

プレーンテキストから生成された拡散モデルと比較すると、CODEFUSION はより文法的に正しいコードを生成します。また、自己回帰モデルと比較すると、より多様な候補コードを生成します。

トップ 1 の精度に関しては最先端の自己回帰システム (350M-175B パラメータ) と同等のパフォーマンスを発揮し、多様性と品質のバランスが優れているため、トップ 3 およびトップ 5 の精度に関してはそれらを上回ります。

これは単なる通常のパフォーマンス比較であることが判明しましたが、予想外にこのような騒ぎを引き起こしました。

陰謀論を唱える人もいますが、これは OpenAI のオープンソースの「前菜」であり、意図的に行われたのかもしれません。

多くの大規模モデルが追いついており、今年5月には、OpenAIが新しい大規模言語モデルをオープンソース化する準備をしているというニュースがロイター通信によって報じられた。

もう一つ

今年 2 月には、Forbes のニュース レポートで ChatGPT のパラメーターが 200 億個しかないことが明らかになったことは注目に値します。

当時のタイトルは「大きい方がよいのか? ChatGPT VS GPT-3 VS GPT-4 の「戦い」が単なる家族チャットであ​​るのはなぜか?」でした。

ただ、当時は気にする人はあまりいなかったのです。

参考リンク:
[1]https://twitter.com/felix_red_pa​​nda/status/1718916631512949248.

[2]https://x.com/teortaxesTex/status/1718972447024623898?s=20.
[3]https://www.reddit.com/r/singularity/comments/17jrepb/microsoft_paper_claims_chatgpt_35_has_20_billion/.
[4]https://www.zhihu.com/question/628395521.
[5] https://www.reddit.com/r/ChatGPT/comments/17ht56t/new_leaks_about_upcoming_developments_with_openai/?share_id=txV27HR0zw0TjV8dLXf4l.
[6] https://www.forbes.com/sites/forbestechcouncil/2023/02/17/is-bigger-better-why-the-chatgpt-vs-gpt-3-vs-gpt-4-battle-is-just-a-family-chat/amp/.

<<:  AIが推理ボードゲームをプレイし、詐欺を一目で見抜く!清華大学経営学院は共同で心の理論の新しい枠組みを立ち上げ、評価における6つの指標のパフォーマンスは思考連鎖よりも大幅に優れていた。

>>:  AI プログラミング: GitHub Copilot と Amazon CodeWhisperer の詳細な比較

ブログ    

推薦する

AIが世界に登場しようとしています。機械は人間の倫理を破壊するのでしょうか?

AIがますます普及するにつれて、倫理的な問題をどのように解決できるでしょうか? AIという言葉は近...

人工知能はサイバーセキュリティにどのような影響を与えるのでしょうか?

人工知能の出現はITの将来の発展の傾向を変え、今後もさらに多くの産業に利益をもたらし続けるでしょう。...

Kaggle機械学習モデル融合(スタッキング)体験

[[205595]]この記事では、エントリーレベルのスタッキング アプリケーションを学習する私の精神...

単純なOEMを拒否し、人工知能を備えた製造業は明るい未来を持っています

国民経済と国民生活に関わる基幹産業として、製造業における新技術や新政策は主要メディアの注目の的となっ...

...

西夏文字の認識を例にとると、人工知能は歴史理解にどのように役立つか

以前、チャット中に友人が人工知能についての印象を「西洋的」「商業的」「未来志向」という 3 つの言葉...

Microsoft Bing Chat が AI 株取引機能を解放: 将来の株価動向を予測可能

Microsoft は、生成 AI のさまざまな可能性を積極的に模索しています。将来の応用シナリオの...

IDC、2021年以降のITトレンドトップ10を発表

2020年に世界的に発生したCOVID-19パンデミックによる混乱にもかかわらず、ほとんどの製品やサ...

清華大学は、2D拡散モデルを使用して不完全な3Dオブジェクトを補完する3D再構築の新しい方法、O²-Reconを提案しました。

コンピューター ビジョンでは、オブジェクト レベルの 3D サーフェス再構築テクノロジは多くの課題に...

...

毎日のアルゴリズム: 二分木の最小共通祖先

この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載したもので、著者はsis...

...

2021 年のファッションラグジュアリーの美的パラダイムとは何でしょうか?答え: テクノロジー

最近はテクノロジーがあらゆるところに存在し、それに伴って変化も起こっています。つまり、ビジネス戦略に...

自動制御システムとは何ですか? 自動制御システムの動作原理は何ですか?

自動制御システムといえば、実は多くの友人はそれについてあまり知りません。ここでは、自動制御システムと...