メールを受け取りましたか？ GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

今月初め、OpenAIは初の開発者会議「OpenAI DevDay」を2か月後に開催することを公式発表し、白熱した議論を巻き起こした。多くのネットユーザーは、OpenAIがカンファレンスでGPT-4-Visionなどの大規模なマルチモーダルモデルをリリースするだろうと推測した。

今日、OpenAI のマルチモーダル大規模モデルに関する新しいニュースがあります。

マルチモーダル大型モデル「ゴビ」は実現できるか？

海外メディアThe Informationによると、OpenAIとGoogleは次世代のマルチモーダルビッグモデルを目指し、長期にわたるビッグモデル競争を行っている。このようなモデルは、テキストからグラフを作成するタスクを処理したり、コードを生成したり、視覚的なチャートを出力したりできます。

OpenAIの共同創設者兼社長グレッグ・ブロックマン氏（左）とGoogle DeepMindの共同創設者兼CEOデミス・ハサビス氏（右）

このコンペティションでは、Googleが数日前にマルチモーダルMLツールGeminiの小規模なテストを開始したとの噂がありました。GPT-4のトレーニングよりも5倍の計算能力があり、マルチモーダル機能が大幅に向上しています。 Google は、大規模モデルの分野で OpenAI に対する不利を覆したいと考えている。しかし明らかに、OpenAI は将来このようなことが起こることを望んでいません。

事情に詳しい人物によると、OpenAIはGPT-4をジェミニが提供するものと同様のマルチモーダル機能と組み合わせることに懸命に取り組んでいるという。 OpenAIは3月にGPT-4をリリースした際に、関連するマルチモーダル機能をプレビューしたものの、それを宣伝することはなかった。数か月後、OpenAI は GPT-Vision 機能をより大規模にリリースする準備をしていましたが、正式にはリリースされませんでした。

なぜまだローンチされていないのかについて、OpenAIは主に、顔認識による人物追跡や人間になりすまして認証コードを自動的に解読するなど、視覚機能が不適切に使用されることを懸念している。しかし、時間が経つにつれて、OpenAI はようやくこれらの問題によって生じた技術的な懸念に対処できるようになったようです。

そのため、GPT-Visionの後、OpenAIはGobiというより強力なマルチモーダル大規模モデルを立ち上げると報告されています。 GPT-4 とは異なり、Gobi は最初からマルチモーダルになるように設計されました。しかし、OpenAIはまだモデルのトレーニングを開始していないため、Gobiが最終的にGPT-5になるかどうかを判断するのは時期尚早です。

さらに、OpenAIはGoogleがGeminiをリリースする前にGobiを打ち上げることも望んでいる。

画像出典: Twitter @amir

このマルチモーダルなビッグモデル競争で誰が勝利するかについては、今後見守るしかない。

OpenAIも新しいモデルをリリースした

同時に、OpenAIはマルチモーダル大規模モデルの公開に加えて、新しいモデルも「ひっそりと」リリースしました。

多くのネットユーザーがOpenAIチームからこの手紙を受け取っています。 OpenAI は、text-davinci-003 などの以前のモデルの一部を置き換えるために GPT-3.5-Turbo-Instruct をリリースしました。

このモデルは InstructGPT 3.5 クラスのモデルであり、ターボモデルと同じ速度を維持しながら、text-davinci シリーズなどの以前の Instruct モデルと同様にトレーニングされます。このモデルの価格はGPT-3.5-turbo 4Kと同じです。

Twitter ユーザー @hwchase17 は、このバージョンのモデルは古い完了エンドポイントで使用できると述べ、このバージョンは「おしゃべり」だがエージェントとしては理想的ではないと述べました。

一部のネットユーザーは、使用中に、このモデルは場合によってはより良い仕事をすることができると述べた。たとえば、ユーザーがより大きなコードブロックを生成したい場合、例が示されるだけでなく、非常に長いコードが直接生成されます。

<<:

>>: ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

AI+中国製 Baidu Brain が蘇州にご招待し、「インテリジェント」製造についてお話しします

メールを受け取りましたか？ GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

マルチモーダル大型モデル「ゴビ」は実現できるか？

OpenAIも新しいモデルをリリースした

AI+中国製 Baidu Brain が蘇州にご招待し、「インテリジェント」製造についてお話しします

OpenAIの最新の評価額は半年で3倍になり、800億ドルを超える

ブースティングとバギング: 堅牢な機械学習アルゴリズムを開発する方法

MITのロボットは、浸透する無線周波数を使って隠れた物体を感知する

製造業の未来：AIGCとその他の先進技術

AIが再び大学入試小論文に挑戦、強力なハードコア技術で「数秒」の文章作成を実現

自分で作成したデータセット、TensorFlow を使用した株価予測チュートリアル

誰もが今から準備すべき、2020 年のキャリアを変える 6 つのテクノロジートレンド

推薦する

あなたの写真を「秘密裏に」使用した顔認識システムはいくつありますか?ツールを使って確認する時が来た

人工知能は、研究論文の合理的で興味深く、科学的に価値のあるタイトルを生成できるかもしれない。

機械学習 | PyTorch 簡潔チュートリアルパート 1

AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

教育における人工知能は2032年までに882億ドルに達する

中間レビュー: 2021 年注目のデータサイエンスおよび機械学習スタートアップ 10 社

ディープラーニングのためのヘテロジニアスアクセラレーション技術（I）：AIにはどれくらい大きな「心」が必要か？

メタ学習はもう人気がない！ ICLR 2022 の投稿トレンド: 強化学習がトップ、ディープラーニングが2位

200億の「Shusheng·Puyu 2.0」が正式にオープンソース化されました！データプッシュのパフォーマンスはChatGPTに匹敵し、20万の超長コンテキストを完璧に再現します。

OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

これら5つのコアテクノロジーを理解すれば、人工知能はもうあなたの身近な存在に

ロボットが高齢者の在宅生活を変える

Google のコード生成システムはプログラマーの半分を「飲み込んだ」のでしょうか?人類は長い間AIに「負けて」きました！