メールを受け取りましたか? GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

メールを受け取りましたか? GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

今月初め、OpenAIは初の開発者会議「OpenAI DevDay」を2か月後に開催することを公式発表し、白熱した議論を巻き起こした。多くのネットユーザーは、OpenAIがカンファレンスでGPT-4-Visionなどの大規模なマルチモーダルモデルをリリースするだろうと推測した。

今日、OpenAI のマルチモーダル大規模モデルに関する新しいニュースがあります。

マルチモーダル大型モデル「ゴビ」は実現できるか?

海外メディアThe Informationによると、OpenAIとGoogleは次世代のマルチモーダルビッグモデルを目指し、長期にわたるビッグモデル競争を行っている。このようなモデルは、テキストからグラフを作成するタスクを処理したり、コードを生成したり、視覚的なチャートを出力したりできます。

OpenAIの共同創設者兼社長グレッグ・ブロックマン氏(左)とGoogle DeepMindの共同創設者兼CEOデミス・ハサビス氏(右)

このコンペティションでは、Googleが数日前にマルチモーダルMLツールGeminiの小規模なテストを開始したとの噂がありました。GPT-4のトレーニングよりも5倍の計算能力があり、マルチモーダル機能が大幅に向上しています。 Google は、大規模モデルの分野で OpenAI に対する不利を覆したいと考えている。しかし明らかに、OpenAI は将来このようなことが起こることを望んでいません。

事情に詳しい人物によると、OpenAIはGPT-4をジェミニが提供するものと同様のマルチモーダル機能と組み合わせることに懸命に取り組んでいるという。 OpenAIは3月にGPT-4をリリースした際に、関連するマルチモーダル機能をプレビューしたものの、それを宣伝することはなかった。数か月後、OpenAI は GPT-Vision 機能をより大規模にリリースする準備をしていましたが、正式にはリリースされませんでした。

なぜまだローンチされていないのかについて、OpenAIは主に、顔認識による人物追跡や人間になりすまして認証コードを自動的に解読するなど、視覚機能が不適切に使用されることを懸念している。しかし、時間が経つにつれて、OpenAI はようやくこれらの問題によって生じた技術的な懸念に対処できるようになったようです。

そのため、GPT-Visionの後、OpenAIはGobiというより強力なマルチモーダル大規模モデルを立ち上げると報告されています。 GPT-4 とは異なり、Gobi は最初からマルチモーダルになるように設計されました。しかし、OpenAIはまだモデルのトレーニングを開始していないため、Gobiが最終的にGPT-5になるかどうかを判断するのは時期尚早です。

さらに、OpenAIはGoogleがGeminiをリリースする前にGobiを打ち上げることも望んでいる。

画像出典: Twitter @amir

このマルチモーダルなビッグモデル競争で誰が勝利するかについては、今後見守るしかない。

OpenAIも新しいモデルをリリースした

同時に、OpenAIはマルチモーダル大規模モデルの公開に加えて、新しいモデルも「ひっそりと」リリースしました。

多くのネットユーザーがOpenAIチームからこの手紙を受け取っています。 OpenAI は、text-davinci-003 などの以前のモデルの一部を置き換えるために GPT-3.5-Turbo-Instruct をリリースしました。

このモデルは InstructGPT 3.5 クラスのモデルであり、ターボ モデルと同じ速度を維持しながら、text-davinci シリーズなどの以前の Instruct モデルと同様にトレーニングされます。このモデルの価格はGPT-3.5-turbo 4Kと同じです。

Twitter ユーザー @hwchase17 は、このバージョンのモデルは古い完了エンドポイントで使用できると述べ、このバージョンは「おしゃべり」だがエージェントとしては理想的ではないと述べました。

一部のネットユーザーは、使用中に、このモデルは場合によってはより良い仕事をすることができると述べた。たとえば、ユーザーがより大きなコード ブロックを生成したい場合、例が示されるだけでなく、非常に長いコードが直接生成されます。

<<: 

>>:  ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

ブログ    
ブログ    

推薦する

AI を活用した新たなフィッシング攻撃に対抗するにはどうすればよいでしょうか?

サイバーセキュリティは、攻撃と防御の継続的なゲームです。防御戦略が進化し続ける一方で、攻撃者も攻撃の...

Chen Danqi 氏のグループによるマスク言語モデルに関する研究: 15% のマスク率は最適ではないが、40% は維持可能か?

少し前に、スローン財団は2022年度スローン研究賞の受賞者を発表しました。Chen Danqi、Fa...

フロンティアモデルフォーラムは責任あるAIの創造を目指している

政府や社会からの監視が強まる中、人工知能(AI)の責任ある開発を促進し、業界標準を確立することを目的...

新型コロナウイルスは「ターミネーター」か?人工知能で疫病と闘う

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

例 | CNN と Python を使用した肺炎検出

導入こんにちは!数時間前にディープラーニング プロジェクトを終えたので、その成果を共有したいと思いま...

デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する...

...

「人工知能+教育」は教育の矛盾を解決するために、より包括的な方向に向かっている

「教育はデジタル化とネットワーク化からインテリジェンスへと変化しています。現在、人工知能はよりインテ...

アイデアこそが王様!メンサ国際元会長が2021年の人工知能の応用を総括

[[443263]]人工知能の将来の発展の方向性を真に理解するには、まだ長い道のりが残っています。 ...

ボルチモア、これまでで最も厳しい顔認識禁止法を制定する可能性

米国のボルチモア市で検討されている条例は、民間人だけでなく法執行機関や政府機関による顔認識技術の購入...

ニューラルネットワークアルゴリズムの利点と応用

[[211834]]人工ニューラル ネットワーク (ANN) は脳の処理メカニズムに基づいており、複...

人工知能が人間の神経を刺激し、2017年は世界的な技術革新が活発化

[[183471]]図1:2017年1月7日、知能ロボット「小宝」が上海市楊浦区のショッピングモール...

アリババクラウドは、70億のパラメータを持つTongyi Qianwen大規模モデルをオープンソース化し、無料で商用利用可能に

大規模モデルの開発動向はオープンソースへと移行し始めています。周知のとおり、ChatGPT、GPT-...

大規模モデルは知識グラフを効率的に作成するのに役立ちます

著者 | 崔昊レビュー | Chonglouまとめこの記事では、ナレッジ グラフと大規模言語モデルを...