コードを入力すること、詩を書くこと、論文を書くこと、すべてが可能です!史上最大のAIモデルGPT-3がGithubを席巻

コードを入力すること、詩を書くこと、論文を書くこと、すべてが可能です!史上最大のAIモデルGPT-3がGithubを席巻

[[334935]]

最近、GPT-3が人気になってきました!インターネット上で GPT-3 のさまざまなデモをご覧になったことがあると思います。 OpenAI によって作成されたこの大規模な機械学習モデルは、独自の論文を書くだけでなく、詩を作曲したり、独自のコードを書いたりすることもできます。

GPT-3 の威力を見てみましょう。まず、質問応答タスクにおける GPT3 のパフォーマンスを見てみましょう。

あなたの質問が素晴らしい頭の体操であろうと、高度に論理的な数学の問題であろうと、それは流暢に答えることができます。

開発者の Sharif Shameem 氏は、ビデオに示されているように、必要なレイアウトを入力するだけで JSX コードを生成するジェネレーターを GPT-3 を使用して作成しました。

また、誰かが Google スプレッドシートで新しい GPT3 関数を開発しました。この関数は、簡単な数学演算に加えて、米国の各州の人口と建国年を自動的に見つけることができます。

さらに、Twitter アカウントも見つけることができます:

残念ながら、GPT-3 を試したい場合は、まず試用ライセンスを取得する必要がありますが、このモデルによって作成されるアプリケーションは無限にあるようです。これを通じて、平易な英語で SQL データベースをクエリしたり、コードに自動的に注釈を付けたり、コードを自動的に生成したり、人気のある記事のタイトルを書いたり、さらには人気のある記事を書くのを手伝ったりすることができます。

GPT-3とは何ですか?

GPT-3 はニューラル ネットワークを活用した言語モデルです。ほとんどの言語モデルと同様に、GPT-3 はラベルなしのテキスト データセット (トレーニング データには Common Crawl と Wikipedia が含まれます) で広範囲にトレーニングされます。テキストから単語やフレーズがランダムに削除され、モデルは周囲の単語のみをコンテキストとして使用して単語やフレーズを埋めることを学習する必要があります。これは、強力で一般化可能なモデルを生成する単純なトレーニング タスクです。

GPT-3 モデル アーキテクチャ自体は、単方向トランスフォーマー言語モデルに基づいています。このアーキテクチャは 2 ~ 3 年前に人気になりました。人気の NLP モデル BERT と GPT-3 の前身である GPT-2 はどちらもトランスフォーマー上に構築されています。アーキテクチャの観点から見ると、GPT-3 は実はあまり目新しいものではありません。

GPT-3 が人気の理由は、モデルサイズが 1,750 億にまで増加し、45 TB のデータを使用してトレーニングされているため、これまでに作成された最大の言語モデルとなっていることです。巨大なパラメータモデルのおかげで、他のモデルではできない多くのことを実現できます。前述のように、翻訳者、作家、詩人、プログラマーなどにすることができます。

GPT-3 の 1750 億のモデルパラメータが少し抽象的だと思うなら、例を挙げて理解してもらえるはずです。

  • BERTモデルには3億のパラメータがある
  • GPT-3モデルの前身であるGPT-2には15億のパラメータがある
  • NvidiaのMegatron-BERTには80億のパラメータがある
  • 170億のパラメータを持つMicrosoft Turing NLP

2位のMicrosoft Turing NLPのデータパラメータでさえ、GPT-3と同じレベルではありません。

GPT-3 論文の著者は 31 名で、論文は 72 ページにも及ぶことは特筆に値します。ネットユーザーからは、「論文のページ数を競い合うのは PTM の仕事なのか?」という声が上がっています。

いつものように、GPT-3 はすぐに GitHub プロジェクト ページをリリースしました。そこではさまざまな興味深いデモを見つけることができ、最後に Github アドレス: https://github.com/openai/gpt-3 も見つかります。

<<:  ロボット犬をDIYするにはどれくらいの費用がかかりますか?価格は900ドルと安く、スタンフォード大学が開発し、コードはオープンソースです

>>:  Appleは10年間で28社のAI企業を売却。そのAI戦略は世間の注目を集めることだ!

ブログ    
ブログ    
ブログ    

推薦する

...

機械学習の7つの大罪

機械学習実験の信頼性を損なう7つのよくある間違い[[328516]]機械学習は私たちの世界を変える素...

人工知能はデータの管理と処理を改善する素晴らしい方法です

初期の AI マシンは不完全であり、明確に定義された指示に従ってのみ動作できました。しかし、コンピュ...

倉庫ロボットの収益は2030年までに510億ドルを超える

倉庫業界では、パンデミックによる受注量の増加と労働力不足を考慮して、自動化の取り組みを強化している。...

...

携帯電話は小型ロボットに置き換えられるのでしょうか?中国工程院院士:人工知能技術のブレークスルーが鍵

[[361089]] 「ロボットは製造業の頂点であり、その応用と製造は国のハイエンド製造業の重要な指...

プラットフォームのイノベーションを加速し、「クラウド、ビッグデータ、IoT、インテリジェンス」の新たな章を切り開く

世界を席巻するデジタル変革は、あらゆる分野に大きな発展のチャンスをもたらしました。技術革新を推進する...

ワンクリックで動画をアニメーションに変換できるAIツールが人気。様々な格闘技の動きをスムーズに変換でき、無料でオンラインでプレイできます。

テキスト、画像、ビデオ、すべてをアニメーション化できます。見てください、ほんの少し前まで二人の男が格...

コンピュータビジョンの10年: ディープラーニングは変化をもたらすが、特定の課題においては依然として古典的な要素が優勢である

ビッグデータダイジェスト制作編集:ダイジェスト近年、コンピュータービジョン(CV)の発展は止められず...

さまざまな専門家が独自のカスタムGPTを提供しました。24時間のトップ9リストはこちらです。

11月10日の早朝、OpenAIはGPTをリリースしました。ChatGPT Plusのすべての加入...

企業は人工知能の可能性に目がくらんでいるのでしょうか?

多くの企業が AI イニシアチブの導入に意欲的に取り組んでいる一方で、AI が自社のビジネスにどのよ...

Baiduの李振宇氏:Apollo 3.0のリリースはApolloのオープン性の新たな出発点です

自動車業界から大きな注目を集めるアポロオープンプラットフォームは、新たな量産時代を迎えました。 7月...

...

清華大学、DeepMindなどは、既存の小サンプル学習法は安定的かつ効果的ではないと指摘し、評価フレームワークを提案した。

評価基準の違いにより、統一基準に基づく既存の小規模学習法の公平な比較が大きく妨げられており、この分野...

LangChain をベースに LLM アプリケーションを構築する方法

皆さんこんにちは、Lugaです。今日も引き続き、人工知能(AI)エコシステムに関連する技術であるLa...