GPT-3 に匹敵するものでしょうか? EleutherAIがGPT-Jをオープンソース化

GPT-3 に匹敵するものでしょうか? EleutherAIがGPT-Jをオープンソース化

2020年、マイクロソフトはOpenAIと合意に達し、MicrosoftはGPT-3のソースコードに独占的にアクセスできるようになりました。それ以来、OpenAIは以前のようにGPT-3 AIモデルを公開していませんが、OpenAIのGPT-1とGPT-2は依然としてオープンソースプロジェクトです。

自然言語処理 AI モデルにおける OpenAI と Microsoft の独占を打ち破るために、Connor Leahy、Leo Gao、Sid Black は、AI の調整、スケーリング、オープンソース AI 研究に重点を置いた組織である EleutherAI を設立しました。最近、EleutherAI 研究チームは、GPT-3 をベースにした自然言語処理 AI モデル GPT-J をオープンソース化しました。

GPT-J は GPT-3 をベースにした自然言語処理 AI モデルであり、60 億のパラメータで構成されています。このモデルは 800 GB のオープンソース テキスト データセットでトレーニングされており、同様のサイズの GPT-3 モデルに匹敵します。

このモデルは、Google Cloud の v3-256 TPU と EleutherAI の The Pile データセットを使用して約 5 週間でトレーニングされました。 GPT-J は、OpenAI が報告した 67 億パラメータバージョンの GPT-3 と同等の精度を標準 NLP ベンチマーク ワークロードで達成します。モデル コード、事前トレーニング済みの重みファイル、Colab ドキュメント、デモ Web ページはすべて、EleutherAI のオープン ソース プロジェクトに含まれています。

EleutherAI は 2021 年 3 月に 27 億パラメータの GPT-Neo モデルをリリースしました。これは同社による GPT のようなシステムの最初の実装でした。 GPT-Neo は TensorFlow で構築され、Mesh TensorFlow 並列ライブラリを介して TPU でトレーニングされます。チームは現在、Microsoft DeepSpeed をベースにした GPU ソリューションである GPT-NeoX も開発しています。コードはオープンソースですが、モデル ファイルには現時点でアクセスできません。

最新モデル GPT-J は、新しいライブラリ Mesh-Transformer-JAX を使用してトレーニングされます。このライブラリは、TensorFlow のような特定のディープラーニング フレームワークを使用する代わりに、Google の JAX 線形代数フレームワークを使用します。 GPT-J は Tensorflow よりも柔軟で高速な推論を提供し、モデル開発時間は以前の取り組みよりもはるかに短くなります。 GPT-Neo モデルと比較して、GPT-J のトレーニング効率は 125% 向上します。いくつかのダウンストリーミング ワークロードにおけるゼロ ポイント パフォーマンスに関しては、GPT-J は公開されている Transformer LM の中で最高です。

EleutherAI の開発者である小松崎氏は、次のように述べています。「TensorFlow や TPU などの類似製品と比較すると、より柔軟で高速な推論が可能になります。さらに重要なのは、他の大規模モデルに比べてプロジェクトにかかる時間がはるかに短いことです。調査によると、JAX + xmap + TPU は、大規模なモデルを迅速に開発するための完璧なツール セットです。」

開発者は、GitHub で GPT-J のソースコードとモデルを、EleutherAI の公式 Web サイトでインタラクティブなデモを見つけることができます。

この記事はOSCHINAから転載したものです

この記事のタイトル: GPT-3 に匹敵するか? EleutherAI が GPT-J をオープンソース化

この記事のアドレス: https://www.oschina.net/news/150972/eleutherai-open-sources-gpt-j

<<:  AIを活用してデジタル資産管理ワークフローを効率化する方法

>>:  AIエンジニアリングについて知っておくべきこと

ブログ    
ブログ    
ブログ    

推薦する

...

AIを信頼していない経営者は何を考えているのか?

経営幹部は長い間、より高度な意思決定にデータ分析を使用することに抵抗し、AI 支援による意思決定より...

AIは単なるコードかもしれないが、それは私たちのコードだ

AI に対する期待は高すぎるのでしょうか? また、企業とその経営陣は AI が提供する成果にどの程度...

...

コンピュータービジョンが小売業の在庫管理をどう変えるか

小売業の経営者は、長期的な顧客関係の構築を妨げる在庫管理の問題に直面することがよくあります。小売在庫...

シングルトランスフォーマー情報検索、Google は微分可能な検索インデックスでデュアルエンコーダーモデルに勝利

情報検索 (IR) は、インターネットの誕生以来、揺るぎない地位を築いてきました。膨大なデータからユ...

Apache Flink トークシリーズ - PyFlink のコアテクノロジーを公開

皆さんこんにちは。本日のサミットで Apache PyFlink のコア技術を皆さんと共有できること...

多くのライターがChatGPTを著作権侵害で非難した。OpenAI: 著作権の範囲を誤解している

8月31日、OpenAIは今週、原告に数人の作家を含むほぼ同一の集団訴訟2件に応じた。彼らは、Cha...

AlphaGO よりも強力な人工知能アルゴリズムが登場しました!まさに中国です!

近年、人工知能が話題になっています。 AlphaGoが次々と人間の囲碁の名人に勝利して以来、人工知能...

Microsoft EdgeブラウザがGoogleのオープンソース圧縮アルゴリズムをサポート

来年の Win10 Creator Update に備えて、Microsoft は Edge ブラウ...

AI と ML はデータの理解方法をどのように変えているのでしょうか?

[[337098]] 【51CTO.com クイック翻訳】今日のデジタル時代では、データをどのよう...

遺伝的アルゴリズムの動作原理を 1 つの記事で理解する (Python 実装付き)

最近、「遺伝的アルゴリズムの紹介とデータ サイエンスにおけるその応用」というタイトルの記事が Ana...

インターネットと自動車の大手企業が「自動運転」に賭けているのはなぜでしょうか?

米国現地時間の水曜日、マスク氏はソーシャルメディア上で、同社が今週、一部の選ばれた顧客に対して初の「...

...