OpenAI が GPT-3 の微調整機能を公開、コマンド 1 行で実現可能!精度は最大4倍に向上します

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

OpenAI は、ユーザーが GPT-3 のカスタマイズされたバージョンを作成できるようにすると発表しました。

手順は非常に簡単で、コマンド 1 行だけで実行できます。

最大4倍の改善">

微調整後、GPT-3 のカスタマイズされたバージョンは、さまざまなアプリケーションで明らかな改善が見られます。

OpenAIは、さまざまなアプリケーションの精度を83％から95％に直接向上させ、エラー率を50％削減できると述べた。

小学校の算数の問題を解く正解率も2～4倍向上します。

最大4倍の改善">

このようにして、多くの研究開発担当者は巨人の肩に立ち、独自の AI モデルをゼロからトレーニングすることなく、1,750 億のパラメータを持つ大規模モデルを直接微調整することができます。

これに対してネットユーザーたちは次のように叫んだ。

今ではチャットボットを直接トレーニングできるので、時間とコストを大幅に節約できます。

最大4倍の改善">

たとえば、この税金アプリケーション - Keeper Tax。

明らかに、OpenAI は GPT-3 をより多くの人々に利用できるようにするために努力を惜しみませんでした。

微調整には多くの利点がある

OpenAI がすでに証明しているように、微調整には多くの利点があります。

今年6月、研究チームはわずか80件のテキストのデータセットをトレーニングに使用し、GPT-3の音声の危険性を大幅に低減し、表現をより人間らしくした。

（下図の青い線は学習済みモデル、赤い線は基本モデルを表しています。スコアが高いほど性能が良いことを意味します）

最大4倍の改善">

実際、多くのアプリケーションではすでに GPT-3 のカスタマイズされたバージョンが使用されており、良好なパフォーマンスを発揮しています。

たとえば、この税金アプリケーション - Keeper Tax。

GPT-3 のカスタマイズされたバージョンを使用して、請求書のさまざまなデータを識別し、ユーザーが税控除の対象となる経費を見つけるのに役立ちます。

キーパータックスによれば、微調整されたGPT-3を使い始めてから、アプリの認識精度は毎週約1％ずつ向上し、精度は従来の85％から93％にまで向上したとのこと。

最大4倍の改善">

人工知能検索ツール「Elicit」を見てみましょう。

ユーザーが検索した質問に基づいて、インテリジェントに結果を提供できます。

GPT-3 のカスタマイズされたバージョンを使用した後、Elicit によって得られた結果は、理解度で 24%、精度で 17%、全体で33%向上しました。

最大4倍の改善">

ユーザーのコメントをインテリジェントに読み取ることができる、Viable というアプリケーションもあります。

多数のレビューから、苦情や質問など、ユーザーの重要な提案を読み取ることができます。

カスタマイズされた GPT-3 により、ユーザーフィードバックを識別するアプリの精度が 66% から90%に向上しました。

最大4倍の改善">

実際、向上したのは精度だけではありません。

カスタマイズされた GPT-3 には、時間と出力結果の多様性の点でより明らかな利点があります。

どのように摂取しますか？

OpenAI は、GPT-3 を微調整するには、おおよそ 3 つのステップが必要だと述べています。

トレーニングデータを準備してアップロードし、モデルをトレーニングして微調整し、最後にそれを使用します。

このうち、トレーニングデータは JSONL ドキュメントである必要があります。このステップが GPT-3 を優れたものにする鍵となります。

微調整モデルの作成は OpenAI CLI で行います。手順も非常に簡単です。データファイルをアップロードし、微調整ジョブを作成し、ジョブが完了するまで数分または数時間待つだけです。

最後に、微調整されたモデルを使用する場合は、コマンドラインの fine_tuned_model フィールドをモデル名に置き換えるだけです。

最大4倍の改善">

具体的な手順はOpenAIの公式サイトに記載されていますので、記事末尾のリンク2を参照してください。

もちろん、より強力な GPT-3 を使用する場合は、コストが増加します。

微調整されたモデルの 1K トークンあたりのコストは、基本バージョンよりも50%高くなります。

OpenAIの技術者はインタビューでこう語った。「この機能を開発したとき、AI研究の経験がない人でも使えるようにしたいと考えていました。

多くのネットユーザーも、GPT-3 を使用して多くの興味深いアプリケーションを作成したというメッセージを残しました。

たとえば、ある人はおとぎ話を語る睡眠ポッドキャストを書きました。

最大4倍の改善">

<<: AIコピーライティングの11のメリット

>>: データ拡張とは何ですか?

HuggingFace は、大規模モデルの製造パフォーマンスを効率的にリリースするための Transformer 拡張および最適化ライブラリをオープンソース化しました。

ブログ

プリンストンが 34B 数学モデルをオープンソース化: パラメータが半分なのに Google Minerva に匹敵するパフォーマンス! 550億トークンのプロフェッショナルデータトレーニング

ブログ

人工知能（AI）の人間的側面を探る

ブログ

AI/コンピュータサイエンスボランティア募集ガイドを公開しました！最も人気のある最後の8つの質問、参考回答はここにあります

ブログ

Spark を使用して行列分解推奨アルゴリズムを学習する

ブログ

プラグアンドプレイ、トレーニング不要：ケンブリッジ大学、テンセントAIラボなどがトレーニング不要のクロスモーダルテキスト生成フレームワークを提案

ブログ

画像認識のためのトップ 5 プログラミング言語

ブログ

なぜAIは東京オリンピックでバレーボールの試合を無料で観戦できるのか？

ブログ

Python の基本 + モンテカルロアルゴリズム (ソースコード付き) を使用して、順列と組み合わせに関する質問を共有します。

ブログ

OpenAI が GPT-3 の微調整機能を公開、コマンド 1 行で実現可能!精度は最大4倍に向上します

微調整には多くの利点がある

どのように摂取しますか？

HuggingFace は、大規模モデルの製造パフォーマンスを効率的にリリースするための Transformer 拡張および最適化ライブラリをオープンソース化しました。

プリンストンが 34B 数学モデルをオープンソース化: パラメータが半分なのに Google Minerva に匹敵するパフォーマンス! 550億トークンのプロフェッショナルデータトレーニング

人工知能（AI）の人間的側面を探る

AI/コンピュータサイエンスボランティア募集ガイドを公開しました！最も人気のある最後の8つの質問、参考回答はここにあります

Spark を使用して行列分解推奨アルゴリズムを学習する

プラグアンドプレイ、トレーニング不要：ケンブリッジ大学、テンセントAIラボなどがトレーニング不要のクロスモーダルテキスト生成フレームワークを提案

画像認識のためのトップ 5 プログラミング言語

なぜAIは東京オリンピックでバレーボールの試合を無料で観戦できるのか？

Python の基本 + モンテカルロアルゴリズム (ソースコード付き) を使用して、順列と組み合わせに関する質問を共有します。

推薦する

AI批判: GPT-3は何を話しているのか分かっていない

ChatGPTを使用して安全ヘルメット着用検出プロジェクトを完全に自動的に開発する

メタ「世界モデル」が疑問視される：それは 10 年前に存在していた！ルカン：重要なのは構築とトレーニングです

「業界最強」と称されるアリトン・イー・チエンウェン、国内No.1大型モデルを目指す

最も人気のある 5 つの人工知能プログラミング言語の比較。1 つだけでも学ぶ価値があります。

次世代ビッグデータ・人工知能基盤技術の発展と動向

AIoTは単なる発言ではない

AI キャリアに移行する IT プロフェッショナルのための 8 つのヒント

人工知能は「最優先事項」として挙げられていますが、高等教育機関はこの責任をどのように担うことができるのでしょうか?

サーバーが過負荷状態です! GANで生成された肖像油絵は人気があり、一瞬でルネッサンス時代に戻ることができます

クラウドアーキテクチャに生成 AI を追加するためのヒント

ドローンが上海の歴史的建造物の保護を主導