OpenAI が GPT-4 やその他のモデルを更新し、新しい API 関数呼び出しを追加し、価格を最大 75% 引き下げ

OpenAI が GPT-4 やその他のモデルを更新し、新しい API 関数呼び出しを追加し、価格を最大 75% 引き下げ

数日前、OpenAIのCEOサム・アルトマン氏は世界ツアーのスピーチで、OpenAIの最近の開発ルートを明らかにした。それは主に2つの段階に分かれており、2023年の最優先事項は、より安価で高速で、より長いコンテキストウィンドウなどを備えたGPT-4をリリースすることであり、2024年の焦点はマルチモーダル性である。

OpenAI は 2023 年までにこれらの目標を達成する予定です。 ChatGPT のリリースからわずか数か月で、OpenAI は GPT-3.5 Turbo や GPT-4 などのモデルに基づく素晴らしいアプリケーションを構築しました。現地時間6月13日、OpenAIは次のような関数呼び出しやその他のAPIアップデートをリリースしました。

  • Chat Completions API に新しい関数呼び出しを追加しました。これにより、モデルは必要に応じて関数を呼び出し、対応する JSON オブジェクトを出力として生成できるようになりました。
  • GPT-4 および GPT-3.5 Turbo のより新しく、より操作しやすいバージョン。
  • gpt-3.5-turbo の 16k コンテキスト バージョン (標準は 4k バージョン)。
  • 最先端の埋め込みモデルのコストが 75% 削減されました。
  • gpt-3.5-turbo 入力トークンのコストが 25% 削減されました。
  • gpt-3.5-turbo-0301 および gpt-4-0314 モデルの廃止スケジュールを発表します。

OpenAIは次のように述べている。「APIのGPT-4およびGPT-3.5 Turboモデルは、ユーザー定義関数の呼び出しをサポートするようになり、モデルがユーザーが設計したツールを使用できるようになりました。」さらに、ユーザー向けのモデルの価格が引き下げられ、OpenAI はいくつかの新しいモデル バージョン (16k コンテキストの GPT-3.5 Turbo を含む) をリリースしました。

関数呼び出し

開発者は、gpt-4-0613 および gpt-3.5-turbo-0613 に関数を記述し、それらの関数を呼び出すために必要なパラメータを含む JSON オブジェクトを出力するようにモデルをインテリジェントに選択できるようになりました。これは、GPT の機能を外部ツールや API とより確実に接続するための新しい方法です。

モデルは、関数を呼び出す必要があるタイミング (ユーザー入力に応じて) を検出し、関数のシグネチャに準拠した JSON で応答するように微調整されています。関数呼び出しにより、開発者はモデルから構造化されたデータをより確実に取得できるようになります。たとえば、開発者は次のことが可能です。

  • 外部ツールを呼び出して質問に答えるチャットボットを作成します。

たとえば、「Anya にメールを送信し、次の金曜日にコーヒーを飲みたいかどうかを尋ねる」というクエリは、関数呼び出し send_email(to: string, body: string) に変換されます。また、「ボストンの天気は?」は get_current_weather(location: string, unit: 'celsius' | 'fahrenheit') に変換されます。

  • 自然言語を API 呼び出しまたはデータベース クエリに変換します。

たとえば、「今月の上位 10 人の顧客は誰ですか?」は、内部 API 呼び出し get_customers_by_revenue (start_date: string, end_date: string, limit: int); に変換されます。また、「Acme は先月何件の注文を出しましたか?」は、SQL クエリ sql_query (query: string) に変換されます。


  • テキストからデータ構造を抽出します。

たとえば、Wikipedia に記載されているすべての人物を抽出するには、extract_people_data(people: [{name: string, birthday: string, location: string}]) という関数を定義します。

これらのユースケースは、/v1/chat/completions エンドポイントの新しい API パラメータ、functions および function_call によって有効になります。これにより、開発者は JSON スキーマを介してモデルに関数を記述し、オプションで特定の関数を呼び出すように要求できます。

関数呼び出しの例

たとえば、ユーザーが「ボストンの現在の天気はどうですか?」と質問すると、一連の処理の後、モデルは「ボストンは現在晴れており、気温は摂氏 22 度です」という回答を出力します。

次の図は、リクエストとレスポンスを含む、上の図の最初のステップに対応しています。

新モデル

まずはGPT-4です。

  • gpt-4-0613 には、更新および改善された関数呼び出しモデルが含まれています。
  • gpt-4-32k-0613 には、gpt-4-0613 と同じ改善点に加えて、より大きなテキストを理解するためのコンテキスト長の拡張が含まれています。

次に、GPT - 3.5 Turbo があります。

  • gpt-3.5-turbo-0613 には、GPT-4 と同じ関数呼び出しと、システム メッセージによるより信頼性の高いアクション機能が含まれており、開発者はこれらを使用してモデルの応答をより効果的にガイドできます。
  • gpt-3.5-turbo-16k は gpt-3.5-turbo の 4 倍のコンテキスト長を提供し、gpt-3.5-turbo の 2 倍のコストがかかります (1K 入力トークンあたり 0.003 ドル、1K 出力トークンあたり 0.004 ドル)。 16k コンテキストは、モデルが 1 回のリクエストで約 20 ページのテキストをサポートできることを意味します。

モデルの廃止

3 月にリリースされた gpt-4 および gpt-3.5-turbo の初期バージョンは廃止され、アップグレードされます。アプリケーションは、より安定したモデル gpt-3.5-turbo、gpt-4、gpt-4-32k を使用します。これらは 6 月 27 日に自動的にアップグレードされます。モデルの異なるバージョンを比較する場合は、パブリックおよびプライベート評価用の Eval ライブラリを使用できます。

さらに、移行時間が必要な開発者は、古いモデル gpt-3.5-turbo-0301、gpt-4-0314、または gpt-4-32k-0314 を引き続き使用できますが、9 月 13 日以降にこれらのモデルを使用するリクエストは失敗します。モデルの廃止の詳細については、以下を参照してください。

モデル廃止クエリ: https://platform.openai.com/docs/deprecations/

さらに、今回のアップデートでは価格が下がりました。Text-embedding-ada-002 は、埋め込みシステムで最も人気のある埋め込みモデルです。現在、コストは 75% 削減され、1K トークンあたり 0.0001 ドルまで下がりました。

最後に、数百万のユーザーに ChatGPT 機能を提供する GPT - 3.5 Turbo があります。現在、gpt-3.5-turbo は入力トークンのコストを 25% 削減しました。開発者は、このモデルを 1K 入力トークンあたり 0.0015 ドル、1K 出力トークンあたり 0.002 ドルで使用できるようになりました。これは、1 ドルあたり約 700 ページに相当します。

<<: 

>>:  勝てないなら参加する:ChatGPT が収益に影響を及ぼしていると認めた最初の企業 Chegg は、AI を採用し従業員を 4% 削減することを選択しました。

ブログ    
ブログ    

推薦する

Facebook のインタラクティブ ニューラル ネットワーク可視化システム ActiVis がニューラル ネットワークの「ブラック ボックス」を公開

これまで、多くのメディアがニューラルネットワークの「ブラックボックス」問題について熱く議論してきまし...

...

百度の女性デーのポスターはスマートライフの姿を描いている:人工知能は女性をより自由にする

社会の進歩と国民の意識の高まりに伴い、社会全体が女性の権利にますます注目するようになっています。 3...

UniPAD: 自動運転のためのユニバーサル事前トレーニングパラダイムが登場!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

自動化はウエスタン証券のデジタル従業員にとっての出発点

金融テクノロジーと伝統テクノロジーの相互支援は、徐々に証券業界の発展の中核的な原動力となってきました...

...

...

...

Adobeは、より高品質な画像を提供するために、AI生成モデルの新世代であるFirefly Image 2をリリースしました。

アドビは10月11日、先日開催されたAdobe MAXクリエイティブカンファレンスにおいて、同社のA...

図 | 武術の観点から STL ソート アルゴリズムの秘密を探る

[[410325]]この記事はWeChatの公開アカウント「Backend Research Ins...

千年紀の文化遺産の碑文を解読するAIの能力は人間より30%高い

科学技術の継続的な進歩により、人工知能(AI)はあらゆる面で常に人間を超えつつあるようだ。例えば、1...

...

ビル・ゲイツ: 生成AIは限界に達した

ビル・ゲイツ氏の暴露は機械学習コミュニティで話題となっている。 「GPT-5 は GPT-4 よりそ...

...

リザーブプールコンピューティングにおける新たなブレークスルー:ニューロン数が少なくなり、コンピューティング速度が最大100万倍に高速化

複雑なシステムを予測するには、より多くのニューロンを使用する必要がありますか?ネイチャー・コミュニケ...