OpenAI が GPT-4 やその他のモデルを更新し、新しい API 関数呼び出しを追加し、価格を最大 75% 引き下げ

数日前、OpenAIのCEOサム・アルトマン氏は世界ツアーのスピーチで、OpenAIの最近の開発ルートを明らかにした。それは主に2つの段階に分かれており、2023年の最優先事項は、より安価で高速で、より長いコンテキストウィンドウなどを備えたGPT-4をリリースすることであり、2024年の焦点はマルチモーダル性である。

OpenAI は 2023 年までにこれらの目標を達成する予定です。 ChatGPT のリリースからわずか数か月で、OpenAI は GPT-3.5 Turbo や GPT-4 などのモデルに基づく素晴らしいアプリケーションを構築しました。現地時間6月13日、OpenAIは次のような関数呼び出しやその他のAPIアップデートをリリースしました。

Chat Completions API に新しい関数呼び出しを追加しました。これにより、モデルは必要に応じて関数を呼び出し、対応する JSON オブジェクトを出力として生成できるようになりました。
GPT-4 および GPT-3.5 Turbo のより新しく、より操作しやすいバージョン。
gpt-3.5-turbo の 16k コンテキストバージョン (標準は 4k バージョン)。
最先端の埋め込みモデルのコストが 75% 削減されました。
gpt-3.5-turbo 入力トークンのコストが 25% 削減されました。
gpt-3.5-turbo-0301 および gpt-4-0314 モデルの廃止スケジュールを発表します。

OpenAIは次のように述べている。「APIのGPT-4およびGPT-3.5 Turboモデルは、ユーザー定義関数の呼び出しをサポートするようになり、モデルがユーザーが設計したツールを使用できるようになりました。」さらに、ユーザー向けのモデルの価格が引き下げられ、OpenAI はいくつかの新しいモデルバージョン (16k コンテキストの GPT-3.5 Turbo を含む) をリリースしました。

関数呼び出し

開発者は、gpt-4-0613 および gpt-3.5-turbo-0613 に関数を記述し、それらの関数を呼び出すために必要なパラメータを含む JSON オブジェクトを出力するようにモデルをインテリジェントに選択できるようになりました。これは、GPT の機能を外部ツールや API とより確実に接続するための新しい方法です。

モデルは、関数を呼び出す必要があるタイミング (ユーザー入力に応じて) を検出し、関数のシグネチャに準拠した JSON で応答するように微調整されています。関数呼び出しにより、開発者はモデルから構造化されたデータをより確実に取得できるようになります。たとえば、開発者は次のことが可能です。

外部ツールを呼び出して質問に答えるチャットボットを作成します。

たとえば、「Anya にメールを送信し、次の金曜日にコーヒーを飲みたいかどうかを尋ねる」というクエリは、関数呼び出し send_email(to: string, body: string) に変換されます。また、「ボストンの天気は?」は get_current_weather(location: string, unit: 'celsius' | 'fahrenheit') に変換されます。

自然言語を API 呼び出しまたはデータベースクエリに変換します。

たとえば、「今月の上位 10 人の顧客は誰ですか?」は、内部 API 呼び出し get_customers_by_revenue (start_date: string, end_date: string, limit: int); に変換されます。また、「Acme は先月何件の注文を出しましたか?」は、SQL クエリ sql_query (query: string) に変換されます。

テキストからデータ構造を抽出します。

たとえば、Wikipedia に記載されているすべての人物を抽出するには、extract_people_data(people: [{name: string, birthday: string, location: string}]) という関数を定義します。

これらのユースケースは、/v1/chat/completions エンドポイントの新しい API パラメータ、functions および function_call によって有効になります。これにより、開発者は JSON スキーマを介してモデルに関数を記述し、オプションで特定の関数を呼び出すように要求できます。

関数呼び出しの例

たとえば、ユーザーが「ボストンの現在の天気はどうですか?」と質問すると、一連の処理の後、モデルは「ボストンは現在晴れており、気温は摂氏 22 度です」という回答を出力します。

次の図は、リクエストとレスポンスを含む、上の図の最初のステップに対応しています。

新モデル

まずはGPT-4です。

gpt-4-0613 には、更新および改善された関数呼び出しモデルが含まれています。
gpt-4-32k-0613 には、gpt-4-0613 と同じ改善点に加えて、より大きなテキストを理解するためのコンテキスト長の拡張が含まれています。

次に、GPT - 3.5 Turbo があります。

gpt-3.5-turbo-0613 には、GPT-4 と同じ関数呼び出しと、システムメッセージによるより信頼性の高いアクション機能が含まれており、開発者はこれらを使用してモデルの応答をより効果的にガイドできます。
gpt-3.5-turbo-16k は gpt-3.5-turbo の 4 倍のコンテキスト長を提供し、gpt-3.5-turbo の 2 倍のコストがかかります (1K 入力トークンあたり 0.003 ドル、1K 出力トークンあたり 0.004 ドル)。 16k コンテキストは、モデルが 1 回のリクエストで約 20 ページのテキストをサポートできることを意味します。

モデルの廃止

3 月にリリースされた gpt-4 および gpt-3.5-turbo の初期バージョンは廃止され、アップグレードされます。アプリケーションは、より安定したモデル gpt-3.5-turbo、gpt-4、gpt-4-32k を使用します。これらは 6 月 27 日に自動的にアップグレードされます。モデルの異なるバージョンを比較する場合は、パブリックおよびプライベート評価用の Eval ライブラリを使用できます。

さらに、移行時間が必要な開発者は、古いモデル gpt-3.5-turbo-0301、gpt-4-0314、または gpt-4-32k-0314 を引き続き使用できますが、9 月 13 日以降にこれらのモデルを使用するリクエストは失敗します。モデルの廃止の詳細については、以下を参照してください。

モデル廃止クエリ: https://platform.openai.com/docs/deprecations/

さらに、今回のアップデートでは価格が下がりました。Text-embedding-ada-002 は、埋め込みシステムで最も人気のある埋め込みモデルです。現在、コストは 75% 削減され、1K トークンあたり 0.0001 ドルまで下がりました。

最後に、数百万のユーザーに ChatGPT 機能を提供する GPT - 3.5 Turbo があります。現在、gpt-3.5-turbo は入力トークンのコストを 25% 削減しました。開発者は、このモデルを 1K 入力トークンあたり 0.0015 ドル、1K 出力トークンあたり 0.002 ドルで使用できるようになりました。これは、1 ドルあたり約 700 ページに相当します。

<<:

>>: 勝てないなら参加する：ChatGPT が収益に影響を及ぼしていると認めた最初の企業 Chegg は、AI を採用し従業員を 4% 削減することを選択しました。