DeepMindは「Transformerは事前学習データを超えて一般化できない」と指摘しているが、疑問視する人もいる。

マスク氏の xAI が Grok を発表した翌日、xAI はプロンプトエンジニアリングと説明可能性の研究に使用できる統合開発環境である、別の AI 製品である PromptIDE を発表しました。

新製品の継続的なリリースにより、ネットユーザーからは「xAI チームの開発スピードは驚異的だ！」という声が上がっています。

xAI は公式ブログで次のように紹介しています: PromptIDE は、迅速なエンジニアリングと説明可能性の研究のための統合開発環境です。 SDK を通じてプロンプトエンジニアリングを加速し、SDK は複雑なプロンプトテクノロジーを完了できるほか、結果分析やネットワーク出力の視覚化なども実行できます。

xAI が Grok の開発でこの技術を広範に活用したことは注目に値します。

PromptIDE を使用すると、エンジニアや研究者は Grok-1 モデル (Grok を動かすモデル) に透過的にアクセスできます。この IDE は、ユーザーが大規模モデル (LLM) の機能を素早く探索するのに役立ちます。 IDE の中心となるのは Python コードエディターであり、新しい SDK と組み合わせることで、洗練されたプロンプト技術が可能になります。 IDE でプロンプトを実行すると、サンプリング確率、集計アテンションマスクなどの便利な分析が表示されます。

IDE はすべてのプロンプトを自動的に保存し、バージョン管理が組み込まれているため、ユーザーはさまざまなプロンプト手法の出力を比較できます。最後に、ユーザーは CSV ファイルなどの小さなファイルをアップロードし、SDK 内の単一の Python 関数を使用してそれらを読み取ることができます。 SDK の同時実行機能と組み合わせることで、少し大きいファイルでも迅速に処理できます。

以下は IDE の主な機能のデモンストレーションです。

コードエディターとSDK

PromptIDE の中核はコードエディター + Python SDK であり、SDK は複雑なプロンプト技術を実装できる新しいプログラミングパラダイムを提供します。

上の図に示すように、ユーザーは prompt() 関数を使用してコンテキストにトークンを手動で追加したり、sample() 関数を使用してコンテキストに基づいてトークンを生成したりできます。

さらに、複数の Web ワーカーを同時に実行できるため、ユーザーは複数のプロンプトを並行して実行できます。

ユーザーは、同じプログラム内で複数のコンテキストを使用して、複雑なプロンプト手法を実装することもできます。関数に @prompt_fn デコレータがアノテーションされている場合、その関数は独自の新しいコンテキストで実行され、親コンテキストとは独立していくつかのアクションを実行できます。このプログラミングパラダイムは、任意にネストされたサブコンテキストを持つ再帰的および反復的なプロンプトをサポートします。

同時実行性: SDK は Python コルーチンを使用して、@prompt_fn で注釈が付けられた複数の Python 関数を同時に処理し、特に CSV ファイルを処理するときに処理時間を短縮します。

ユーザー入力: プロンプトは、user_input() 関数を通じて対話型にすることができます。 user_input() 関数は、ユーザーが入力した文字列を返します。この文字列は、prompt() 関数を介してコンテキストに追加できます。これらの API を使用すると、わずか 4 行のコードでチャットボットを実装できます。

ファイル: 開発者は、小さなファイル (ファイルあたり最大 5 MiB、合計最大 50 MiB) を PromptIDE にアップロードし、アップロードしたファイルをプロンプトで使用できます。 read_file() 関数は、アップロードされたファイルをバイト配列として返します。これらを上記の同時実行機能と組み合わせることで、プロンプトのバッチ処理を実現できます。

分析: プロンプトを実行すると、モデルの出力をよりよく理解できるように、詳細なトークン分析がユーザーに表示されます。

ユーザーが user_input() 関数を使用すると、ユーザーが応答を入力できるテキストボックスがウィンドウに表示されます。次のスクリーンショットは、上記のチャットボットコードスニペットを実行した結果を示しています。

最後に、トークンの視覚化が不要な場合は、読みやすさを向上させるためにコンテキストをマークダウンで提示することもできます。

<<: NetEase はデータ指標の異常をどのように検出し、診断するのでしょうか?