Kuaishou Agents システム、モデル、データはすべてオープンソースです。

Kuaishou Agents システム、モデル、データはすべてオープンソースです。

7BサイズのモデルはAIエージェントも処理できますか?最近、Kuaishouは「KwaiAgents」をオープンソース化しました。週末のスキーについて質問すると、会場を探すだけでなく、その日の天気も考慮してくれます。

大規模言語モデル (LLM) は言語をモデル化することで多くの知識を習得し、一定の認知能力と推論能力を備えていることは誰もが知っています。しかし、現在最も強力な GPT-4 であっても、単独で使用すると、深刻な意味不明な発言をすることになり、世界とのリアルタイムのやり取りを維持することはできません。 AI エージェントは、この問題を解決する 1 つの方法です。ビッグ モデルのタスクを計画し、反映し、ツールを呼び出す能力を刺激することで、ビッグ モデルは現実世界のツールを使用して、生成されたコンテンツの精度を向上させ、複雑な問題を解決できるようになります。今回、Kuaishouとハルビン工業大学が共同で「KwaiAgents」を開発し、これにより「小型」7B/13Bの大型モデルでGPT-3.5を上回る成果を達成することが可能となり、これらのシステム、モデル、データ、評価はすべてオープンソース化されました。


  • 技術レポート: https://arxiv.org/abs/2312.04889
  • プロジェクトホームページ: https://github.com/KwaiKEG/KwaiAgents

「KwaiAgents」の Github ホームページから、オープンソース コンテンツに次のものが含まれていることがわかります。

  1. システム (KAgentSys-Lite): 事実と時間に敏感なツールセットを備えた軽量 AI エージェント システム。
  2. モデル (KAgentLM): メタエージェントチューニング後の、エージェントの一般的な機能とそのトレーニングデータを備えた一連の大規模モデル。
  3. 評価 (KAgentBench): すぐに使用できるエージェント機能の自動評価ベンチマークと手動評価結果。

システム

KAgentSys システムは、メモリ メカニズムとツール ライブラリを備えた、認知コアとしての大規模モデルに基づく反復的な自動化システムです。主に以下のものが含まれます。

  1. メモリメカニズム: 知識ベース、対話、タスク履歴の 3 種類のメモリが含まれます。ハイブリッド ベクトル検索、キーワード検索などのテクノロジの検索フレームワークに依存して、計画された各パスで必要な情報を検索します。
  2. ツールセット: 事実の拡張ツールセットが含まれています。異種検索およびブラウジング メカニズムにより、Web ページ、テキスト百科事典、ビデオ百科事典などの複数のソースからの知識をまとめることができます。また、カレンダー、休日、時差、天気などの一般的なタイムリーさの拡張ツールセットも含まれています。
  3. 自動化ループ: 会話の中で、ユーザーは質問をし、オプションの知識ベースと追加の個人設定を入力します。システムは最初にメモリを更新して取得し、次にビッグモデルを呼び出してタスクを計画します。ツールを呼び出す必要がある場合は、ツールが呼び出されます。そうでない場合は、要約段階に入ります。ビッグモデルは、履歴情報に基づいて予想される回答を提供します。

今回、KAgentSysの一部の機能がオープンソース化され、システムは段階的にアップグレードされ、公開される予定です。

モデル

トレーニング中に単一のテンプレートによって引き起こされる過剰適合の問題を回避するために、チームはメタエージェントチューニング(MAT)手法を提案しました。これは、トレーニングデータにさらに多くのエージェントプロンプトテンプレートを導入し、エージェント機能における大規模モデルの汎用性を高め、効果を向上させるものです。

メタエージェントチューニング (MAT) は 2 つのフェーズで構成されます。

  1. テンプレート生成段階: Meta-Agent を設計することで、特定の質問セットに対してインスタンス化された Agent Prompt テンプレートの候補 (右上の図は例) を生成します。同じ実験環境で、テンプレートによって生成された候補結果を生成し、スコアリング モデルを使用して、オープン ソース テンプレート (ReAct、AutoGPT など) によって生成された信頼性の高い結果と比較してスコア付けし、高品質の Agent Prompt テンプレート ライブラリを選別します。これらの多様なテンプレートを導入することで、モデルを微調整する際のテンプレートへの依存を大幅に減らし、タスク計画、ツールの使用、反映などにおけるエージェントのより重要な機能を精製し、モデルの一般化と有効性を向上させることができます。
  2. 命令の微調整フェーズ: 数万のテンプレートを基に、200,000 を超えるエージェント調整命令の微調整データが構築されました。チームは、Qwen-7B や Baichuan2-13B などの人気のあるオープンソース モデルを誰でも使用および参照できるように最適化しており、今後は他の人気モデルもリリースされる予定です。

レビュー

KAgentBench は、数千のデータ ポイントに手動で注釈を付けることですぐに使用でき、1 行のコマンドでさまざまなテンプレートのさまざまな側面から大規模モデルのエージェント機能を評価できます。

上図に示すように、KAgentBenchでは、異なる種類の能力が入力されます。各クエリには、複数のテンプレートと手動で編集された複数の実際の回答が装備されており、精度と一般化を総合的に評価することを目的としています。次の表は、MATチューニング後の7B-13Bモデルのさまざまな能力の向上を示しており、GPT-3.5の効果を上回っています。

同時に、この研究では、人間の注釈者に、200の事実と時宜にかなった質問(「アンディ・ラウは今年何歳ですか」など)について、さまざまな大規模モデルとエージェントシステムを相互評価するよう依頼し、KAgentSysシステムとMAT後のモデルが大幅に改善されたことがわかりました(パーセンテージの前のパーセンテージは正確率、括弧内のパーセンテージは5段階評価の平均スコアです)。

通常、Web 検索だけに頼ると、一部のロングテールの質問や人気のある質問に対して適切な結果が返されません。たとえば、「アントネッラはメッシより何日年上ですか?」のようなロングテールの質問をすると、検索結果には2人についての噂が返されることが多いのですが、いくつかの重要な情報は返されません。 KAgentSys は、百科事典検索ツールを呼び出して正確な生年月日を取得し、次に time_delta 時間差ツールを呼び出して年齢差を計算することで、この質問に正確に答えることができます。

チームは、AIエージェントは非常に有望な道であると述べました。今後、一方ではこの方向でコア技術を蓄積し続け、コミュニティ全体に新たな活力を継続的に注入する一方で、エージェント技術とKuaishouのビジネスの組み合わせを積極的に模索し、より興味深く価値のある革新的なアプリケーションの実装に努めます。

<<:  大型模型+ロボット、詳細なレビューレポートはこちら、多くの中国の学者が参加

>>: 

ブログ    
ブログ    
ブログ    

推薦する

...

本物そっくりの「人工顔」は顔認識を騙せるのか?

[[360561]]過去数年間に自分の写真をオンラインに投稿したことがあれば、Clearview ...

顔認識技術の推進は情報漏洩に悩まされている

2021年CCTV「3.15」ガラで、多くの店舗がカメラを使って顔情報を取得している事例が暴露され、...

ドイツメディア:EUは人工知能の乱用を制限する法律制定を計画

専門家は、人工知能も気候変動への取り組みにおいて重要な役割を果たすことができると考えている。しかし一...

...

COVID-19パンデミックは顔認識技術の導入を促進している

COVID-19は顔認識技術の使用にどのような影響を与えるでしょうか? [[374366]] #p#...

...

AIが「テクノロジー冬季オリンピック」を支援、UBTECHロボティクスが氷と雪の世界に進出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データ構造とアルゴリズム: 最小全域木、数秒で理解できます!

[[426679]]序文データ構造とアルゴリズムのグラフ理論において、最小全域木アルゴリズムは、比...

宇宙インテリジェンスは産業変革に新たな推進力をもたらす。ファーウェイは能力とパートナーを開放し、ウィンウィンの時代を実現する

8月5日、ファーウェイ開発者会議2023(HDC 2023)全社スマートテクノロジーフォーラムが深セ...

AI時代に従業員がIT業務の価値を証明する方法

[[251301]]ロボットがあなたの仕事を奪う可能性はありますか? あなたはロボットの仕事を手伝う...

ゼロベース科学の普及: 4 つのシンプルな推奨アルゴリズムの背後にある原理

[[402797]]この記事はWeChatのパブリックアカウント「Big Data DT」から転載し...

...

米国は戦闘における人工知能の活用を推進し続けている

海外メディアの報道によると、米国防総省は最近、トップレベルの設計を強化し、関連技術の急速な発展を促進...

iOS の位置決めと座標系アルゴリズム

この話題を始める前に、もう一度皆さんの無知を解明させてください。私が解明したいのは、座標系についての...