この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 社会実験を簡単にシミュレートできるマルチエージェント宇宙がここにあります—— これは清華大学、北京郵電大学、WeChat チームによって立ち上げられ、現在 GitHub で 1.1k 個のスターを獲得しています。 名前はシンプルで分かりやすく、「 AgentVerse 」といいます。 重要なポイント: この環境は大規模言語モデル用に特別に開発されており、エージェントは LLM の機能を使用してタスクを完了できます。 ほんの数行の簡単な設定で、エージェントを希望する環境で成長させることができます。 例えば、囚人のジレンマ: 刑務官は容疑者2人にジレンマを突きつけ、協力するか裏切るか決めるよう求めた。 たとえば、 「NLP 教室」 : 教授はテキストを通じて教え、学生エージェントは質問があるときに手を挙げ、指名されて初めて発言することで、段階的に知識を習得します。 シンプルなポケモンゲームをシミュレートすることもできます...ユーザーは直接参加できます。 (テキスト入力による会話) 望むものは何でも手に入ります。すべてはあなた自身のパフォーマンス次第です。 著者はまた、このプロジェクトの本来の目的は、LLM を使用してカスタム マルチエージェント環境を構築するプロセスを簡素化し、誰もが研究そのものに集中できるようにすることだと述べています。 現在、AgentVerse の論文が公開されており、ソースコードも公開中です。 ぜひ見に来てください。 4つの段階と5つの基本コンポーネントAgentVerse が大規模モデル向けに特別に開発されたのと同様に、より強力な一般化機能などのさまざまな LLM の助けにより、人間によるインテリジェント エージェントのトレーニングの有効性が大幅に向上しました。 しかし、現実世界と同じように、LLM の助けがあっても、協力することを学ぶことはこれらのエージェントが経験しなければならないことです。 ここで著者らは、マルチエージェント環境構築フレームワークである AgentVerse を提案します。 そのワークフローは、人間が協力して問題を解決するプロセスをシミュレートし、次の 4 つの段階に分かれています。 1.専門家の採用。 現在の問題解決の進捗状況に基づいて、タスクを処理するエージェントを調整します。 2. 共同戦略について話し合う(共同意思決定) 。 前の段階で採用されたエージェントは、問題を解決するために必要な分担について話し合い、合意に達する必要があります。 3.アクションの実行 エージェントは環境と対話してタスクを完了します。 4.評価 タスクが完了すると、このモジュールは現在の状態と期待される目標を比較します。期待が満たされない場合は、最初のステップに戻るためのフィードバック報酬が送信されます。 冒頭で述べたように、AgentVerse フレームワークのハイライトの 1 つは、カスタム環境構成を実装できることです。 では、どのようにカスタマイズするのでしょうか? このアプローチは 5 つの基本コンポーネントを通じて行われます。 各コンポーネントは実際にはルールを表します。異なるルールを組み合わせることで、さまざまな環境を構築できるため、研究者はさまざまな条件下でのインテリジェントエージェントの動作を研究しやすくなります。 具体的には、次の 5 つのコンポーネントです。
これらの 5 つの基本コンポーネントに加えて、AgentVerse にはもう 1 つの非常に基本的な要素であるエージェントがあります。 現在、システムは 2 つのタイプを提供しています。1 つはConversationAgent 、もう 1 つはToolAgentで、名前が示すとおりです。 もちろん、BaseAgent クラスを継承することで、3 番目以降のタイプのエージェントをカスタマイズすることもできます。 設定方法は?AgentVerse は手動でクローンするか、pip コマンドを使用してインストールできます。 OpenAI API キーを準備し、BMTools (提供されるさまざまな拡張ツールが必要な場合はオプション)をインストールする必要があることに注意してください。 すべての準備が整ったら: 冒頭で紹介した「囚人のジレンマ」、NLP授業、ポケモンゲームのほか、ソフトウェア設計シナリオ(コード作成エージェント1台、テストエージェント1台、レビューエージェント1台)、データベース管理シナリオ、テキスト評価シナリオなどもあります。 NLP 教室のトピックに関して、著者が多くのオプションの環境を提供していることは注目に値します。 冒頭で示した質問ができるケース以外にも、グループディスカッションを開始したり、講義を聞きながら学生に Bing で検索させたり、WolframAlpha API を使用して数学ゲームをプレイしたりすることもできます。 2. 自分で作ってみる。 教授 1 名、学生 1 名、ティーチング アシスタント 1 名のみの教室環境を構築するなど、簡単なものから始めることができます。 まず、タスク ディレクトリを作成し、環境を構成します。これは、上で紹介した 5 つの基本コンポーネントの構成です。 次にエージェントを設定します。教授の例は次のとおりです。 使用されているエージェントの種類、名前、LLM の種類などの情報を確認できます。 最後に、エージェントの応答を提供する出力パーサーを記述します。たとえば、プロンプト テンプレートでモデルに次の形式で出力させることができます。 上記は、単純な教室環境の一般的なプロセスです。 ご覧のとおり、手順は複雑ではありません。もちろん、具体的な操作については元のプロジェクトを参照してください。 これが単純すぎると思われる場合は、より複雑なものをカスタマイズできます。しかし、具体的なチュートリアルはまだ公開されていません(近日公開予定とのこと) 。 著者が事前に明らかにした情報から判断すると、このプロジェクトは一般的に、環境自体とエージェントという 5 つの基本コンポーネントを中心に展開されます。 さらに、AgentVerse では今後、ローカル LLM のサポートやドキュメントの追加など、強力な機能が追加される予定ですので、ご期待ください。 もう一つこの論文では、著者らは AgentVerse 環境で構築されたマルチエージェント共同タスクにおけるエージェントの社会的行動についても研究しました。 これらの動作には次のものが含まれます。 (1)製紙を早く進めるために他のエージェントと一緒にサトウキビを集めることを提案したり、毛皮の収集がまだ終わっていない人を助けるなどの前向きな行動。 (2)群衆に従って迷惑をかけるなどの否定的な行動。 ここで著者らは、肯定的な行動を再利用し、否定的な行動を破棄し、最終的に複数のエージェント間の協力能力を向上させるためのいくつかの可能な戦略についても議論しています。 興味のある読者は、詳しい情報については論文を参照してください。 プロジェクトアドレス: https://github.com/OpenBMB/AgentVerse |
>>: 復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます
「サイバーセキュリティ」という用語は、ネットワークシステムにおけるハードウェア、ソフトウェア、データ...
次元削減とは、高次元のデータ セットを同等の低次元空間に変換するプロセスです。実際のデータ セットに...
最近、世界をリードするインテリジェント金融検索エンジンであるHubo Technologyが「201...
[[338555]] 【51CTO.comオリジナル記事】 1 はじめに現在、機械学習技術とも呼ばれ...
現代社会では、情報の伝達やコミュニケーションはもはや単一のモードに限定されなくなりました。私たちは、...
会話エージェントから検索クエリまで、自然言語理解 (NLP) は今日の最もエキサイティングなテクノロ...
[[260198]]米テクノロジーメディアCNETによると、マイクロソフトの共同創業者で慈善家のビル...
サイバーセキュリティは「人民の戦い」を必要とするだけでなく、科学技術の問題でもある。オンライン詐欺で...
自動運転車と機械学習は、自動車業界に革命をもたらす画期的な技術として登場しました。人工知能 (AI)...
3月4日のニュース、外国メディアの報道によると、ネイチャー誌に最近発表された研究によると、中国のエン...
IT Homeは11月7日、本日開催されたOpenAI初の開発者会議で、OpenAIが「Copyri...
一般的に、AIGC とは、人間が作成したコンテンツに非常によく似た画像、音楽、テキストなどのコンテン...
[[269995]]音楽業界では、他の業界と同様に、AI テクノロジーによってサービスを自動化し、...