AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

最近、GitHubは新しいAIエージェントプロジェクト「AutoAgents」を立ち上げました。このプロジェクトはLinkSoul.AIチームが主導し、Llama2モデル[1]のリリースの翌日に中国語版のモデルをダウンロード用にリリースし、北京大学、香港科技大学、智源科技、ウォータールー大学が共催しました。参入障壁が高く、使用シナリオが限られているAutoGPT [2]やMetaGPT [3]と比較して、AutoAgentsはAIエージェントをあらゆるシナリオに適用し、対象シナリオに合わせてエージェントの合理的な組み合わせを自動的に設計し、複雑なタスクを役割とタスクに分解し、適切な役割が一致するタスクを解決できるようにすることに取り組んでいます。

プロジェクトリンク: https://github.com/LinkSoul-AI/AutoAgents
オンライン体験: https://huggingface.co/spaces/LinkSoul/AutoAgents

あらゆるシナリオでエージェントの適切な組み合わせを自動的に計画します

AutoAgents は、あらゆるシナリオに対応するユニバーサルソリューションを提供することに注力しています。ユーザーの要件を 1 文入力するだけで、対象シナリオに適したインテリジェントエージェントのチームを迅速に編成し、複雑なタスクを自動的に分解して、適切なインテリジェントエージェントが連携して対応するタスクを完了します。

小説を書く

例えば、入力

「人工知能の覚醒についての小説を書く」

AutoAgents は「プロジェクトマネージャー」(プランナー) を起動し、現在のタスクを完了するために必要な他のロールと、各ロールがタスクを完了するために必要な特定のアクションを設計します。

このタスクを達成するには、プランナーデザインに複数の専門家が必要です。AI とその潜在的な覚醒についての情報を収集する研究者、小説のアウトラインを作成するストーリープランナー、魅力的なキャラクターを作成するキャラクター開発者です。最後に、物語を書くライターが必要です。

さまざまな分野の専門家はすべて AI エージェントによって演じられ、計画に従ってタスクを実行します。たとえば、ストーリープランナーは研究者から提供された検索情報を使用して、クライマックスとどんでん返しの両方を含むストーリーの導入部を書き、ストーリーをより魅力的なものにしました。

最後に、物語を書き終えるのは作家の責任です。さまざまなロールプレイングエージェント間の分業と協力を通じて、小説執筆タスクは効率的に完了しました。

小規模ゲームの迅速な実装

AutoAgents を使用すると、誰でも非常に低コストで小規模なゲーム開発チームを簡単に構築できます。AutoAgents は、プロジェクトマネージャー、プログラマー、テスター、その他の役割の「採用」に役立ちます。 ChatGPT を含む既存の一般的なソリューションとは異なり、プログラムとの継続的な対話の過程で、プロンプトを手動で記述し、使用するプログラミング言語を確認し、プロジェクトを計画し、ゲームキャラクターを設計し、一連の面倒な作業を行う必要があります。AutoAgents では、タスクの目標を明確にするだけでよく、以下に示すように非常に簡単です。

CLI スネークゲームのコードスニペットを表示

AutoAgents は必要なロールを作成し、そのロールに責任と機能を割り当て、各ロールが使用できる外部ツールのリストを決定します。その後、それぞれの役割が計画に従って順序よくタスクを実行し、互いに協力し合い、最終的に目標を達成します。

噂の検証

ソフトウェアやゲーム開発シナリオだけでなく、強力なシーン適応性を備えた AutoAgents は、あらゆる新しいシナリオに対して適切な「新しいエージェントの組み合わせ」を自動的に設計し、問題を解決できます。日常生活でも噂に悩まされることがあるかもしれません。噂を検証するためにドメインエキスパートと言語エキスパートを自動的に作成する AutoAgents を利用できます。最近の LK-99 超伝導体インシデントを例にとると、AutoAgents にリクエストを送信するだけで済みます。

LK-99は本当に室温超伝導材料ですか? （LK-99は本当に室温超伝導物質なのでしょうか？）

AutoAgents は、材料科学者と言語専門家を自動的に作成し、インターネット上の既知の情報を自動的に整理して、LK-99 の状態を確認します。

上記は AutoAgents テクノロジーの単純な試みにすぎません。実際、その応用の可能性は私たちの想像力によってのみ制限されます。シナリオに関係なく、AutoAgents は最適な役割を作成し、分業を完了して、タスクを効率的に完了するのに役立ちます。

太陽に向かって進む若いチーム

先週末（8月26日）、LinkSoul.AIの創設者兼CEOであるShi Yemin博士は、Syncedが主催した「Llama 2大規模モデルアルゴリズムとアプリケーション実践」イベント[7]でLinkSoul.AIのマルチモーダル大規模モデル技術について発表し、Syncedのインタビューも受けました。

石イエミンは北京大学で学士号と博士号を取得し、黄鉄軍教授に師事しました。2013年からディープラーニングと事前学習済みモデルの研究を行っています。人工知能学院のイノベーション応用研究室長として、WuDao 3.0の開発に参加しました。市販されている中国語の教育データセットとしては最大規模のCOIGとCOIG-PCの発起者および主催者の一人です。CAMEOタンパク質構造予測コンテストで1位を獲得し、初の中国ラマ2モデルである中国ラマ2 7B [4]の開発を主導しました。また、中国語と英語のマルチモーダルモデルであるChinese Llama 2 [5]と、初の中国語と英語のバイリンガル音声テキストマルチモーダル対話モデルであるLLaSM [6]をオープンソース化しました。

Synced: チームの背景を簡単に紹介していただけますか?

Syncedのインタビューをありがとうございます。私たちはLinkSoul.AIというスタートアップです。私たちが目指すのは、人間とAI、AIとAIの精神的なつながりを実現することです。簡単に言うと、AIが人々の心の底から役に立つ存在になることを望んでいます。私たちのチームはまだ初期段階にあり、人数も多くありません。チームメンバーは主に北京大学、AI研究所、Huawei、ByteDanceなどの一流企業、大学、研究機関から来ています。オペレーター開発、クラスター構築、大規模モデルの事前トレーニング、命令の微調整、マルチモーダル大規模モデルのトレーニング、製品開発、発売の完全な経験を持ち、大規模モデルの開発、改善、発売の能力を備えた中国で数少ないチームの一つです。

Synced: LinkSoul.AI が複数のモデルを迅速にオープンソース化し、さらに AutoAgents テクノロジーをオープンソース化するという決定の背景には、どのような考慮事項があるのでしょうか?それはチームの時間の無駄になるでしょうか?

LinkSoul.AI をオープンソースプロジェクトに重点を置いた会社にするつもりはありません。中国の Llama 2 モデルは、チームが余暇に作った試みです。Llama 2 のリリースと時期が重なったため、トレーニングしてオープンソース化しました。チームは、コミュニティがマルチモーダルモデルとその技術的応用にもっと注目してくれることを期待して、画像と音声のマルチモーダルモデルをオープンソース化することを選択しました。チームは、マルチモーダルモデルがますます重要な役割を果たし、ゲーム、ソーシャルネットワーキング、AR/VR/MR などの分野でますます重要な役割を果たすと考えています。 AutoAgents がオープンソースになったことで、AI エージェントの分野でのチームの長期にわたる蓄積がオープンソースコミュニティに貢献できることを期待しています。 LinkSoul.AI は、主にチームのこれまでの研究の蓄積に基づいて、新しい結果を迅速にリリースできます。これは日常業務の継続であり、大学、研究機関、企業との共同研究開発に大きく依存しているため、チームの注意をそらすことはありません。

Synced: Llama などのオープンソースモデルが急速に進歩している現在、これは大規模な国内モデル、特に基礎モデルの開発にどのような影響を与えるでしょうか?誰もが独自のモデルをトレーニングするのは過去のことでしょうか?

オープンソースとクローズドソースはどちらも非常に重要な分野だと思いますが、特にオープンソースモデルは超大規模モデルで試すのが難しく、クローズドソースモデルは再開発やトレーニングが困難です。一方、Llama モデルは現在主に英語で提供されており、中国語のサポートはまだ十分ではありません。Llama をローカライズする既存の試みは、成功しているとは言い難いです。したがって、大規模な中国モデルの需要だけを考慮したとしても、中国で大規模なモデルをトレーニングすることは依然として価値があります。

Synced: オープンソースの AutoAgents テクノロジーにはどのような革新性がありますか?

大規模言語モデルに基づく既存のマルチエージェントシステムのほとんどは、タスクを完了するために事前定義されたエージェントに依存していますが、これらの事前定義されたエージェントはさまざまなシナリオへの適応性を制限します。 AutoAgents は、さまざまなタスクに応じてさまざまなミッションシナリオに適応する AI エージェントのチームを適応的に作成し、生成された AI エージェントの組み合わせに基づいて現在のタスクのソリューションを計画します。複数のエージェントの連携を自動的に計画することで、タスクを効率的に完了できます。同時に、実行環境には、実行結果に基づいて実行計画を動的に改善し、より正確なソリューションを生成するオブザーバーが存在します。 AutoAgents は、チームワークにおいて異なるタスクに異なる役割を割り当てることの重要性を強調し、複雑なタスクを処理するための新しい視点を提供します。

Synced: AutoAgents は LinkSoul.AI にとってどのような価値をもたらしますか?

LinkSoul.AIは、すべての人に役立つAIを提供することに尽力しており、AIを呼び出す能力が特定の人々の特権ではなくなるように、人間とAI、AI同士のコミュニケーションミドルウェアを構築したいと考えています。 AutoAgents は、AI と AI 間のコミュニケーションを改善し、AI エージェントを呼び出すハードルを誰もが利用できるレベルまで下げようとするチームの試みです。現段階では、AutoAgents はまだ有料の大規模モデル API サービスに依存しています。今後、チームは専用のエージェント生成モデル、エージェントスケジューリングモデルなどを開発して、API を置き換える予定です。同時に、LinkSoul.AI はより多くの人々と AI、AI と AI の実験も行い、人々に最も極端な AI 体験をもたらすことを目指しています。

AutoAgents ローカル展開

最後に、AutoAgent をローカルに展開することも非常に便利です。以下の手順に従うことで、AutoAgents の展開をローカルで簡単に完了できます。

ステップ1: プロジェクトリポジトリをダウンロードする

git clone https://github.com/LinkSoul-AI/AutoAgents cd AutoAgents

ステップ2: Dockerイメージを作成する

IMAGE="linksoul.ai/autoagents" VERSION=1.0 docker build -f docker/Dockerfile -t "${IMAGE}:${VERSION}" .

ステップ3: Dockerコンテナを起動する

docker run -it --rm -p 7860:7860 "${IMAGE}:${VERSION}"

これら 3 つの手順が正常に実行されたら、ブラウザーでリンク http://127.0.0.1:7860 を開いて、AutoAgents の使用を開始できます。

要約する

AutoAgents は新しく開始されたプロジェクトであり、まだ初期段階にあります。オープンソースコミュニティとオープンソース愛好家の皆様の積極的な参加と貢献を歓迎します。現在、大規模モデルの最も重要な開発方向として、AIインテリジェントエージェント技術は、将来、ソーシャル、ゲームなどの分野で確実に重要な役割を果たすでしょう。 LinkSoul.AI のようなチームがさらに出現し、人工知能技術を推進してすべての人に役立ち、AI の平等を実現することを期待しています。

<<: ユニバーサルデータ拡張技術、ランダム量子化はあらゆるデータモダリティに適用可能

>>:

AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

あらゆるシナリオでエージェントの適切な組み合わせを自動的に計画します

太陽に向かって進む若いチーム

AutoAgents ローカル展開

要約する

AIとIoTの連携方法

人工知能の時代において、従来のメディアはどのようにしてニュースの取り組みを守ることができるのでしょうか?

USTCとJD.comの最新の成果：AIが本物の人間のように話し、リアルなジェスチャーを披露

Google が地図「タイムマシン」を公開: 100 年前のあなたの街はどんな様子だったでしょうか?

先ほど、Manus Lianchuang は「サンドボックス脱獄」の問題に反応し、次のように述べました。「MCP は役に立たない!」さて、オープンソース化計画が正式に発表されました！

AIのおかげで、これら5つの業界の求人需要は大幅な成長傾向を示すだろう

報告書では、人工知能の新世代について再び言及しており、3つのキーワードが完全に解釈されている。

推薦する

情報漏洩を防ぐためにローカルで構築できるオープンソースモデルPrivateGPTが利用可能になりました

ビッグデータと機械学習は世界のエネルギー業界をどのように変えるのでしょうか?

Facebookの広告システムの背後にあるペーシングアルゴリズム

アメリカでは500万の仕事が機械に置き換えられました！スーパーAIは人類に不死をもたらすのか、それとも破滅をもたらすのか?

2020年に人工知能がIT業界を変える

AI を活用したエンジニアリングは、ロボット工学と自動化をどのように強化できるのでしょうか?

機械学習における正規化とはどういう意味ですか?