AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

最近、GitHubは新しいAIエージェントプロジェクト「AutoAgents」を立ち上げました。このプロジェクトはLinkSoul.AIチームが主導し、Llama2モデル[1]のリリースの翌日に中国語版のモデルをダウンロード用にリリースし、北京大学、香港科技大学、智源科技、ウォータールー大学が共催しました。参入障壁が高く、使用シナリオが限られているAutoGPT [2]やMetaGPT [3]と比較して、AutoAgentsはAIエージェントをあらゆるシナリオに適用し、対象シナリオに合わせてエージェントの合理的な組み合わせを自動的に設計し、複雑なタスクを役割とタスクに分解し、適切な役割が一致するタスクを解決できるようにすることに取り組んでいます。


  • プロジェクトリンク: https://github.com/LinkSoul-AI/AutoAgents
  • オンライン体験: https://huggingface.co/spaces/LinkSoul/AutoAgents

あらゆるシナリオでエージェントの適切な組み合わせを自動的に計画します

AutoAgents は、あらゆるシナリオに対応するユニバーサル ソリューションを提供することに注力しています。ユーザーの要件を 1 文入力するだけで、対象シナリオに適したインテリジェント エージェントのチームを迅速に編成し、複雑なタスクを自動的に分解して、適切なインテリジェント エージェントが連携して対応するタスクを完了します。

小説を書く

例えば、入力

「人工知能の覚醒についての小説を書く」

AutoAgents は「プロジェクト マネージャー」(プランナー) を起動し、現在のタスクを完了するために必要な他のロールと、各ロールがタスクを完了するために必要な特定のアクションを設計します。

このタスクを達成するには、プランナー デザインに複数の専門家が必要です。AI とその潜在的な覚醒についての情報を収集する研究者、小説のアウトラインを作成するストーリー プランナー、魅力的なキャラクターを作成するキャラクター開発者です。最後に、物語を書くライターが必要です。

さまざまな分野の専門家はすべて AI エージェントによって演じられ、計画に従ってタスクを実行します。たとえば、ストーリー プランナーは研究者から提供された検索情報を使用して、クライマックスとどんでん返しの両方を含むストーリーの導入部を書き、ストーリーをより魅力的なものにしました。

最後に、物語を書き終えるのは作家の責任です。さまざまなロールプレイングエージェント間の分業と協力を通じて、小説執筆タスクは効率的に完了しました。

小規模ゲームの迅速な実装

AutoAgents を使用すると、誰でも非常に低コストで小規模なゲーム開発チームを簡単に構築できます。AutoAgents は、プロジェクト マネージャー、プログラマー、テスター、その他の役割の「採用」に役立ちます。 ChatGPT を含む既存の一般的なソリューションとは異なり、プログラムとの継続的な対話の過程で、プロンプトを手動で記述し、使用するプログラミング言語を確認し、プロジェクトを計画し、ゲーム キャラクターを設計し、一連の面倒な作業を行う必要があります。AutoAgents では、タスクの目標を明確にするだけでよく、以下に示すように非常に簡単です

CLI スネーク ゲームのコード スニペットを表示

AutoAgents は必要なロールを作成し、そのロールに責任と機能を割り当て、各ロールが使用できる外部ツールのリストを決定します。その後、それぞれの役割が計画に従って順序よくタスクを実行し、互いに協力し合い、最終的に目標を達成します。

噂の検証

ソフトウェアやゲーム開発シナリオだけでなく、強力なシーン適応性を備えた AutoAgents は、あらゆる新しいシナリオに対して適切な「新しいエージェントの組み合わせ」を自動的に設計し、問題を解決できます。日常生活でも噂に悩まされることがあるかもしれません。噂を検証するためにドメイン エキスパートと言語エキスパートを自動的に作成する AutoAgents を利用できます。最近の LK-99 超伝導体インシデントを例にとると、AutoAgents にリクエストを送信するだけで済みます。

LK-99は本当に室温超伝導材料ですか? (LK-99は本当に室温超伝導物質なのでしょうか?)

AutoAgents は、材料科学者と言語専門家を自動的に作成し、インターネット上の既知の情報を自動的に整理して、LK-99 の状態を確認します。

上記は AutoAgents テクノロジーの単純な試みにすぎません。実際、その応用の可能性は私たちの想像力によってのみ制限されます。シナリオに関係なく、AutoAgents は最適な役割を作成し、分業を完了して、タスクを効率的に完了するのに役立ちます。

太陽に向かって進む若いチーム

先週末(8月26日)、LinkSoul.AIの創設者兼CEOであるShi Yemin博士は、Syncedが主催した「Llama 2大規模モデルアルゴリズムとアプリケーション実践」イベント[7]でLinkSoul.AIのマルチモーダル大規模モデル技術について発表し、Syncedのインタビューも受けました。

石イエミンは北京大学で学士号と博士号を取得し、黄鉄軍教授に師事しました。2013年からディープラーニングと事前学習済みモデルの研究を行っています。人工知能学院のイノベーション応用研究室長として、WuDao 3.0の開発に参加しました。市販されている中国語の教育データセットとしては最大規模のCOIGとCOIG-PCの発起者および主催者の一人です。CAMEOタンパク質構造予測コンテストで1位を獲得し、初の中国ラマ2モデルである中国ラマ2 7B [4]の開発を主導しました。また、中国語と英語のマルチモーダルモデルであるChinese Llama 2 [5]と、初の中国語と英語のバイリンガル音声テキストマルチモーダル対話モデルであるLLaSM [6]をオープンソース化しました。

Synced: チームの背景を簡単に紹介していただけますか?

Syncedのインタビューをありがとうございます。私たちはLinkSoul.AIというスタートアップです。私たちが目指すのは、人間とAI、AIとAIの精神的なつながりを実現することです。簡単に言うと、AIが人々の心の底から役に立つ存在になることを望んでいます。私たちのチームはまだ初期段階にあり、人数も多くありません。チームメンバーは主に北京大学、AI研究所、Huawei、ByteDanceなどの一流企業、大学、研究機関から来ています。オペレーター開発、クラスター構築、大規模モデルの事前トレーニング、命令の微調整、マルチモーダル大規模モデルのトレーニング、製品開発、発売の完全な経験を持ち、大規模モデルの開発、改善、発売の能力を備えた中国で数少ないチームの一つです。

Synced: LinkSoul.AI が複数のモデルを迅速にオープンソース化し、さらに AutoAgents テクノロジーをオープンソース化するという決定の背景には、どのような考慮事項があるのでしょうか?それはチームの時間の無駄になるでしょうか?

LinkSoul.AI をオープンソース プロジェクトに重点を置いた会社にするつもりはありません。中国の Llama 2 モデルは、チームが余暇に作った試みです。Llama 2 のリリースと時期が重なったため、トレーニングしてオープンソース化しました。チームは、コミュニティがマルチモーダル モデルとその技術的応用にもっと注目してくれることを期待して、画像と音声のマルチモーダル モデルをオープンソース化することを選択しました。チームは、マルチモーダル モデルがますます重要な役割を果たし、ゲーム、ソーシャル ネットワーキング、AR/VR/MR などの分野でますます重要な役割を果たすと考えています。 AutoAgents がオープンソースになったことで、AI エージェントの分野でのチームの長期にわたる蓄積がオープンソース コミュニティに貢献できることを期待しています。 LinkSoul.AI は、主にチームのこれまでの研究の蓄積に基づいて、新しい結果を迅速にリリースできます。これは日常業務の継続であり、大学、研究機関、企業との共同研究開発に大きく依存しているため、チームの注意をそらすことはありません。

Synced: Llama などのオープンソース モデルが急速に進歩している現在、これは大規模な国内モデル、特に基礎モデルの開発にどのような影響を与えるでしょうか?誰もが独自のモデルをトレーニングするのは過去のことでしょうか?

オープンソースとクローズドソースはどちらも非常に重要な分野だと思いますが、特にオープンソースモデルは超大規模モデルで試すのが難しく、クローズドソースモデルは再開発やトレーニングが困難です。一方、Llama モデルは現在主に英語で提供されており、中国語のサポートはまだ十分ではありません。Llama をローカライズする既存の試みは、成功しているとは言い難いです。したがって、大規模な中国モデルの需要だけを考慮したとしても、中国で大規模なモデルをトレーニングすることは依然として価値があります。

Synced: オープンソースの AutoAgents テクノロジーにはどのような革新性がありますか?

大規模言語モデルに基づく既存のマルチエージェント システムのほとんどは、タスクを完了するために事前定義されたエージェントに依存していますが、これらの事前定義されたエージェントはさまざまなシナリオへの適応性を制限します。 AutoAgents は、さまざまなタスクに応じてさまざまなミッション シナリオに適応する AI エージェントのチームを適応的に作成し、生成された AI エージェントの組み合わせに基づいて現在のタスクのソリューションを計画します。複数のエージェントの連携を自動的に計画することで、タスクを効率的に完了できます。同時に、実行環境には、実行結果に基づいて実行計画を動的に改善し、より正確なソリューションを生成するオブザーバーが存在します。 AutoAgents は、チームワークにおいて異なるタスクに異なる役割を割り当てることの重要性を強調し、複雑なタスクを処理するための新しい視点を提供します。

Synced: AutoAgents は LinkSoul.AI にとってどのような価値をもたらしますか?

LinkSoul.AIは、すべての人に役立つAIを提供することに尽力しており、AIを呼び出す能力が特定の人々の特権ではなくなるように、人間とAI、AI同士のコミュニケーションミドルウェアを構築したいと考えています。 AutoAgents は、AI と AI 間のコミュニケーションを改善し、AI エージェントを呼び出すハードルを誰もが利用できるレベルまで下げようとするチームの試みです。現段階では、AutoAgents はまだ有料の大規模モデル API サービスに依存しています。今後、チームは専用のエージェント生成モデル、エージェント スケジューリング モデルなどを開発して、API を置き換える予定です。同時に、LinkSoul.AI はより多くの人々と AI、AI と AI の実験も行い、人々に最も極端な AI 体験をもたらすことを目指しています。

AutoAgents ローカル展開

最後に、AutoAgent をローカルに展開することも非常に便利です。以下の手順に従うことで、AutoAgents の展開をローカルで簡単に完了できます。

ステップ1: プロジェクトリポジトリをダウンロードする

git clone https://github.com/LinkSoul-AI/AutoAgents cd AutoAgents

ステップ2: Dockerイメージを作成する

IMAGE="linksoul.ai/autoagents" VERSION=1.0 docker build -f docker/Dockerfile -t "${IMAGE}:${VERSION}" .

ステップ3: Dockerコンテナを起動する

docker run -it --rm -p 7860:7860 "${IMAGE}:${VERSION}"

これら 3 つの手順が正常に実行されたら、ブラウザーでリンク http://127.0.0.1:7860 を開いて、AutoAgents の使用を開始できます。

要約する

AutoAgents は新しく開始されたプロジェクトであり、まだ初期段階にあります。オープンソース コミュニティとオープンソース愛好家の皆様の積極的な参加と貢献を歓迎します。現在、大規模モデルの最も重要な開発方向として、AIインテリジェントエージェント技術は、将来、ソーシャル、ゲームなどの分野で確実に重要な役割を果たすでしょう。 LinkSoul.AI のようなチームがさらに出現し、人工知能技術を推進してすべての人に役立ち、AI の平等を実現することを期待しています。

<<:  ユニバーサルデータ拡張技術、ランダム量子化はあらゆるデータモダリティに適用可能

>>: 

ブログ    
ブログ    
ブログ    

推薦する

30% のトークンで SOTA パフォーマンスを達成、Huawei Noah 軽量ターゲット検出器 Focus-DETR が効率を 2 倍に

現在、DETR モデルはターゲット検出の主流のパラダイムとなっています。しかし、DETRアルゴリズム...

機械学習モデルが公平かどうかを簡単に確認する方法

[[361220]] [51CTO.com クイック翻訳] 私たちはますます分断が進む世界に住んでい...

2022年には大学卒業者数が1000万人を超えるが、AI関連の仕事の月給はたったの2万4000円?

2022年、伝説の「黄金の3月と銀の4月」がやって来ます... 「青銅三・鉄四」に変身しました… ...

AI、5G、エッジテクノロジーが製造業をリード

オフィスから作業場、製品に至るまで、製造業はテクノロジーで溢れており、コネクテッドエコノミーの導入に...

デジタル変革の3つの大きな落とし穴に注意: インテルがPing An Healthcare Technologyに「エンドツーエンド」のAI機能を提供

[51CTO.comからのオリジナル記事] 現在、私たちの周りではデジタル変革が起こっています。デジ...

人工知能がデータセンターのネットゼロカーボン達成を支援

今日、業界や部門に関係なく、私たちは皆、エネルギーと燃料のコスト上昇、原材料費の増加、営業利益率と利...

アルゴリズム学習実践ガイド

[[158318]]ほぼすべてのトップクラスのインターネット企業やソフトウェア企業は、ソフトウェアエ...

2021年の人工知能の注目分野

[[383142]]人工知能、またはよく耳にする AI とは、人間が作った機械が示す知能を指し、コン...

AIとディープラーニングはもはやハイエンドのビデオ監視アプリケーションに限定されたものではない

[[408248]]最近、ディープラーニング AI を活用したビデオ監視プロジェクトに携わったことが...

新しい展開のアイデア | Minuet: GPU での 3D スパース畳み込みの高速化

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

AIビッグモデルの核となる概念を一挙に解説する人気科学記事

写真トークン、ベクトル、埋め込み、アテンション、これらの AI モデル用語は、いつも馴染みがありそう...

2019年に人工知能をマスターするには?世界のAI専門家が答えを教えます

[[265422]]人工知能はビジネスを変えています。自然言語処理やインテリジェント音声からモノのイ...

推奨システムの結果の品質を評価する方法

推奨システムは、インターネットの発展において最も一般的かつ重要な技術の 1 つです。今日では、あらゆ...

NTU Yu Yangによる徹底分析:「世界モデル」とは何か?

メディアがSoraを大々的に宣伝するなか、OpenAIの紹介資料ではSoraを「世界シミュレーター」...

...