GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王睿平

今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリジェントエージェントを構築する取り組みを始めていますが、それらは常に単純なタスクを実行するレベルに留まっており、複雑なタスクを深く探求する能力が欠けています。これは、以前の大規模な言語モデルが対応する「幻覚」の問題を引き起こし、開発を妨げていたためでもあります。

しかし、Meta はこの「呪い」を打ち破り、「MetaGPT」と呼ばれるフレームワークをオープンソース化しました。このフレームワークは、リリースからわずか数週間でインターネット全体で人気を博しました。現在、Github で 16.9k のスターを獲得しており、人工知能の分野で Meta が放ったもう 1 つの大ヒット作となっています。

写真

Github のオープンソースリストから、MetaGPT がさまざまな役割を抽象化でき、プロダクトマネージャー、アーキテクト、プロジェクトマネージャー、プログラマーを統合する AI ツールであることがわかります。驚くべきことは、コード生成中に内部監視を実行できるため、最終的な出力コードの品質が向上することです。

これにより、ソフトウェア企業のR&Dワークフローが完全に変わり、企業のR&D効率の向上に役立つだけでなく、R&Dコストの削減にも役立ちます。

そのため、開発者は一般的に「このモデルは『実際のソフトウェア開発プロセスをシミュレートする』際に、より多くの変数とより優れた監視を提供でき、競合製品によって生成される出力結果もより有利である」と述べています。

1. マルチエージェントメタプログラミングフレームワーク

簡単に言えば、MetaGPT によって構築されたマルチエージェントメタプログラミングフレームワークは、LLM によって駆動されるマルチエージェントコラボレーションに、メタプログラミング手法として効果的な人間のワークフローを組み込むことを目的としています。モデルのプログラミングフレームワークは、ChatGPT とソフトウェアアウトソーシング会社の SOP トレーニングに基づいています。その中でも、コード＝SOP（チーム）が中核となる理念です。

ソフトウェア会社のマルチロール図（徐々に実装中）

フレームワーク図に示すように、上司の「一文」の要求に応じて、製品ドキュメント、アーキテクチャ設計、タスクリスト、コードなどを出力でき、大規模な言語モデルで構成された仮想チームとみなすことができます。

写真

まず、MetaGPT は標準化された操作手順 (SOP) を Prompt にエンコードして、マルチエージェントコラボレーションプロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、エージェントと人間の作業員に、出力を検証して複合的なエラーを減らすための対応する専門分野の知識を与えました。

このように、MetaGPT はワークフローの形式で各エージェントに異なる役割を割り当て、複雑なマルチエージェントコラボレーション問題を効果的かつ一貫して分解できるフレームワークを確立します。

写真

公式ドキュメントには具体的なインストール方法も示されています。そこに「python startup.py」と入力し、「Toutiao」に似た推奨システムを記述します。データ構造やAPI設計など、一連の出力が得られます。

コストについては、分析と設計を含むサンプルの生成には約 0.2 ドル (GPT-4 API のコスト) かかり、プロジェクト全体を完了するには約 2.0 ドルかかります。

図: MetaGPT フレームワーク

ITBEAR で公開されている科学技術情報からも、MetaGPT モデルがさまざまな開発タスクに適用できることが示されています。アルゴリズム推奨システムを構築する必要がある場合、モデルはシステムの適用対象集団を分析し、適用対象集団の特性をリストして対応する機能要件を提案し、最後にコードを生成して検証することができます。従来の手動開発と比較して、これらのタスクを短期間でより迅速に完了できるため、開発コストを削減できます。

構造化されたプロセス、エージェントのコラボレーション、高度なモデル駆動型技術の融合により、ソフトウェア開発の状況は変化しています。このプロセスにおいて、研究者の主な貢献は、メタプログラミングフレームワークの導入、手動の SOP プロセス設計の統合、最先端のパフォーマンスの達成などです。

結果は、MetaGPT が LLM における幻覚問題に対処し、LLM システムが協力してより効果的な設計を完了できるように導く可能性があることを示しています。

これは良いように思えますが、手動開発を完全に置き換えることはできません。開発者は、一般的なモデルの出力結果に対して心理的な期待を持つ必要があります。結局のところ、このようなシナリオでは、より良い結果を得るために、専門的な垂直分野の知識トレーニングが必要です。

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

オールラウンドな AI ツールとして、MetaGPT は製品マネージャー、アーキテクト、プロジェクトマネージャー、エンジニアの役割を直接果たし、開発関連のあらゆる作業を担当します。主な機能は、コードをインテリジェントに生成すること、つまり、要件を入力した後に完全なコードを「書き込む」ことです。

具体的には、製品の PRD ドキュメントでも、プロジェクトのアーキテクチャ分析でも、それらを完全に書き出すことができ、使用する言語とフレームワークをプロンプトし、最後に関連するフローチャートを自動的に生成できるため、非常にプロフェッショナルです。

前述の GPT-Engineer は、単一のエンジニアの役割のみを「果たす」のに対し、MetaGPT は複数の役割を果たすことができ、これが最大の利点です。サーバーインターフェイス仕様を完全にリストし、コードロジックを自動的に分析し、各ファイルの用途を通知することもできます。

写真

ネットユーザーの中には興味を持った人もいて、これを使って Snake ゲームのコマンドラインバージョンを作成しました。コード生成の効果はかなり良好でした。ヘビは実際に走ったり、豆を食べて尻尾を生やしたり、自分自身や壁にぶつかってもリセットしたりできます。

写真

さらに、MetaGPT では、コード、図、コメント、ドキュメントなどを含むブラックジャックゲームを約 10 分でわずか 2 ドルで構築できるため、AGI への道がさらに開かれます。

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

MetaGPT フレームワークには明るい未来があります!モデルを詳しく見てみると、実際には複数のインテリジェントエージェントが連携して複雑なソフトウェアの問題を解決する完全なソフトウェア会社であることがわかります。

具体的には、Sop をプロンプトとしてエンコードするために、MetaGPT は、ロール定義、タスク分解、プロセス標準化、およびその他の技術設計を通じて、1 行の要件のみでエンドツーエンドの開発プロセスを完了します。関連論文も発表されています。

写真

実験結果では、MetaGPT がより高度で包括的なソリューションを生成できることも示されています。既存の会話型およびチャットベースのマルチエージェントシステムよりも一貫性があります。

最後に、設計の有効性を検証するために、研究者は共同ソフトウェア開発のワークフローを実証し、関連するコードの実現可能性を検証するための関連する実験を実施しました。

コード生成ベンチマークでは、MetaGPT は 81.7% と 82.3% という新たな最高値を達成しました。つまり、他の LLM ベースのプログラミングフレームワーク (AutoGPT、LangChain、AgentVerse など) と比較して、MetaGPT はより高レベルのソフトウェアを処理し、複雑な問題を解決し、幅広い機能で際立っています。

関連する実験評価において、MetaGPT は 100% のタスク完了率を達成し、MetaGPT フレームワークの高い効率性をさらに裏付けたことは注目に値します。

要約すると、この研究では、標準的な操作手順を統合することにより、LLM ベースのマルチエージェントシステムの変革パラダイムを概説します。これにより、マルチエージェントの相互作用と関連する協力のための新たな道が開かれ、人工知能が再定義されるだけでなく、AGI への道も示されます。

4. 制限: 複雑な情報を処理できない

ただし、MetaGPT にはいくつかの制限があることに注意することが重要です。たとえば、MetaGPT では単一ページのアプリケーションしか作成できず、複数のページやデータベースなどの複雑な情報を処理することはできません。したがって、アイデアが非常に複雑な場合、MetaGPT はアプリケーションを正しく生成できない可能性があります。

これらの制限にもかかわらず、MetaGPT はシンプルなアプリケーションを作成するための効果的なツールとして有望です。さらに、その使いやすさはソフトウェア開発市場に大きな影響を与え、経験豊富なプログラマーの必要性を減らす可能性があります。

参考: https://arxiv.org/pdf/2308.00352.pdf

<<:

>>: ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

ブログ

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

1. マルチエージェントメタプログラミングフレームワーク

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

4. 制限: 複雑な情報を処理できない

最新のAIオープンソースプロジェクト12件をダウンロードする必要があります

AIとIoTの相互運用性に対する需要は2021年も増加し続ける

OPPO 広告想起アルゴリズムの実践と調査

Google は一連の大きな動きを発表しました: Gemini Pro は中国語をサポートし、Bard は描画を学習し、新しいモデルが利用可能になりました

河南省鄭州市：自動運転オンライン配車サービス車両が一般公開

AIアルゴリズム企業パシフィック・フューチャー・テクノロジーの文化観光ソリューションがOCTカラープラネットに上陸

フェイフェイ・リーの「具現化された知能」に関する新たな成果！ロボットは、大きなモデルに接続することで人間の言語を直接理解し、事前のトレーニングなしで複雑な指示を完了することができます。

大規模なモデル開発スタックが準備完了です。

推薦する

Microsoft CTO: AI は地方の住民がパンデミックを乗り切るのにどのように役立つのでしょうか?

AIは人間よりはるかに優れています。AIが意識を持つようになったら、人間はAIに取って代わられてしまうのでしょうか？

GPT-4 はタイプ I の性格を持っていることが判明しました。ビッグモデルMBTIテストがByteから登場

AI はなぜこれほど普及しているのに、実装が難しいのでしょうか?

LLM-Blender: 大規模な言語モデルも学習に統合可能

機械学習における正規化とはどういう意味ですか?

AIベースの顔認識は工場にとって次の技術的マイルストーンとなる

大規模ナレッジグラフデータストレージの実践的分析

人工知能はすべての未来でしょうか?

人工知能が物理学に及ぼす影響