GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平

今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリジェントエージェントを構築する取り組みを始めていますが、それらは常に単純なタスクを実行するレベルに留まっており、複雑なタスクを深く探求する能力が欠けています。これは、以前の大規模な言語モデルが対応する「幻覚」の問題を引き起こし、開発を妨げていたためでもあります。

しかし、Meta はこの「呪い」を打ち破り、「MetaGPT」と呼ばれるフレームワークをオープンソース化しました。このフレームワークは、リリースからわずか数週間でインターネット全体で人気を博しました。現在、Github で 16.9k のスターを獲得しており、人工知能の分野で Meta が放ったもう 1 つの大ヒット作となっています。

写真

Github のオープンソース リストから、MetaGPT がさまざまな役割を抽象化でき、プロダクト マネージャー、アーキテクト、プロジェクト マネージャー、プログラマーを統合する AI ツールであることがわかります。驚くべきことは、コード生成中に内部監視を実行できるため、最終的な出力コードの品質が向上することです。

これにより、ソフトウェア企業のR&Dワークフローが完全に変わり、企業のR&D効率の向上に役立つだけでなく、R&Dコストの削減にも役立ちます。

そのため、開発者は一般的に「このモデルは『実際のソフトウェア開発プロセスをシミュレートする』際に、より多くの変数とより優れた監視を提供でき、競合製品によって生成される出力結果もより有利である」と述べています。

1. マルチエージェントメタプログラミングフレームワーク

簡単に言えば、MetaGPT によって構築されたマルチエージェント メタプログラミング フレームワークは、LLM によって駆動されるマルチエージェント コラボレーションに、メタプログラミング手法として効果的な人間のワークフローを組み込むことを目的としています。モデルのプログラミング フレームワークは、ChatGPT とソフトウェア アウトソーシング会社の SOP トレーニングに基づいています。その中でも、コード=SOP(チーム)が中核となる理念です。

ソフトウェア会社のマルチロール図(徐々に実装中)

フレームワーク図に示すように、上司の「一文」の要求に応じて、製品ドキュメント、アーキテクチャ設計、タスクリスト、コードなどを出力でき、大規模な言語モデルで構成された仮想チームとみなすことができます。

写真

まず、MetaGPT は標準化された操作手順 (SOP) を Prompt にエンコードして、マルチエージェント コラボレーション プロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、エージェントと人間の作業員に、出力を検証して複合的なエラーを減らすための対応する専門分野の知識を与えました。

このように、MetaGPT はワークフローの形式で各エージェントに異なる役割を割り当て、複雑なマルチエージェントコラボレーション問題を効果的かつ一貫して分解できるフレームワークを確立します。

写真

公式ドキュメントには具体的なインストール方法も示されています。そこに「python startup.py」と入力し、「Toutiao」に似た推奨システムを記述します。データ構造やAPI設計など、一連の出力が得られます。

コストについては、分析と設計を含むサンプルの生成には約 0.2 ドル (GPT-4 API のコスト) かかり、プロジェクト全体を完了するには約 2.0 ドルかかります。

図: MetaGPT フレームワーク

ITBEAR で公開されている科学技術情報からも、MetaGPT モデルがさまざまな開発タスクに適用できることが示されています。アルゴリズム推奨システムを構築する必要がある場合、モデルはシステムの適用対象集団を分析し、適用対象集団の特性をリストして対応する機能要件を提案し、最後にコードを生成して検証することができます。従来の手動開発と比較して、これらのタスクを短期間でより迅速に完了できるため、開発コストを削減できます。

構造化されたプロセス、エージェントのコラボレーション、高度なモデル駆動型技術の融合により、ソフトウェア開発の状況は変化しています。このプロセスにおいて、研究者の主な貢献は、メタプログラミング フレームワークの導入、手動の SOP プロセス設計の統合、最先端のパフォーマンスの達成などです。

結果は、MetaGPT が LLM における幻覚問題に対処し、LLM システムが協力してより効果的な設計を完了できるように導く可能性があることを示しています。

これは良いように思えますが、手動開発を完全に置き換えることはできません。開発者は、一般的なモデルの出力結果に対して心理的な期待を持つ必要があります。結局のところ、このようなシナリオでは、より良い結果を得るために、専門的な垂直分野の知識トレーニングが必要です。

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

オールラウンドな AI ツールとして、MetaGPT は製品マネージャー、アーキテクト、プロジェクト マネージャー、エンジニアの役割を直接果たし、開発関連のあらゆる作業を担当します。主な機能は、コードをインテリジェントに生成すること、つまり、要件を入力した後に完全なコードを「書き込む」ことです。

具体的には、製品の PRD ドキュメントでも、プロジェクトのアーキテクチャ分析でも、それらを完全に書き出すことができ、使用する言語とフレームワークをプロンプトし、最後に関連するフロー チャートを自動的に生成できるため、非常にプロフェッショナルです。

前述の GPT-Engineer は、単一のエンジニアの役割のみを「果たす」のに対し、MetaGPT は複数の役割を果たすことができ、これが最大の利点です。サーバー インターフェイス仕様を完全にリストし、コード ロジックを自動的に分析し、各ファイルの用途を通知することもできます。

写真

ネットユーザーの中には興味を持った人もいて、これを使って Snake ゲームのコマンドライン バージョンを作成しました。コード生成の効果はかなり良好でした。ヘビは実際に走ったり、豆を食べて尻尾を生やしたり、自分自身や壁にぶつかってもリセットしたりできます。

写真

さらに、MetaGPT では、コード、図、コメント、ドキュメントなどを含むブラックジャック ゲームを約 10 分でわずか 2 ドルで構築できるため、AGI への道がさらに開かれます。

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

MetaGPT フレームワークには明るい未来があります!モデルを詳しく見てみると、実際には複数のインテリジェント エージェントが連携して複雑なソフトウェアの問題を解決する完全なソフトウェア会社であることがわかります。

具体的には、Sop をプロンプトとしてエンコードするために、MetaGPT は、ロール定義、タスク分解、プロセス標準化、およびその他の技術設計を通じて、1 行の要件のみでエンドツーエンドの開発プロセスを完了します。関連論文も発表されています。

写真

実験結果では、MetaGPT がより高度で包括的なソリューションを生成できることも示されています。既存の会話型およびチャットベースのマルチエージェント システムよりも一貫性があります。

最後に、設計の有効性を検証するために、研究者は共同ソフトウェア開発のワークフローを実証し、関連するコードの実現可能性を検証するための関連する実験を実施しました。

コード生成ベンチマークでは、MetaGPT は 81.7% と 82.3% という新たな最高値を達成しました。つまり、他の LLM ベースのプログラミング フレームワーク (AutoGPT、LangChain、AgentVerse など) と比較して、MetaGPT はより高レベルのソフトウェアを処理し、複雑な問題を解決し、幅広い機能で際立っています。

関連する実験評価において、MetaGPT は 100% のタスク完了率を達成し、MetaGPT フレームワークの高い効率性をさらに裏付けたことは注目に値します。

要約すると、この研究では、標準的な操作手順を統合することにより、LLM ベースのマルチエージェント システムの変革パラダイムを概説します。これにより、マルチエージェントの相互作用と関連する協力のための新たな道が開かれ、人工知能が再定義されるだけでなく、AGI への道も示されます。

4. 制限: 複雑な情報を処理できない

ただし、MetaGPT にはいくつかの制限があることに注意することが重要です。たとえば、MetaGPT では単一ページのアプリケーションしか作成できず、複数のページやデータベースなどの複雑な情報を処理することはできません。したがって、アイデアが非常に複雑な場合、MetaGPT はアプリケーションを正しく生成できない可能性があります。

これらの制限にもかかわらず、MetaGPT はシンプルなアプリケーションを作成するための効果的なツールとして有望です。さらに、その使いやすさはソフトウェア開発市場に大きな影響を与え、経験豊富なプログラマーの必要性を減らす可能性があります。

参考: https://arxiv.org/pdf/2308.00352.pdf

<<: 

>>:  ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

ブログ    
ブログ    

推薦する

Microsoft CTO: AI は地方の住民がパンデミックを乗り切るのにどのように役立つのでしょうか?

[[324043]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

AIは人間よりはるかに優れています。AIが意識を持つようになったら、人間はAIに取って代わられてしまうのでしょうか?

人工知能は、無意識のうちに私たちの生活にほぼ完全に浸透しているようで、人工知能の知能レベルはますます...

...

GPT-4 はタイプ I の性格を持っていることが判明しました。ビッグモデルMBTIテストがByteから登場

誰かが実際に大規模モデルで MBTI をテストしたというのは驚くべきことです。結果は良好です。 Ch...

AI はなぜこれほど普及しているのに、実装が難しいのでしょうか?

過去 10 年間で、5G、ビッグデータ、クラウド コンピューティングなどの新興テクノロジーの登場によ...

...

...

LLM-Blender: 大規模な言語モデルも学習に統合可能

最近、arxiv を見ていたときに、Ensemble メソッドを使用して大規模な言語モデルを統合でき...

...

機械学習における正規化とはどういう意味ですか?

[[279210]]正則化はさまざまな記事や資料でよく見られます。たとえば、一般的な目的関数には次...

...

AIベースの顔認識は工場にとって次の技術的マイルストーンとなる

新型コロナウイルス流行の影響で、人工知能(AI)は工場にとって必須のものとなった。 Google の...

大規模ナレッジグラフデータストレージの実践的分析

1. ナレッジグラフとは何ですか?現実世界にはさまざまなものが存在します。物事の間にはいくつかの種類...

人工知能はすべての未来でしょうか?

画期的なテクノロジーの年である 2023 年が終わりを迎えるにあたり、AI、特に生成 AI は変革の...

人工知能が物理学に及ぼす影響

人工知能(AI)は物理学の分野を含む多くの産業に変革をもたらしています。物理学では、AI は複雑な問...