清華大学がゲーム会社を設立しました! 10人以上のChatGPTが勤務し、7分でゲームを開発

清華大学がゲーム会社を設立しました! 10人以上のChatGPTが勤務し、7分でゲームを開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

清華大学はChatGPTを使用して、上司から従業員まで全員がAIである「人間コンテンツゼロ」の「ゲーム会社」を設立しました。

アイデアさえ出せば、AI が設計からテストまでの全プロセスを支援します。

全体のプロセスは完了するまでにわずか 7 分しかかからず、費用は0.3 米ドル未満(2 人民元強)です。

写真

この「会社」の名前は「ChatDev」です。名前の通り、チャットによる開発を目的とした会社です。

「会社」では、10 個以上のチャットボットがさまざまな役割を果たし、相互に接続して開発作業を完了します。

ChatGPT を使用すると、各リンクごとに対応するモデルをトレーニングする必要なく、プロセス全体を完了できます。

この「会社」がゲームを開発するのにかかる平均時間は 409.84 秒です。最も速い場合は 3 分未満、最も遅い場合は 17 分しかかかりません。

写真

消費量に関して言えば、ChatDev は ChatGPT の API (3.5-turbo) を使用しており、各ゲームは平均で約 48.5K トークンを使用します。

このデータに基づくと、これを使用してゲームを開発する場合の平均コストは、ゲーム 1 つあたりわずか 0.2967 ドルです。

それで、この「会社」はどのように機能するのでしょうか?

AIを連携させる

研究チームは、この「企業」のために、ChatGPT で接続された「ChatChain」を設計しました。

各ボットは、CEO、プログラマー、デザイナーなど、ゲーム開発に関わるあらゆるポジションをカバーし、異なる役割を果たします。

間違いや錯覚を避けるため、開発プロセスのすべてのステップは 2 つのボットによって完了されます。

写真

具体的には、ChatDev はゲームを作成するときに、設計、プログラミング、テスト、ドキュメント作成という4 つの主要なステップを踏む必要があります。

設計段階が始まる前に、人間が最初のアイデアを提供します。これが人間が必要となる唯一の場所です。

このアイデアは、ボットが演じる CEO、CTO、CP (製品) O によって分析および評価されます。

CEO は CPO および CTO と個別に話し合い、ゲームのプレゼンテーション形式 (Web/デスクトップ/モバイルなど) と使用するプログラミング言語を決定します。

写真

さらに、設計段階では、各ボットが担う特定の役割が 2 人のインストラクター (ボット) によって割り当てられます。

デザイン作業の品質を向上させるために、チームは「メモリフロー」と「自己反映」という 2 つの作業メカニズムも導入しました。

写真

「メモリ ストリーム」は、各ボットがいつでも確認してアイデアの一貫性を確保できるように、会話の各ラウンドの記録を保存します。

「自己反映」メカニズムは、ボットがそれぞれのタスクを完了したが要件を満たせなかった場合に「疑似自己」を生成し、問題と関連する会話をインストラクターにフィードバックすることです。

設計作業が完了したら、コードの記述やグラフィカル インターフェイスの設計を含むプログラミング フェーズに入ります。

CTO はプログラマーに要件と概要を伝え、プログラマーはコードを作成します。

デザイナーは GUI ソリューションを生成し、関連ツールを呼び出して画像リソースを生成します。これらのリソースはプログラマーによって統合されます。

写真

プログラミングプロセスでは、具体的には「コード管理」や「思考誘導」など、品質と効率を向上させる作業メカニズムも導入されています。

コード管理メカニズムにより、開発プロジェクトに複数のバージョンを保存できるため、問題が発生したときにロールバックできます。

思考誘導メカニズムの 2 番目のポイントは、CTO とプログラマーが「役割を交換」して、お互いのアイデアを理解し、問題が発生したときにうまく解決できるようにすることです。

写真

プログラムが書かれたら、次はそれをテストします。

テストフェーズは、コードレビューと実際の操作の 2 つのステップに分かれており、「コードレビュー担当者」と「テストエンジニア」という 2 つの役割が関与します。

テストプロセスでは、「思考ガイダンス」メカニズムも導入されています。テストのフィードバックが不明瞭な場合は、プログラマーとテストエンジニアが役割を交換します。

写真

テストが完了するとゲーム本体は完成し、次に行うべきことはドキュメントの作成です。

ドキュメントには、主に環境の説明とユーザー マニュアルの 2 つのカテゴリが含まれます。

前者は、ゲームの実行に必要な環境を記述したもので、CTO の指導の下、プログラマーによって完成されます。

後者は CEO によって決定され、CPO によって生成されます。

写真

この時点でゲームの開発は完了です。

最初のアイデアを提供する以外、プロセス全体に人間は登場しません。

もちろん、このプロセスにおける会話、コード、その他の情報は人間に見えるため、開発の柔軟性が確保されます。

必要に応じて、生成された GUI を置き換えるなどの手動介入も可能です。

写真

上記は ChatDev の作業プロセスの完全な紹介です。

チームについて

ChatDev は、清華大学 NLP 研究所の Maosong Sun 教授の指導の下で作成されました。彼の研究分野には、自然言語理解と中国語情報処理が含まれます。

この研究室の劉志源准教授は、この論文の共同責任著者です。彼の研究分野は、ナレッジグラフとセマンティックコンピューティング、ソーシャルコンピューティング、計算社会科学です。

論文の筆頭著者は清華大学ソフトウェア学院を卒業したチェン・チェン博士です。チェン博士は2016年に北京理工大学から博士号を取得するため清華大学に直接入学しました。2021年に卒業後、テンセントに応用研究者として入社しました。

もう一つ

ChatDev は AI を活用して役割を果たし、企業の社会的シナリオをシミュレートします。

この「AIゲーム会社」に限らず、AIを使って人間社会をシミュレートすることは研究トレンドとなっている。

例えば、以前ご紹介した「ゲーム版ウエストワールド」では、AIを使ってNPCを制御し、ゲーム内で社会を構築しています。

別のチームは AI を使用してキャラクターを制御し、サウスパークの背景に基づいたテレビシリーズのエピソードを制作しました。

写真

AI がシミュレートできる他の環境にはどのようなものがあると思いますか?

論文アドレス: https://arxiv.org/abs/2307.07924

<<:  話題の論文「14行のコードがBERTを打ち負かす」に逆転の兆し!バグを修正すると、パフォーマンスは数秒で最悪になります

>>:  人工知能は防衛システムをどのように変えるのでしょうか?

ブログ    
ブログ    

推薦する

2D ガール ジェネレーター、駆動可能なニューラル ネットワーク... 2019 年の優れた機械学習プロジェクト 17 選

2019 年のベスト オープンソース プロジェクトを選択するために、Medium のネットユーザーが...

マルチモーダル生成AIの深掘り

マルチモーダル生成型人工知能 (GenAI) は、汎用人工知能の実現に向けた次の大きな進歩と言えます...

まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるた...

サッカーボールとハゲ頭の区別がつかないAIがプレミアリーグのファンにまたもや嫌われる

スポーツにおける AI はどの程度信頼できないのでしょうか?先月、スコットランドサッカー選手権の試合...

表の数学的推論の正解率は98.78%です! UCLA が新しい「カメレオン推論フレームワーク」を発表

自然言語処理タスクで目覚ましい成功を収めた大規模言語モデル (LLM) は、優れたパフォーマンスを示...

仕事に同行することから出勤やフィットネスの管理まで、AI はますます多くのことを処理します。

過去2年間、人工知能によって人事部門が消滅するという議論をよく耳にしてきました。しかし、実際には誰も...

現実は素晴らしい、Googleとコーネル大学が提案した実画像補完技術RealFill

休暇で旅行するときは、写真を撮ることが必須です。しかし、景勝地で撮影した写真の多くは、背景に何かが写...

6月にはロボット産業が再び活況を呈し、数十億元の資金調達が相次いだ。

科学技術の継続的な発展により、ロボットは業界でますます注目され、支持されるようになっています。ロボッ...

...

機械分野では人材不足が起きているのでしょうか?人工知能の時代はあなたが思っているよりもずっと早く来ています!

人工知能の時代が来るとよく言われます。20年後に私たちの子供たちが社会に出たとき、彼らはおそらくロボ...

DeepMind: ビッグモデルのもう一つの大きな欠陥は、正しい答えが事前にわかっていなければ推論を自己修正できないことだ。

大規模言語モデルのもう一つの重大な欠陥が DeepMind によって明らかにされました。 LLM は...

テレンス・タオ:私の数学的経験に基づくと、室温超伝導LK-99とその再現は非常に刺激的です

昨今、室温超伝導の再現に対する世界的な熱気は衰えを知らず、さまざまな有力者が自らの見解を表明している...

...

...

自動運転は「終焉」に向かっている

技術導入への困難な道のりは、特定の客観的な法則に従わなければならず、それはいかなる利害関係者の意見に...