AIはセルオートマトンを通じてMinecraftで家を建てることを学ぶ

AIはセルオートマトンを通じてMinecraftで家を建てることを学ぶ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

「MineCraft」というゲームに詳しい読者なら、この絵はお馴染みのはずです。

△画像出典:サイエンスマガジン

しかし、もしその家が人間ではなく AIによって建てられたらどうなるでしょうか?

これは、コペンハーゲンIT大学、ヨーク大学、上海大学の学者が3Dニューラルセルラーオートマトン(NCA)を使用して行った新しい研究です。

静的な構造物も生成できます。もちろんアパートだけでなく、木や城も生成できます。

△画像出典:サイエンスマガジン

這う毛虫などの機能的な機械も生成できます。

△画像出典:サイエンスマガジン

二つに切ると再生魔法も発動し、分裂に成功します…

(え~絵のセンスあるよ)

これはどうやって行うのですか?

ニューロンセルオートマトン応用

研究者たちは実際に「ライフゲーム」のセルオートマトン (CA)にインスピレーションを受け、2D をベースにした3D ニューラルセルオートマトン (NCA)を開発しました。

「ライフゲーム」はセルオートマトン原理に基づいており、セルオートマトンをデモンストレーションしたものとも言えます。

これは1970年にイギリスの数学者ジョン・コンウェイによって発明されました。グリッドでは、各四角形にセルが存在し、その状態は周囲の 8 つのセルによって決定され、黒はセルの生存を表します。

その後、多くの研究で、ニューロンセルオートマトン (NCA)として知られる、より複雑なニューラルネットワークルールが採用されました。ただし、そのアプリケーションは主に 2D 構造に限定されており、単純な 3D 構造しか生成できません。

NCA の実用化における汎用性を向上させるために、研究チームは3D NCAを開発しました。

3D 畳み込みを利用して、より多くの周囲のセルをキャプチャし、より多くの種類の構築ユニットを持つ複雑な3D 構造を生成します。

△3Dニューロンセルオートマトン更新ルール

研究者らは、教師あり学習を使用して再構築損失を最適化し、NCA を使用して単一の生きた細胞からターゲットエンティティを生成しようとしました。

さらに、「Minecraft」内のエンティティは 3D グリッド内のセルとして扱われ、その状態ベクトルにはブロック タイプ、生存ステータス、非表示ステータスが含まれます。

しかし、各ユニットは単一のブロックタイプであるため、構造再構築タスクをマルチクラス分類問題として定式化し、特定のユニットのタイプを予測します。

Pytorch が提供する LogSoftmax および NLLLoss メソッドの組み合わせは、ターゲット セル構造と予測セル構造間のクロス エントロピー損失を最小化するために使用されます。

この損失によりパフォーマンスが不安定になり、モデルは「空気」ブロックを優先するようになります。

トレーニング中、通常、「空気」ブロックは選択された構造の大部分を占めるため、トレーニング データが不均衡であると、モデルが過剰予測する可能性があります。

この問題に対処するため、研究者らは損失計算を「空気」ブロックとして分類されるかどうかに基づいて 2 つの部分に分割し、非空気ブロックとエンティティ間の絶対差を測定するための交差オーバーラップ (IOU) コストを追加して精度を向上させました。

パフォーマンスはどうですか?

研究者らは、静的構造と動的機能機械の再構築におけるモデルのパフォーマンスを評価し、さまざまなパラメータを記録しました。

結果は、NCA の再構築能力が堅牢であることを示しています。

△正規化IOU/構造損失

△正規化総損失

ただし、NCA では、モデルが局所的最小値に陥り、トレーニングに時間がかかることが多いため、より大きなエンティティ (教会など) をモデル化するのは依然として困難です。

大聖堂モデルは一部のエンティティよりも損失が低いですが、ランダムに生成された構造が多く、他のエンティティほど自然ではありません。ターゲット構造と生成された効果の比較:

さらに、自然界に見られるランダムなエンティティ(オークの木など)を生成するのはより困難です。

前述のように、NCA は静的な構造を生成することができ、個々のブロックタイプの数を増やすのに適しており、アパートの建物の内部のような多様で複雑な内部を生成します。

驚いたことに、ジャングル寺院では NCA が矢の罠さえも生成しました。

研究者たちは、機能的な機械を生成する際に、異なる構造が異なるパターンを生成することを発見しました。

いくつかの構造は小さな細胞から徐々に最終形態に成長しますが、一方、幼虫は急速に構築し、その後細胞を除去して最終構造を形成します。

△画像出典:サイエンスマガジン

さらに、NCA の再生特性も注目すべき点です。単一細胞から複雑な構造を成長させることに加えて、これらの局所的な更新ルールにより、損傷の再生または修復も可能になります。

トレーニングを行わなくても、木などの特定の損傷した構造物を回復できます。

しかし、比較テストを行った結果、研究者らは次のことを発見しました。

再生トレーニングを行わない場合、モデルの再生成率はわずか 30% でしたが、再生トレーニングを行った後、生成率は 99% に達しました。

3D NCA はネットユーザーから広く注目を集めており、Reddit の一部ネットユーザーは次のように述べています。

NCA の物理学への応用も検討する価値があります。たとえば、結晶形成をシミュレートするために使用できます。

<<:  機械学習に基づく自動脆弱性修復分析法

>>:  AI、機械学習、ディープラーニングの解放

ブログ    
ブログ    

推薦する

マイクロソフトは、重大なセキュリティ脆弱性を97%の精度で特定できるAIシステムを開発した。

Microsoft は、テストにおいてセキュリティ脆弱性と非セキュリティ脆弱性を 99% の精度で...

アルゴリズム問題演習 - 大規模ブラックリスト IP マッチング

多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...

...

オートメーション研究所の拡散モデル「Brain Reading」、MindDiffuserは人間の脳の視覚イメージを鮮明に再現します

脳信号から対応する視覚刺激を再構築することは、意義深く困難な作業です。これまでの研究では、一部の自然...

放送・ホスティング業界における人工知能の限界についての簡単な分析

[[430680]]科学技術の継続的な発展により、人工知能は人間の生活のあらゆる側面に関わるだけでな...

GPT-4とMidjourneyに加えて、Tan Pingの起業家チームは3D基本モデルを構築したいと考えています。

少し前にOpenAIが驚くべき生成効果を持つグラフィックモデルDALL・E 3をリリースしました。た...

...

機械学習が将来の雇用市場にどのような影響を与えるか

機械学習は、あらゆる業界、特に雇用と求人市場に変革をもたらし、エントリーレベルの職からトップレベルの...

人工知能、自動化、そして仕事の未来: 答えが必要な 10 の質問!

[[264418]]職場で機械が人間の労働に取って代わるようになるにつれ、私たち全員が機械から利益...

シアトル港が機械学習を活用して航空貨物業務を効率化する方法

シアトル港は100年以上の歴史がありますが、非常に新しい技術を導入しています。シアトル港とシアトル・...

ニューラルネットワークが大きいほど良いのはなぜですか? NeurIPSの論文が証明:堅牢性は一般化の基礎である

ニューラルネットワークの研究方向が徐々に超大規模な事前トレーニング済みモデルへと移行するにつれて、研...

人工知能の知られざる歴史: 目に見えない女性プログラマーたち

この 6 部構成のシリーズでは、AI の人類史を探り、革新者、思想家、労働者、さらには小規模なトレー...

...

VRの悪夢にさよならしましょう! Meta Reality Labs は仮想世界の問題点を解決し、新しい VR の世界を再構築します

「世の中には2種類の人がいます。VRが世界を変えると考える人と、まだVRを試したことがない人です。」...

人工知能を人間化して、その信頼性を確立するにはどうすればよいでしょうか?

人工知能 (AI) はブラックボックスの実践と見なされることが多く、テクノロジー自体の仕組みではなく...