Facebook Research、ディープラーニングを容易にする3つの新しいフレームワークを公開

Facebook Research、ディープラーニングを容易にする3つの新しいフレームワークを公開

[[318012]]

Microsoft、Google、Facebook、Amazon、Uber などのテクノロジー大手の研究部門が、人工知能 (AI) の分野におけるオープンソース フレームワークに最も積極的に貢献していることをご存知ですか?

彼らの貢献は、社内ソリューションで大規模にテストされたスタックと、研究室から生まれた非常に先進的なアイデアを組み合わせたものです。世界最大のテクノロジー企業がオープンソースのディープラーニングに積極的に貢献していることは喜ばしいことですが、データ サイエンティストがこの分野の新しい開発についていくのは困難です。本日の記事では、Facebook Artificial Intelligence Research (FAIR) が先月オープンソース化した 3 つの新しいバージョンについて説明します。

急速な成長傾向を考えると、これはどのような影響を与えるでしょうか?

FAIR は、ディープラーニングの分野における研究やオープンソース フレームワークに定期的に貢献しています。 PyTorch から ONNX まで、FAIR チームはディープラーニング アプリケーションの使いやすさの向上に多大な貢献をしてきました。過去数週間で、FAIR は 3 つの新しいオープン ソース フレームワークをファミリーに追加しました。

ポリゲーム

Polygames は、セルフプレイを通じてディープラーニング ネットワークをトレーニングするためのオープン ソースの研究フレームワークです。 Polygames は有名な「ゼロ学習」コンセプトに基づいており、エージェントは事前に設定されたトレーニングなしで、環境と対話することで環境を習得できます。

一見すると、Polygames は Alpha Zero や ELF OpenGo などの他のゲーム学習フレームワークと似ているように見えますが、FAIR スタックにも独自の貢献があります。まず、Polygames は、Hex、Havannah、Minishogi、Connect6、Minesweeper、Mastermind、EinStein wurfelt nicht!、Nogo、Othello など、より広範な戦略ゲームをサポートしています。これらは、研究者にディープラーニング ネットワークをテストするためのより広範な環境を提供します。

さらに、Polygames は、ディープ ニューラル ネットワークとモンテ カルロ ツリー検索法を組み合わせた巧妙なアーキテクチャにより、ゼロ学習の従来の概念を拡張します。このアーキテクチャにより、ネットワークをより多くのタスクや環境に一般化できるようになります。 Polygames フレームワークの予期せぬ利点は、エージェントに神経可塑性を生み出すことです。 Polygames のモデルはプログレッシブです。フレームワークには、新しいレイヤーやチャネルを追加したり、カーネル幅を増やしたりするためのスクリプトが付属しています。また、ウォームスタート トレーニングが可能で、トレーニングしながらニューラル ネットワークを成長させることができます。

プログラミング モデルの観点から見ると、Polygames はゲームを含むライブラリと、ゲームを実装する単一ファイル API を提供します。開発者エクスペリエンスは PyTorch に基づいているため、簡単に始めることができます。

FAIR チームは、ゲーム Hex19 でエリートの人間プレイヤーに勝つなど、Polygames でいくつかのマイルストーンを達成しました。 1940年代に詩人、数学者のピート・ハイン、ジョン・ナッシュ、経済学者によって開発されたこのゲームは、ゲームに関する従来の人間の思考プロセスの一部に挑戦するものである。ルールは簡単です。空のセルを黒と白で順番に塗りつぶします。北と南をつなげば黒人が勝ち、西と東をつなげば白人が勝ちます。パイルールによりゲームはより公平になります。2 番目の動きで、2 番目のプレーヤーは色を交換することを決定できます。

このゲームが難しいのは、つながりゲームであるため、報酬がローカル基準ではなくグローバル基準に基づいているためです。

一連の実験で、Polygames は Hex ゲームで人間のトッププレイヤーに勝利しました。結果は下の図に示されています。ここでは、人間のプレイヤーが白いチェスの駒を操作しています。最初の画像は六角形の開口部を示しています。ゲームの第 2 フェーズでは、人間 (白) が勝利しているように見えます。2 つの堅固なグループが東と西に接続し、互いに近くに接続しています。しかし、Polygames はこれを逆転させ、かなり複雑な中心的場所を作り出すことに成功しました。 Polygames は 2 つの可能なパスのうちの 1 つを使用したため、勝利の組み合わせが見つかり、ポジションが展開されました。

Polygames が GitHub でオープンソース化されました

翻訳

PyTorch3D は、3D 環境でディープラーニング ネットワークをトレーニングするためのフレームワークです。現実的な環境で動作する必要がある視覚インテリジェンス システムは多数あるにもかかわらず、3D 環境でそのようなエージェントをトレーニングするためのツールとフレームワークは依然として非常に限られています。 PyTorch3D は、PyTorch を使用した 3D ディープラーニングを容易にするために設計された独自の機能を備えた、高度にモジュール化され最適化されたライブラリです。 PyTorch3D は、高速で微分可能な 3D データ用の一般的に使用される 3D 演算子と損失関数のセットを提供するほか、研究者がこれらの関数を最先端のディープラーニング システムに即座にインポートできるようにするモジュール式の微分可能レンダリング API も提供します。

PyTorch3D は、複雑な屋内空間の画像から完全な 3D オブジェクトの再構築を可能にする FAIR の MeshR-CNN など、3D ディープラーニングにおける最近のいくつかのマイルストーンを活用しています。このフレームワークは、オブジェクトの理解を 3 次元にまで押し上げる、高度に最適化された 2D 認識ライブラリである Detectron2 も使用します。 PyTorch3D の回転と 3D 変換を処理する機能は、注釈の少ないトレーニング データを使用して画像と 3D 形状の関連性を学習する新しい方法である C3DPO の作成にも中心的な役割を果たしました。

PyTorch3D の主な貢献は次のとおりです。

  • 三角形メッシュを保存および操作するためのデータ構造: PyTorch3D は、メッシュと呼ばれるデータ構造に 3D 表現を保存します。このデータ構造により、研究者は、基礎となるグリッド データをさまざまなビューにすばやく変換し、データを最も効率的に表す演算子と一致させることが容易になります。
  • 三角形メッシュでの効率的な操作: PyTorch3D には、3D データ用のいくつかの一般的な演算子と損失関数を最適化するための一連の操作が含まれており、異種のバッチ入力をサポートしています。つまり、研究者やエンジニアは、新しいプロジェクトの開始時にオペレーターを再作成したり使用したりすることなく、PyTorch3D にオペレーターをインポートして、より迅速に実験できるようになります。
  • 微分可能メッシュ レンダラー: PyTorch3D には、モジュール式の微分可能レンダラーが含まれています。レンダラーは構成可能なユニットで構成されており、ユーザーはレンダラーを簡単に拡張してカスタム照明や影の効果をサポートできます。

PyTorch3DはGitHubで入手可能です

ハイプロット

高次元データの探索は、ディープラーニング アプリケーションの課題の 1 つです。 HiPlot は、AI 研究者が高次元データ内の相関関係とパターンを発見し、並列プロットやその他のグラフィカルな手段を使用して情報を表現するのに役立つインタラクティブな視覚化ツールです。 HiPlot は、高次元データを視覚化およびフィルタリングするための便利な方法である並列プロットと呼ばれる手法を使用します。

機能的な観点から見ると、HiPlot は他の視覚化ツールに比べていくつかの利点があります。

  • インタラクティブ性: HiPlot では、並列プロットはインタラクティブであるため、さまざまなシナリオで簡単に視覚化できます。たとえば、1 つまたは複数の軸に沿った範囲または値の取得に重点を置いたり、別の軸に基づいて配色を設定したり、軸を並べ替えたり削除したり、特定のデータ選択を抽出したりできます。
  • シンプルさ: Hiplot を使用するには、数行のコードだけが必要です。 「Hiplot」コマンドを使用してサーバーを使用すると、指定された URL を介してサーバーにアクセスし、実験を視覚化、管理、共有することができます。
  • 集団ベースのトレーニングの視覚化: HiPlot は、異なるデータ ポイント間のエッジを持つ XY プロットで集団ベースのトレーニング実験を視覚化する簡単な方法を提供します。このタイプの視覚化は、ディープラーニングの実験では非常に一般的です。

HiplotはGitHubで入手可能

Facebook の FAIR チームは、ディープラーニングのさまざまな分野で革新を続け、オープンソース コミュニティに積極的に貢献しています。 PyTorch3D、Polygames、HiPlot は、ディープラーニング アプリケーションを簡素化することを目的とした、FAIR からの比較的新しい貢献です。

今後のさらなる進歩を楽しみにしています!

<<:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

>>:  180の大学が「人工知能」の専攻を追加し、人工知能は大人気です!

ブログ    
ブログ    

推薦する

TikTok買収事件、主要アルゴリズムが焦点に 英国メディア:買収候補は4つの選択肢を提示

ロイター通信が2日報じたところによると、TikTokの買収候補らは、主要アルゴリズムを伴わない買収を...

...

アリババには、1秒間に8人の弁護士を打ち負かした新しい技術者がいる

[[231585]] Alimeiの紹介:エッセイの添削、同時通訳、ポスター作成…人工知能技術は私た...

大規模マルチビューガウスモデル(LGM):5秒で高品質の3Dオブジェクトを生成、試用可能

メタバースにおける 3D クリエイティブ ツールの需要の高まりに対応するため、3 次元コンテンツ生成...

ジャック・マー、孫丑樹、劉強東、周紅一はいかにして「スマート時代」に突入したのか?

近年、人工知能は大手企業の重要な研究分野となり、「政府活動報告」にも記載されるようになりました。これ...

コカ・コーラの新たな試み:アートや広告制作における生成AIの活用

生成型 AI の新たな波に直面して、私たちはそれに積極的に適応するか、AI (または AI を受け入...

スマート革命の始まり! AIは今後10年間で医療と芸術に革命を起こすだろう

人工知能 (AI) は、新しい材料を設計し、学習方法や周囲のあらゆるものとのやり取り方法を変え、人々...

...

マスク氏の AI ツール Grok は ChatGPT のシェルですか?

イーロン・マスク氏の人工知能企業xAIは最近、GroKと呼ばれる人工知能チャットボットをリリースした...

ナレッジグラフの紹介と応用

[[376661]]人間は知識を獲得する過程で、物事の本質にますます注意を払うようになります。人工知...

バッチ正規化の呪い

バッチ正規化は、確かにディープラーニングの分野における大きな進歩の 1 つであり、近年研究者によって...

TensorFlow 2.8.0が正式にリリースされ、多くのバグが修正され、50以上の脆弱性パッチがリリースされました

最近、TensorFlow は公式バージョン 2.8.0 をリリースしました。バージョン 2.7 の...

...

...

Googleに買収された後、大規模なモデル競争がOpenAIに遅れをとる理由がようやく分かった

2018年3月、テクノロジー教育のスタートアップであるSocraticがGoogleに買収されました...