この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 別の AI フレームワークがアップグレードされました。 今回、ニューヨーク大学とアマゾンは共同でグラフニューラルネットワークフレームワークDGLを立ち上げました。 異種グラフのサポートを全面的に開始しただけでなく、関連する異種グラフニューラルネットワークのコードも再現してオープンソース化し、GCMCやRCGNなどの業界で有名なモデルの実装でより良い結果を達成しました。 また、多くの従来のグラフ埋め込みモデルのパフォーマンス向上を実現した Knowledge Graph Embedding (DGL-KE) をトレーニングするための特別なパッケージもリリースしました。 現在、2018年のNeurIPSカンファレンスで発表されたこのフレームワークは、3,000以上のスターを獲得しており、グラフニューラルネットワークやグラフ機械学習の分野で人気のツールとなっています。 異種グラフ: ニューラルネットワークの新しい方向性 異種グラフは同種グラフに対応する新しい概念です。 従来の同種グラフ データにはノードとエッジの種類が 1 つしかないため、グラフ ニューラル ネットワークを構築する場合、すべてのノードは同じモデル パラメーターを共有し、同じ次元の特徴空間を持ちます。 異種グラフには複数の種類のノードとエッジを含めることができるため、異なる種類のノードに異なる次元の機能や属性を持たせることができます。 この機能により、異種グラフは広く使用されています。グラフを使用して私たちと私たちの周りのものとの関係を説明すると、生成されるグラフは当然異種であることがわかります。次の例がその例です。
したがって、このグラフは当然ながら異質です。さらに、従来の方法と比較して、異種グラフでトレーニングされたニューラル ネットワークは、いくつかのシナリオでより優れた結果とパフォーマンスを達成することもできます。 現在では、ナレッジグラフ、推奨システム、悪意のあるアカウントの識別などの分野やタスクに適用されています。 最も代表的なモデルとしては、ノード分類やリンク予測などのタスク用の RGCN と、製品推奨用の GCMC の 2 つがあります。 しかし、高速かつ優れたディープ ニューラル ネットワークを設計するにはどうすればよいでしょうか? これはまさに、ニューヨーク大学と Amazon が共同でグラフ ニューラル ネットワーク フレームワーク DGL を立ち上げる出発点です。 DGL の新バージョン: 異種グラフ ニューラル ネットワーク向けの強力なツール このアップデートでは DGL バージョン 0.4 がリリースされ、フレームワーク全体がより実用的になります。 異種グラフのサポートが完全に開始されただけでなく、関連する異種グラフ ニューラル ネットワークのコードも再現され、オープンソース化されました。 △ DGL 0.4における異種グラフに基づくRGCN層の実装コード 関係者によると、この新しいバージョンの DGL は、業界で最も優れた異種グラフ ニューラル ネットワークを実装し、パフォーマンスが向上しているという。 GCMC: DGL の実装は、MovieLens-100K では元の作者の実装より 5 倍高速で、MovieLens-1M では 22 倍高速です。 DGL のメモリ最適化により、MovieLens-10M を単一の GPU でトレーニングできるようになりました (元の実装では CPU からのデータの動的ロードが必要でした)。これにより、元の 24 時間のトレーニング時間が 1 時間強に短縮されました。 RGCN: RGCN は、新しい異種グラフ インターフェイスを使用して再実装されます。新しい実装により、メモリのオーバーヘッドが大幅に削減されます。 AM データセット (エッジ数 > 5M) に対する元の実装では、メモリ オーバーヘッドが大きいため CPU でしか計算できませんでしたが、DGL では GPU を使用して高速化できるため、291 倍の速度向上を実現しました。 HAN: メタパスを通じて異種グラフを同種グラフに変換するための柔軟なインターフェースを提供します。 Metapath2vec: 元の作者の実装より 2 倍高速な新しいメタパス サンプリング実装。 さらに、DGL は分子化学用のモデル ライブラリ DGL-Chem と、ナレッジ グラフ埋め込み (Knowledge Graph Embedding) をトレーニングするための特別なパッケージ DGL-KE もリリースしました。 DGL-Chem は、分子特性の予測や分子構造の生成を含む事前トレーニング済みモデルを提供します。 DGL-KE は、単一の GPU 上で、従来の TransE モデルを使用して FB15K のグラフ埋め込みを 7 分でトレーニングできます。これに対し、4 つの GPU 上の GraphVite (v0.1.0) では 14 分かかります。 DGL-KE の最初のバージョンでは、CPU トレーニング、GPU トレーニング、CPU と GPU のハイブリッド トレーニング、および単一マシンのマルチプロセス トレーニングをサポートする TransE、ComplEx、および Distmult モデルがリリースされました。 DGLチームは、今後さらに多くのモデルとトレーニング方法がリリースされる予定であると述べました。 |
<<: AIアートがブームになっていますが、今後はどうなるのでしょうか?
わが国の著名な学者である周海中氏は、1990年代に「科学技術の進歩により、人工知能の時代が到来しよう...
適応性は常に成功する組織の基礎となる原則です。過去 2 年間、世界は不確実性に直面してきましたが、こ...
近年、大規模な事前トレーニング済み言語モデル (PLM) により、さまざまな NLP タスクのパフォ...
「敵対的事例」は古くからある問題です。画像内の数ピクセルを変更するなど、通常のデータにわずかな外乱...
[[425546]]エリック・ルセロ博士最近、Google Quantum AIのチーフエンジニアで...
背景これまで、音楽アルゴリズムのモデル トレーニング タスクは、物理マシン上で開発、デバッグ、スケジ...
ビッグデータダイジェスト制作著者: カレブボストン・ダイナミクスを例に挙げると、ロボットはますます多...
確かに、人工知能はさまざまな面で人々の生活を楽にしてきました。 Google アシスタント、Siri...
AI による自動プログラミングを可能にすることは、人工知能分野における長年の夢の 1 つです。現在...
7月20日、スタンフォード大学とカリフォルニア大学バークレー校の研究チームが最近GPT-4の詳細な研...
[[398643]]ビデオ分析のトピックは何十年も議論されてきましたが、物理セキュリティ業界におけ...
Nvidia の GPU が世界を席巻しています。テクノロジー企業は、Nvidia のスーパーコンピ...
[[185877]]コンピュータ処理、音声認識、モバイル通信、クラウドコンピューティング、ニューラル...