この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 グラフは、ノードとエッジで編まれたネットワークである非常に便利なデータ構造です。たとえば、ナレッジグラフはそのようなネットワークです。 このようなデータを処理するために、グラフ埋め込み、つまり高次元ネットワークを低次元ベクトルに変換する機能が使用されます。処理後、機械学習モデルはそれを簡単に使用できます。 上の図のように、ノードが数個、エッジが数十個しかない場合、グラフの埋め込みは難しくありません。 数十億のノードと数兆のエッジがあったらどうなるでしょうか?従来のグラフ埋め込み方法はあまり良くありません。 しかし現在、Facebook はPyTorch-BigGraph (略してPBG ) と呼ばれる新しいツールをオープンソース化しました。 これを使用すると、任意の大きさのグラフをすばやく埋め込むことができます。また、 GPUはまったく必要ありません。 オープンソース モデルを自分でトレーニングできるだけでなく、7,800 万ノードの Wikidata データを使用して事前トレーニングされたモデルもあり、直接ダウンロードして使用できます。 PBG が出版された後、友人たちは急いで互いにこう伝えました。 LeCun 先生も個人的に 2 回転送しました。 開発方法 PBG は、1 億 2000 万ノードの完全なFreeBaseナレッジ グラフを使用してトレーニングされた分散システムです。 トレーニング中、PBG はグラフ上のすべてのエッジの大きなリストを消費します。各エッジは両端のノードによって定義され、一方がソースでもう一方がターゲットです。定義内の 2 つのポイント間にも関係があります (関係タイプ)。 次に、PBG は各ノードの特徴ベクトル (埋め込み) を出力し、ベクトル空間内で隣接する 2 つのノードを近づけ、隣接しないノードを遠ざけます。 こうすることで、周囲の分布が似ているノードがベクトル空間内で互いに近くなり、グラフの本来の意味が保持されます。 さらに、異なる関係ごとに、異なる計算方法で「近接スコア」をカスタマイズできます。このようにして、ノードの埋め込みをさまざまな種類の関係間で共有できます。 もっと早く、もっと早く 大規模なグラフ データを迅速に処理するために、PBG は次の魔法を使用します。
トレーニング後、FB15k、Youtube、LiveJournalなどのグラフでテストされました。 研究チームによれば、PBG は従来のものと同じグラフ埋め込み品質を備えているが、必要な時間は大幅に短縮されているという。 あなたもぜひ試してみてください。 PBG もトレーニングする必要があります。 とにかく、GPUは必要ありません。 トレーニングしたくない場合は、完全な WikiData で事前トレーニングされたモデルもあります。 必要なポータルはすべてここにあります。 コードポータル: https://github.com/facebookresearch/PyTorch-BigGraph 食用指数: https://torchbiggraph.readthedocs.io/en/latest/ 紙の転送ポータル: https://arxiv.org/abs/1903.12287 ブログポータル: https://ai.facebook.com/blog/open-sourcing-pytorch-biggraph-for-faster-embeddings-of-extremely-large-graphs/ |
<<: Google のロボット工学プログラムは度重なる失敗からどのような教訓を得たのでしょうか?
>>: AI と機械学習: 大きなデマか、それとも大きな希望か?
自然災害が増加する中、スイス・リーは人工知能を活用して、顧客が保険金請求をより正確に予測し、手続きを...
動画の途切れや解像度の低さは視聴者の視聴体験を著しく低下させ、広告主の利益にも悪影響を及ぼします。現...
[51CTO.com からのオリジナル記事] 現在、機械学習テクノロジーをめぐっては多くの誇大宣伝が...
バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。 The Vergeによると: ...
データ注釈はほとんどの人工知能の基盤であり、機械学習とディープラーニング モデルの品質を決定します。...
01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物履歴、エネルギーなどの...
[[402482]]最近、当社の業務システムは、トークン バケット アルゴリズムに基づいて実装された...
[オリジナル記事は51CTO.comより] 私の周りには、「世界は広いから、外に出て旅をしたい」と言...
【51CTO.comオリジナル記事】 1. 背景紹介---VODソース配信の問題点オンデマンドビデオ...
サイバーセキュリティにおける人工知能 (AI) は、データセキュリティにとって良いものでしょうか、そ...
ニューラル関係抽出のための構文的に敏感なエンティティ表現。関係抽出タスクの大規模な適用における大きな...
本論文では、これまでの RNN モデル研究に基づいて、隠れ状態ニューロン間の更新頻度の順序を強制し、...