人気のディープラーニングライブラリ23選のランキング

人気のディープラーニングライブラリ23選のランキング

[[209139]]

Data Incubator は最近、Github と Stack Overflow でのアクティビティと Google 検索結果に基づいて、人気のディープラーニング ライブラリ 23 個のランキングを作成しました。

次の表は正規化されたスコアを示しています。値 1 は平均 (平均は 0) より 1 標準偏差上であることを表します。 たとえば、Github での Caffe のアクティビティは平均より 1 標準偏差上ですが、deeplearning4j は平均に近いです。方法は最後に記載されています。

結果と考察

ランキングは、Github (スターとフォーク)、Stack Overflow (タグと質問)、Google 検索結果 (合計および四半期ごとの成長率) という、同等に重要な 3 つの要素に基づいています。これら 3 つの部分は、利用可能な API を通じて取得されます。ディープラーニング ツールキットの包括的なリストを作成するのは簡単ではないため、代表的と思われる 5 つの異なるリストを選択しました (詳細については、以下の方法論を参照してください)。各メトリックの正規化されたスコアを計算すると、各カテゴリでどのパッケージが優れているかがわかります。完全なランキングはここにあり、生データはここにあります。

TensorFlowが最も活発なコミュニティを支配

TensorFlow は、すべての計算メトリックにおいて平均より少なくとも 2 標準偏差上にあります。 2 番目に人気のあるフレームワークである Caffe と比較すると、TensorFlow には Github 上でのフォークがほぼ 3 倍、Stack Overflow 上での質問が 6 倍以上あります。 2015年にGoogle Brainチームによって初めてリリースされたTensorFlowは、Theano(4)やTorch(8)などの多くの高レベルライブラリを上回り、リストのトップに躍り出ました。 TensorFlow は C++ エンジン上で実行される Python API とともに配布されていますが、表内のいくつかのライブラリは TensorFlow をバックエンドとして使用し、独自のインターフェースを提供できます。これらのライブラリには、まもなくTensorFlowとSonnet(6)の中核部分となるKeras(2)が含まれます。 TensorFlow の人気は、その一般的なディープラーニング フレームワーク、柔軟なインターフェース、美しい計算グラフの視覚化、そして Google の重要な開発者およびコミュニティ リソースの結果であると考えられます。

CaffeはまだCaffe2に置き換えられていない

Caffe は私たちのリストで 3 位にランクされており、TensorFlow を除くどの競合他社よりも Github でのアクティビティが活発です。 Caffe は伝統的に Tensorflow よりも専門的であると考えられており、画像処理、オブジェクト認識、事前トレーニング済みの畳み込みニューラル ネットワークに重点を置いています。 Facebookは2017年4月にCaffe2(11)をリリースしており、すでにディープラーニングライブラリの上位半分にランクされています。 Caffe2 は、リカレント ニューラル ネットワークを含む、より軽量でモジュール化された拡張可能なバージョンの Caffe です。 Caffe と Caffe2 は別々のリポジトリであるため、データ サイエンティストは元の Caffe を引き続き使用できます。ただし、Caffe Translator などの移行ツールがあり、Caffe2 を使用して既存の Caffe モデルを駆動する方法が提供されます。

Kerasはディープラーニングのための最も先進的なフロントエンドライブラリです

Keras(2)は、非フレームワークライブラリの中でトップクラスです。 KerasはTensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)のフロントエンドとして使用できます。 Keras は 3 つの指標すべてにおいて平均を上回るパフォーマンスを発揮します。 Keras が人気なのは、そのシンプルさと使いやすさによるものかもしれません。 Keras を使用すると迅速なプロトタイピングが可能になりますが、フレームワークから直接実行することで得られる柔軟性と制御性が多少犠牲になります。 Keras は、データ セットに対してディープラーニング関連の実験を実行するデータ サイエンティストに好まれています。 Keras の成長と人気は、R Studio 用の Keras インターフェースの最近のリリースによって継続しています。

巨人の支援がなくても、テアノは依然としてトップにランクされている

新しいディープラーニングフレームワークが数多く存在する中、Theano(4)は当ランキングで最も古いライブラリです。 Theano は計算グラフの使用を先駆的に導入し、研究コミュニティでディープラーニングや機械学習が普及するにつれて人気が高まり続けています。 Theanoは本質的にはPython用の数値計算ライブラリですが、Lasagne(15)のような高レベルのディープラーニングライブラリと一緒に使用できます。 GoogleはTensorFlow(1)とKeras(2)をサポートし、FacebookはPyTorch(5)とCaffe2(11)をサポートし、MXNet(7)はAmazon Web Servicesの公式ディープラーニングフレームワークであり、MicrosoftはCNTK(9)を設計・保守していますが、Theanoは業界大手からの公式サポートがないにもかかわらず人気を保っています。

ソネットは最も急速に成長している図書館です

2017年初頭、GoogleのDeepMindは、TensorFlowをベースにした高レベルオブジェクト指向ライブラリであるSonnet(6)のコードを公開しました。 Sonnet の Google 検索結果では、前四半期より 272% 多くのページが返され、これはリストにあるどのライブラリよりも高い数値です。 Google は 2014 年に英国の人工知能企業 DeepMind を買収しましたが、DeepMind と Google Brain はほぼ独立したチームのままです。 DeepMind は汎用的な人工知能に重点を置いており、Sonnet はユーザーが特定の AI のアイデアや研究のためのトップレベルの設計を作成するのに役立ちます。

Pythonはディープラーニングのインターフェース言語です

PyTorch(5) は、この表の中で 2 番目に急速に成長しているライブラリであり、その唯一のインターフェースは Python です。 PyTorch の Google 検索結果は前四半期と比較して 236% 増加しました。私たちがランク付けした23のオープンソースのディープラーニングフレームワークとラッパーのうち、Pythonインターフェースを持たないのはDlib(10)、MatConvNet(20)、OpenNN(23)の3つだけです。 23 個のライブラリのうち、C++ インターフェースと R インターフェースはそれぞれ 7 個と 6 個しかありません。データ サイエンス コミュニティでは Python の使用に関してほぼ合意に達していますが、ディープラーニング ライブラリには依然として多くの選択肢があります。

制限

もちろん、一部のライブラリは単に長く存在しているため、データが多く、ランキングも高くなります。これを考慮している唯一の指標は、Google 検索の四半期ごとの成長率です。

データのプレゼンテーションで遭遇するいくつかの困難:

  • Neural DesignとWolfram Mathは独自のものであるため削除されました
  • cntkはMicrosoft Cognitive Toolkitとしても知られていますが、ここではctnkという名前だけを使用します。
  • ネオンはネルヴァーナネオンになる
  • paddle が paddlepaddle に変更されました
  • Caffe や Caffe2 など、一部のライブラリは明らかに他のライブラリの派生です。別個の/独立した Github リポジトリがある場合、これらのリポジトリは個別に処理されます。

方法

すべてのソースコードとデータは、Github ページで入手できます。

まず、5 つの異なるソースから 23 個のオープンソース ディープラーニング ライブラリのリストを生成し、次にこれらすべてのライブラリの指標を収集してランキングを作成しました。 Github のデータはスターとフォークの数に基づいており、Stack Overflow のデータにはパッケージ名を含むタグと質問が含まれており、Google の検索結果は過去 5 年間の Google 検索結果の総数に基づいており、過去 3 か月間の検索結果の四半期ごとの成長率をその前の 3 か月間と比較して計算しています。

いくつかの注意点:

  • いくつかのライブラリは一般的な語彙(caffe、chainer、lasagne)であるため、Google 検索結果の数を決定するために使用される検索用語には、ライブラリの名前と「ディープラーニング」という用語が含まれます。
  • 利用できない Stack Overflow カウントはゼロ カウントに変換されます。
  • カウントは平均 0、偏差 1 になるように正規化され、その後、Github と Stack Overflow のスコアが平均化され、Serch の結果と組み合わせて全体のスコアが算出されました。
  • Github リポジトリの場所を確認するために手動でチェックしました。

<<:  プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

>>:  オープンソースの機械学習プロジェクトのトップ 5。TensorFlow だけを考えるのはやめましょう。

ブログ    
ブログ    
ブログ    

推薦する

人工知能開発の重要な要素と気候変動への影響

人工知能は世界的な流行語となり、ほぼすべての企業のデジタル変革計画に不可欠な要素となっています。 A...

...

絵画制作において想像力を最大限に発揮できる 8 つの優れた AI ペイント ツール

今日は、絵画作成において無限の想像力を発揮するのに役立つ 8 つの優れた AI ペイント ツールを紹...

人工知能の時代において、「次世代」の教育はどこから始めるべきでしょうか?

[[334948]]自動運転車、音声アシスタント、その他の人工知能技術は、ほとんどの人にとって革命...

データが増えるほど、AIの意思決定モデルは脆弱になる

データは人工知能システムを構築するために必要な重要なインフラストラクチャです。データは、AI システ...

人工知能は視覚効果アーティストの役割に取って代わるでしょうか?

視覚効果 (VFX) の分野における AI の統合は、シームレスでデータ主導のアプローチを導入するこ...

BOE の革新的なテクノロジーは、国際的な氷上および雪上イベントを強化し、世界クラスのスポーツイベントをより華やかにします。

春の始まりの2月4日、世界の注目は北京に集まった。音楽、光、影が流れる中、オリーブの枝に囲まれた巨大...

LK-99は今もメロンを生産中:元のサンプルは韓国エネルギー技術研究所に届けられ、薄膜プロセスは最後の懸案

中国科学院物理研究所とプリンストン大学による2本の否定的な論文の発表により、LK-99に対する人々の...

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]序文Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベル...

ネイチャー誌の表紙:量子コンピューターの実用化はまだ2年先

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アップルの自動運転テストカーは8月に2回の軽微な衝突事故を起こしたが、どちらも事故の原因ではなかった

海外メディアAppleInsiderによると、今年8月、アップルの自動運転車群の2台がカリフォルニア...

GitHubオープンソース130+スター:PPYOLOシリーズをベースにターゲット検出アルゴリズムを再現する方法をHand in handで教える

物体検出は、コンピューター ビジョンの分野における基本的なタスクです。適切な Model Zoo な...

AIの有効性はサイバーセキュリティでは限られているが、サイバー犯罪では無限である

AI は大きな可能性を秘めているにもかかわらず、サイバーセキュリティにおける AI の応用は非常に限...

たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...