人気のディープラーニングライブラリ23選のランキング

人気のディープラーニングライブラリ23選のランキング

[[209139]]

Data Incubator は最近、Github と Stack Overflow でのアクティビティと Google 検索結果に基づいて、人気のディープラーニング ライブラリ 23 個のランキングを作成しました。

次の表は正規化されたスコアを示しています。値 1 は平均 (平均は 0) より 1 標準偏差上であることを表します。 たとえば、Github での Caffe のアクティビティは平均より 1 標準偏差上ですが、deeplearning4j は平均に近いです。方法は最後に記載されています。

結果と考察

ランキングは、Github (スターとフォーク)、Stack Overflow (タグと質問)、Google 検索結果 (合計および四半期ごとの成長率) という、同等に重要な 3 つの要素に基づいています。これら 3 つの部分は、利用可能な API を通じて取得されます。ディープラーニング ツールキットの包括的なリストを作成するのは簡単ではないため、代表的と思われる 5 つの異なるリストを選択しました (詳細については、以下の方法論を参照してください)。各メトリックの正規化されたスコアを計算すると、各カテゴリでどのパッケージが優れているかがわかります。完全なランキングはここにあり、生データはここにあります。

TensorFlowが最も活発なコミュニティを支配

TensorFlow は、すべての計算メトリックにおいて平均より少なくとも 2 標準偏差上にあります。 2 番目に人気のあるフレームワークである Caffe と比較すると、TensorFlow には Github 上でのフォークがほぼ 3 倍、Stack Overflow 上での質問が 6 倍以上あります。 2015年にGoogle Brainチームによって初めてリリースされたTensorFlowは、Theano(4)やTorch(8)などの多くの高レベルライブラリを上回り、リストのトップに躍り出ました。 TensorFlow は C++ エンジン上で実行される Python API とともに配布されていますが、表内のいくつかのライブラリは TensorFlow をバックエンドとして使用し、独自のインターフェースを提供できます。これらのライブラリには、まもなくTensorFlowとSonnet(6)の中核部分となるKeras(2)が含まれます。 TensorFlow の人気は、その一般的なディープラーニング フレームワーク、柔軟なインターフェース、美しい計算グラフの視覚化、そして Google の重要な開発者およびコミュニティ リソースの結果であると考えられます。

CaffeはまだCaffe2に置き換えられていない

Caffe は私たちのリストで 3 位にランクされており、TensorFlow を除くどの競合他社よりも Github でのアクティビティが活発です。 Caffe は伝統的に Tensorflow よりも専門的であると考えられており、画像処理、オブジェクト認識、事前トレーニング済みの畳み込みニューラル ネットワークに重点を置いています。 Facebookは2017年4月にCaffe2(11)をリリースしており、すでにディープラーニングライブラリの上位半分にランクされています。 Caffe2 は、リカレント ニューラル ネットワークを含む、より軽量でモジュール化された拡張可能なバージョンの Caffe です。 Caffe と Caffe2 は別々のリポジトリであるため、データ サイエンティストは元の Caffe を引き続き使用できます。ただし、Caffe Translator などの移行ツールがあり、Caffe2 を使用して既存の Caffe モデルを駆動する方法が提供されます。

Kerasはディープラーニングのための最も先進的なフロントエンドライブラリです

Keras(2)は、非フレームワークライブラリの中でトップクラスです。 KerasはTensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)のフロントエンドとして使用できます。 Keras は 3 つの指標すべてにおいて平均を上回るパフォーマンスを発揮します。 Keras が人気なのは、そのシンプルさと使いやすさによるものかもしれません。 Keras を使用すると迅速なプロトタイピングが可能になりますが、フレームワークから直接実行することで得られる柔軟性と制御性が多少犠牲になります。 Keras は、データ セットに対してディープラーニング関連の実験を実行するデータ サイエンティストに好まれています。 Keras の成長と人気は、R Studio 用の Keras インターフェースの最近のリリースによって継続しています。

巨人の支援がなくても、テアノは依然としてトップにランクされている

新しいディープラーニングフレームワークが数多く存在する中、Theano(4)は当ランキングで最も古いライブラリです。 Theano は計算グラフの使用を先駆的に導入し、研究コミュニティでディープラーニングや機械学習が普及するにつれて人気が高まり続けています。 Theanoは本質的にはPython用の数値計算ライブラリですが、Lasagne(15)のような高レベルのディープラーニングライブラリと一緒に使用できます。 GoogleはTensorFlow(1)とKeras(2)をサポートし、FacebookはPyTorch(5)とCaffe2(11)をサポートし、MXNet(7)はAmazon Web Servicesの公式ディープラーニングフレームワークであり、MicrosoftはCNTK(9)を設計・保守していますが、Theanoは業界大手からの公式サポートがないにもかかわらず人気を保っています。

ソネットは最も急速に成長している図書館です

2017年初頭、GoogleのDeepMindは、TensorFlowをベースにした高レベルオブジェクト指向ライブラリであるSonnet(6)のコードを公開しました。 Sonnet の Google 検索結果では、前四半期より 272% 多くのページが返され、これはリストにあるどのライブラリよりも高い数値です。 Google は 2014 年に英国の人工知能企業 DeepMind を買収しましたが、DeepMind と Google Brain はほぼ独立したチームのままです。 DeepMind は汎用的な人工知能に重点を置いており、Sonnet はユーザーが特定の AI のアイデアや研究のためのトップレベルの設計を作成するのに役立ちます。

Pythonはディープラーニングのインターフェース言語です

PyTorch(5) は、この表の中で 2 番目に急速に成長しているライブラリであり、その唯一のインターフェースは Python です。 PyTorch の Google 検索結果は前四半期と比較して 236% 増加しました。私たちがランク付けした23のオープンソースのディープラーニングフレームワークとラッパーのうち、Pythonインターフェースを持たないのはDlib(10)、MatConvNet(20)、OpenNN(23)の3つだけです。 23 個のライブラリのうち、C++ インターフェースと R インターフェースはそれぞれ 7 個と 6 個しかありません。データ サイエンス コミュニティでは Python の使用に関してほぼ合意に達していますが、ディープラーニング ライブラリには依然として多くの選択肢があります。

制限

もちろん、一部のライブラリは単に長く存在しているため、データが多く、ランキングも高くなります。これを考慮している唯一の指標は、Google 検索の四半期ごとの成長率です。

データのプレゼンテーションで遭遇するいくつかの困難:

  • Neural DesignとWolfram Mathは独自のものであるため削除されました
  • cntkはMicrosoft Cognitive Toolkitとしても知られていますが、ここではctnkという名前だけを使用します。
  • ネオンはネルヴァーナネオンになる
  • paddle が paddlepaddle に変更されました
  • Caffe や Caffe2 など、一部のライブラリは明らかに他のライブラリの派生です。別個の/独立した Github リポジトリがある場合、これらのリポジトリは個別に処理されます。

方法

すべてのソースコードとデータは、Github ページで入手できます。

まず、5 つの異なるソースから 23 個のオープンソース ディープラーニング ライブラリのリストを生成し、次にこれらすべてのライブラリの指標を収集してランキングを作成しました。 Github のデータはスターとフォークの数に基づいており、Stack Overflow のデータにはパッケージ名を含むタグと質問が含まれており、Google の検索結果は過去 5 年間の Google 検索結果の総数に基づいており、過去 3 か月間の検索結果の四半期ごとの成長率をその前の 3 か月間と比較して計算しています。

いくつかの注意点:

  • いくつかのライブラリは一般的な語彙(caffe、chainer、lasagne)であるため、Google 検索結果の数を決定するために使用される検索用語には、ライブラリの名前と「ディープラーニング」という用語が含まれます。
  • 利用できない Stack Overflow カウントはゼロ カウントに変換されます。
  • カウントは平均 0、偏差 1 になるように正規化され、その後、Github と Stack Overflow のスコアが平均化され、Serch の結果と組み合わせて全体のスコアが算出されました。
  • Github リポジトリの場所を確認するために手動でチェックしました。

<<:  プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

>>:  オープンソースの機械学習プロジェクトのトップ 5。TensorFlow だけを考えるのはやめましょう。

ブログ    
ブログ    

推薦する

...

...

人工知能の応用、開発、影響についての考察

ケンブリッジ大学人工知能研究センターは、人工知能によってもたらされる新しい能力とそれが直面するリスク...

...

AIがデータセンターを管理するのに時間がかかる理由

ハイパースケーラーはすでに業務改善のために AI を活用していますが、他のほとんどのデータセンターで...

今後、セキュリティ分野で顔認識技術はどのように発展していくのでしょうか?

顔認識とは、顔の特徴情報の本人分析を利用して本人認証を行う生体認証技術を指します。人気の生体認証技術...

...

実践に最適なオープンソース機械学習プロジェクト 30 件をすぐに集めましょう。

「この記事は素晴らしいです! 実用的なプロジェクトがたくさん含まれており、機械学習を学び始めたばか...

AIがイノベーションの大きな原動力となる理由

近年、人工知能は新興技術から必需品へと徐々に変化してきました。より大規模な企業の問題に対する解決策を...

人工知能技術が身元調査業界に革命を起こしている

これは、AI テクノロジーが身元調査業界に革命をもたらし、これまで以上に効率的でコスト効率の高いソリ...

企業がAIベースのツールを使用して脆弱性を管理する方法

脆弱性の管理は、セキュリティ専門家にとって最優先事項の 1 つです。セキュリティ チームは、サイバー...

673本の論文を要約し、UIUCなどが20ヶ月で完成させた信頼性の高い機械学習レビューを発表

少し前、UIUC と南洋理工大学の 3 人の研究者が 20 か月かけて 673 本の論文を研究し、信...

人工知能と仮想現実のつながり

バーチャルリアリティ(VR)は、新しい実用的な技術です。バーチャルリアリティ技術は、コンピュータ、電...

SFから現実へ:人工知能の歴史と将来の可能性

人工知能は、SFで概念化されて以来、長い道のりを歩んできました。かつては想像上のものだったアイデアが...

AI時代のネイティブ:3歳でパズルを作り、5歳でプログラミングを学ぶ

[[241540]] 2018年世界ロボットコンテストで、子どもたちがロボットのプログラミングと制御...