2018 年に最も人気のあるディープラーニング フレームワークはどれでしょうか?この科学的なランキングからわかることは

2018 年に最も人気のあるディープラーニング フレームワークはどれでしょうか?この科学的なランキングからわかることは

ディープラーニングは、機械学習の分野で最も注目されているテクノロジーです。ディープラーニング フレームワークは急速に変化しています。わずか 5 年前は、Theano が唯一の目立ったフレームワークでしたが、最近ではさまざまな機能を備えたさまざまなフレームワークが登場しています。この記事では、2018 年にどのフレームワークがより人気があるのか​​評価するために、LinkedIn の求人要件、Google 検索の人気、Medium の記事、arXiv の論文、GitHub のアクティビティの観点からさまざまなフレームワークを調査します。

注目に値するフレームワークを見つけたかったので、このリストを作成しました。 Pythonはディープラーニングでよく使われる言語なので、私は主にPythonと互換性のあるフレームワークに焦点を当てています。私は 7 つの異なるカテゴリから 11 のデータ ソースを使用し、それらを使用してフレームワークの使用状況、ユーザーの関心、人気を評価しました。

データアドレス:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

2018.09 ジェフ・ヘイル

明らかに TensorFlow が勝者ですが、驚くべき発見もいくつかあります。一緒に見てみましょう〜

候補者

私たちが検討したフレームワークはすべてオープンソースであり、主に Python を使用していますが、一部は R や他の言語と互換性があります。

TensorFlow が明らかに勝者です。 GitHub アクティビティ、Google 検索、Medium の記事、Amazon 書籍、arXiv 論文などのデータ ソースの最大のシェアを占めています。また、開発者ユーザー数も最も多く、オンライン求人情報に最も多く登場します。

Keras には「機械ではなく人間向けに設計された API」があります。ほぼすべての評価において 2 番目に人気のあるフレームワークです。 Keras のバックエンドは、TensorFlow、Theano、または NLTK をベースにすることができます。ディープラーニングを初めて学ぶ場合は、Keras を使用するのがよいでしょう。

PyTorch は 3 番目に人気のあるフレームワークであり、2 番目に人気のあるスタンドアロン フレームワークです。 TensorFlow よりも後に登場しましたが、急速に発展しました。 PyTorch ではカスタマイズが可能ですが、TensorFlow ではカスタマイズはできません。 PyTorch は Facebook によって開発およびサポートされています。

Theano は 2007 年にモントリオール大学によって開発された、最も古い Python ディープラーニング フレームワークです。現在、その人気は大幅に低下しており、開発者とメンテナーは Theano の更新とメンテナンスを停止すると発表しました。それでも、Theano は求人情報に頻繁に登場します。

MXNet は Apache によってインキュベートされています。スコア的には Theano に非常に近く、現在 4 番目に人気のあるディープラーニング ライブラリです。寄稿者、検索結果、関連書籍、学術論文の膨大なコレクションがあります。しかし、昨年に比べると利用率は低下しており、検索するユーザーもそれほど多くありません。

CNTK は、Microsoft がリリースした認知ツールキットです。 GoogleやFacebookに対抗するために立ち上げられたが、あまり利用されていない。

FastAI は PyTorch 上に構築されています。その API は Keras に触発されており、必要なコードがさらに少なくなります。 FastAI は、今年 10 月の 1.0 リリースに向けて書き直し中です。FastAI の立役者である Jeremy Howard 氏は、かつて Kaggle チャンピオンであり、Kaggle 会長でもありました。

なぜ FastAI がこのリストに載っているのかと疑問に思う人もいるかもしれません。プロの開発者の間では FastAI に対する需要があまりなく、広く使用されていないからです。しかし、無料のオンラインコースプラットフォームであるfast.aiを通じて、多くのユーザーを獲得しました。同時に、FastAI は強力で使いやすく、その使用は急速に拡大する可能性があります。

Caffe は以前に Caffe2 に更新され、2018 年 3 月に PyTorch に統合されたため、このリストには含まれていません。

評価基準

ディープラーニング フレームワークの人気度を総合的に評価するために、次のカテゴリと観点を選択してスコアを付けました。

  • オンライン求人情報
  • KDnuggets 利用状況調査
  • Google検索の人気
  • Mediumの記事数
  • Amazon 書籍数量
  • arXiv論文数
  • GitHub アクティビティ

この評価を裏付けるデータは今年 9 月 16 日に収集されました。元のデータのアドレスは次のとおりです。

https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit?usp=sharing

私は plotly データ視覚化ライブラリと Python の Pandas ライブラリを使用して、各フレームワークの人気度を調査して表示しました。インタラクティブな plotly チャートについては、Kaggle カーネルを参照してください。

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

オンライン求人情報

現在の職場におけるディープラーニング フレームワークの需要はどの程度でしょうか? LinkedIn の求人情報、具体的には Simply Hired、Monster、Angel List を検索しました。

TensorFlow は他のフレームワークよりも求人情報にかなり多く登場するため、ディープラーニング分野で働きたい場合は、TensorFlow を学ぶのが最善でしょう。

求人情報を検索する方法は「機械学習」+「フレームワーク名」を使用するので、TensorFlow は「機械学習 TensorFlow」で検索されます。実際に他の検索方法も使用しましたが、この方法の方がより良い結果が得られました。さらに、当初この分析に Caffe ライブラリも含めようとしたため、異なるフレームワークを区別するために追加のキーワードが必要になります。

使用法

人気のデータ サイエンス ウェブサイトである KDnuggets は、世界中のデータ サイエンティストを対象にソフトウェア ライブラリの使用状況について調査を行いました。調査では、ユーザーに次のような質問をしました。

過去 12 か月間に実際のプロジェクトで使用した分析、ビッグデータ、データ サイエンス、機械学習ツールはどれですか?

フレームワークの優先レベルは次のとおりです。

Keras は、TensorFlow とほぼ同じくらい広く使用されています。そのため、アメリカの上司は従業員の TensorFlow スキルを圧倒的に求めており、Keras も国際的に非常に頻繁に使用されています。

他のカテゴリに国際データを含めるのは面倒なので、このカテゴリにのみ国際データが含まれます。 KDnuggets はこのレポートを数年にわたって作成しており、この分析では今年のデータのみを使用しましたが、Theano、MXNET、CNTK の使用量は昨年に比べて減少していることに注意する必要があります。

Google検索の人気

最大手の検索エンジンで各フレームワークの検索人気度を測定することも、人気度を測る非常に良い方法です。 Google トレンドで過去数年間の検索人気度の推移を調べました。具体的な検索値は提供されていませんが、相対的なグラフは提供できます。

2018 年 9 月 15 日現在、TensorFlow は安定して検索の 78% を占めています。 PyTorch は Keras に近いですが、他のフレームワークの検索ボリュームは 3 前後か 3 未満です。

歴史的な背景をもう少し詳しく知るために、検索ボリュームが時間の経過とともにどのように変化したかを簡単に見てみましょう。以下の表は、過去 2 年間の Google 検索を示しています。

TensorFlow は青、Keras は赤、PyTorch は黄色、Theano は緑です。

TensorFlow、Keras、PyTorch の検索は 2016 年後半から 2017 年にかけて急増しました。興味深いことに、ここ数か月はゆっくりと成長しています。夏休みが減り、冬休みが増加するなど、季節性も見られます。

Google 検索トレンドでは、同時に比較できる項目は 5 つだけなので、他のライブラリは別の表で比較されます。これらの結果はすべて米国でのものです。検索キーワード「Theano」と「Keras」には他の意味もありますが、それらの意味は主に米国外で使用されています。

中程度の記事

複数の出版形態を計算してみましたが、先に登場したフレームワークほど出版数が有利です。今後のランキングでは出版数の推移に注目します。以下の Medium の記事を見てみましょう。

今回、新たなチャンピオンが登場しました。 Medium の記事の言及数から判断すると、Keras は TensorFlow を上回っていますが、互角でもあります。 FastAI は、これまでの取り組みよりも優れたパフォーマンスを発揮します。上記の結果になった理由は、Keras と FastAI が初心者にとってより使いやすいためだと思います。ディープラーニングを初めて学ぶ人々の間では大きな関心が寄せられており、Medium はチュートリアル フォーラムとなっています。

次に、Amazon で物理的な本をより多く扱っているフレームワークを見てみましょう。

アマゾンブックス

Amazon Books->Computer Science で各ディープラーニング フレームワークを検索したところ、次の結果が見つかりました。

TensorFlow が再び優勝しました。 MXNET には、Theano よりも予想以上に多くの書籍があります。 PyTorch に関する書籍は比較的少ないですが、これはフレームワークがまだ新しいためだと考えられます。この評価基準は、本の出版に時間がかかることから、古い図書館に有利です。

学術論文では Theano の方が良いかもしれません。

arXiv論文

arXiv は、ほとんどの機械学習の学術論文が公開されているオンライン データベースです。このサイトの各フレームワークを検索した結果は次のとおりです。

同様に、TensorFlow に関する学術論文も数多くあります。最も驚くべきことは、他のフレームワークに関する学術論文の総数が TensorFlow よりも少ないことです。 Keras は学術論文よりも Medium や Amazon で人気があることに注意してください。 PyTorch もこの分野ではあまり良いパフォーマンスを発揮しません。おそらく、登場してからまだ間もないからでしょう。

GitHub アクティビティ

GitHub のアクティビティはフレームワークの人気を示すもう 1 つの指標です。スター、フォーク、ウォッチャー、貢献者の数を個別に調べたのは、合計数よりもそれぞれが個別に見た方が意味があるからです。

明らかに、TensorFlow は GitHub 上で最も人気のあるフレームワークであり、多数のアクティブ ユーザーを抱えています。 FastAI は、まだ 1 年しか経っていないのに、なかなか優れています。興味深いのは、各フレームワークの貢献者の数が他の 3 つの指標よりもはるかに近いことです。

このデータを収集して分析した後は、要約します。

リーダーボードスコアを計算する手順

リーダーボードのスコアを作成するには、次の手順を使用しました。

  1. すべての特徴量を[0,1]の区間にスケーリングします。
  2. 職務内容と GitHub アクティビティのサブカテゴリを集約します。
  3. カテゴリは、下の図の重みに従って重み付けされます。
  4. 上記のように、オンラインの求人情報と KDnuggets の使用状況調査がスコアの半分を占め、Web 検索、出版物、GitHub の注目が残りの半分を占めています。この分割は、さまざまなカテゴリにとって最も適切なバランスになるはずです。

  5. 理解しやすくするために、加重スコアに 100 を掛けます。
  6. 各フレームワークの各カテゴリのスコアを合計して、最終的なランキングスコアを算出します。

Google シート アドレス:

https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit#gid=0

下の図は、サブカテゴリを加重加算した後のスコアを示しています。

Jupyter Notebook アドレス:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

下の図は、最終的なリーダーボードのスコアを再度示しています。

2018.09 ジェフ・ヘイル

100 は最高得点であり、各カテゴリーの 1 位を表します。 TensorFlow のスコアは 100 近くになりましたが、このフレームワークがほぼすべてのカテゴリで 1 位を獲得したので、これは驚くことではありません。画像に表示されていない情報を取得するには、次のリンクをクリックしてください。

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

将来に向けて

現在、TensorFlow がリーダーであり、この状況は短期的には変化しないようです。しかし、ディープラーニングの世界の進歩のスピードを考えると、TensorFlow が追いつくことは不可能ではありません。

React が Angular を超えたのと同じように、PyTorch が TensorFlow を超えるかどうかは時が経てばわかるでしょう。 PyTorch と React はどちらも Facebook がサポートする柔軟なフレームワークであり、一般的に Google の同等のフレームワークよりも使いやすいと考えられています。

FastAI はコースを超えてユーザーを引き付けることができますか? 学生ベースが大きく、API は Keras よりも使いやすいです。

学習者のためのヒント

これらのフレームワークのいずれかを学習することを検討していて、Python、numpy、pandas、sklearn、matplotlib のスキルがある場合は、Keras から始めることをお勧めします。このフレームワークはユーザー数が多く、仕事探しにとても便利です。Mediumにも関連記事がたくさんあり、APIも使いやすいです。

すでに Keras を学習している場合、次に学習するフレームワークを選択するのは少し難しいかもしれません。 TensorFlow または PyTorch を学習し、優れたディープラーニング モデルを作成できるように十分に学習することをお勧めします。

TensorFlow は明らかにニーズに合わせて学習するフレームワークですが、PyTorch の使いやすさと柔軟性により、よりユーザーフレンドリーになっています。

これらのフレームワークを習得したら、FastAI に注目することをお勧めします。基本的なディープラーニング スキルと高度なディープラーニング スキルの両方を習得したい場合は、FastAI の無料オンライン コースをご覧ください。FastAI 1.0 は、ユーザーが最新のディープラーニング戦略を簡単に実装し、迅速に反復できるように支援することを約束します。

どのフレームワークを選択する場合でも、どのフレームワークが最も需要があり、最も使用され、最も話題になっているかについて、深く理解していただけたと思います。

オリジナルリンク:

https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  超まとめ! 200以上の便利な機械学習、NLP、Pythonチュートリアル

>>:  自動運転のテストが加速:北京と上海が重要なニュースを発表

ブログ    
ブログ    

推薦する

あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進

[51CTO.comからのオリジナル記事]クラウドコンピューティング、ビッグデータ、5G、モノのイン...

人工知能の市場推進要因、制約、機会

今日、ますます多くの企業が、事業運営に人工知能技術を活用しています。このテクノロジーは非常に建設的で...

ラブライブ!AI論文発表:生成モデルが楽譜を自動生成

有名アイドルプロジェクト「ラブライブ!」がAI論文を発表しました。そうです。最近、プレプリント論文プ...

...

ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

[[214638]]ノイズ除去オートエンコーダー (DAE) は、破損したデータを入力として受け入...

中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある

今年に入ってから、人工知能分野の発展は新たな盛り上がりを見せています。消費者レベルの人工知能アプリケ...

スマートビルディングにおけるエッジAIの役割を解明

仕事や住居のための物理的な空間として機能することから、入居者に活気ある建築体験を提供することまで、近...

102歳の統計学の伝説、CRラオ氏が死去。彼の人生は「統計の世紀」を経験した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

BLIP-2とInstructBLIPがトップ3にランクイン! 12の主要モデル、16のリスト、「マルチモーダル大規模言語モデル」の総合評価

マルチモーダル大規模言語モデル (MLLM) は、LLM の豊富な知識蓄積と強力な推論および一般化機...

顔認識はどのようにして顔を認識するのでしょうか?

顔をスキャンして出勤記録を取ったり、顔で支払いをしたり、顔でドアを開けたり、顔をスキャンしながら生活...

需要が高まる最高AI責任者

出版社ファウンドリーの新しい調査によると、企業は生産性とイノベーションを高めるために人工知能に注目し...

ジェネレーションオートメーション:AI主導の労働力

生成 AI は AI の「津波」を引き起こし、AI 駆動型アプリケーションの急速な開発、広範な採用、...

エンタープライズ電気システムにおける機械学習の 5 つのメリット

機械学習技術は企業の電気システムの作業と保守において重要な役割を果たしており、人々は機械学習を採用す...

...