データサイエンスと機械学習のためのツールと言語の最新情報

データサイエンスと機械学習のためのツールと言語の最新情報

[[198310]]

第 18 回 KDnuggets ソフトウェア アンケートには、今年もアナリティクス、データ サイエンス コミュニティ、ソフトウェア プロデューサーからの熱心な参加がありました。投票には昨年同様、約2,900人が参加した。近年、Python の使用率の伸び率は R を上回っています。今年、Python はついに R の使用率をわずかに上回りました (52.6% 対 52.1%)。しかし、最も驚いたのは、ディープラーニングツールが広く共有され、使用されていることでした。ディープラーニングの使用率は、2016 年にはわずか 18%、2015 年には 9% であったのに対し、2017 年には 32% にまで上昇しました。 Google Tensorflow は急速にディープラーニング プラットフォームのリーダーとなり、20.2% の使用率でトップに立っています。昨年の使用率はわずか6.8%でしたが、今年は使用ツールのトップ10に入りました。 2014 年には、分析、データ マイニング、データ サイエンスの主なツールは R、Python、SQL、SAS の 4 つでしたが、2017 年には Python、R、SQL、Saprk、Tensorflow の 5 つになりました。 RapidMiner は、データ マイニング/データ サイエンス向けの最も人気のある汎用プラットフォームであり、そのシェアは約 33% で、2016 年とほぼ同じです。

多くのソフトウェア ベンダーがユーザーに投票を奨励していますが、すべてのソフトウェア ベンダーに平等に投票する機会があるため、これは KDnuggets のガイドラインに違反するものではありません。機械が自動的に投票したり、1 つのツールだけに投票したりするケースは見られませんでした。

Spark は約 23% まで成長し、Hadoop エコシステムでトップ 10 の地位を維持しました。

TensorFlowに加えて、もう1つの新しいツールであるAnacondaも使用率22%でトップに登場しました。

分析、データサイエンス、機械学習で使用されるトップツール

表1: 2015年から2017年までの分析/データサイエンス分野におけるKDnuggetsの世論調査結果の比較

上記のグラフは、各ユーティリティが 500 票以上を獲得した上位 11 件の結果を示しています。上記の表では、「2017%使用率」は今年ツールを使用した投票者の割合、「2017年と2016年の%変化」は2016年の使用状況の比較で、5%を超える変化は緑と赤で強調表示され、「%のみ」は現在のツールのみを使用する投票者の割合です。投票者1人あたりに使用されたツールの平均数は6.1で、2016年の6.0とほぼ変わっていない。 2016 年の KDnuggets Analytics/Data Science 投票結果と比較すると、上位 11 位に新たに加わったツールは Anaconda と Tensorflow です。

各地域の参加率は以下の通りです。

• アメリカ/カナダ (41.5%)

• ヨーロッパ (35.5%)

• アジア(10.1%)

• ラテンアメリカ(6.5%)

• アフリカ/中東 (3.8%)

• オーストラリア/ニュージーランド (2.7%)

調査で2%以上の使用率を誇るトレンドの新ツールは次のとおりです: • Keras (9.5%) • PyCharm (9%)

• マイクロソフト R (4.3%)

• IBM DSX (3.0%)

• パイトーチ(3.0%)

• テラデータ(2.4%)

次の表には、2017 年に使用率が 20% 以上増加し、使用率が 2% 以上であったツールがリストされています。これには、5 つのディープ ラーニング ツールと 4 つの Microsoft ツールが含まれます。

表2: 利用が最も急速に増加した分析/データサイエンスツール

DataRobot の使用率は 2% 未満ですが、2016 年の 0.5% から 2017 年には 1.9% に増加しました。 2016 年に少なくとも 2% の使用率があったツールのうち、22 個のツールは使用率が増加し、27 個のツールは使用率が減少していることがわかります。これは、データ サイエンス プラットフォーム市場がまだ統合されていないことを示しています。次の表は、2016 年に少なくとも 2% の使用率があったが、2017 年には少なくとも 20% の使用率が減少したツールを示しています。 Turi と Salford は最近買収され、Perl と Octave は Python と R に負け、RapidInsight はユーザーに投票を促すことはなかったと思われます。QlikView は Tableau に負けたと思われます。C4.5 は時代遅れの技術とみなすことができます。興味深いことに、Hadoop エコシステム向けのオープンソース ツールの中で、MLlib やその他の無料のオープンソース分析/データ マイニング ツールの使用も減少しています。

表3: 利用が最も急速に減少している分析/データサイエンスツール

ディープラーニング ツール ディープラーニング ツールの使用は、2016 年の 18%、2015 年の 9% から今年は 32% に急増しました。 Google Tensorflow は、昨年のリーダーである Theano/Pylearn2 に取って代わり、主要なプラットフォームとなっています。上位のツールは次のとおりです。

• Tensorflow、使用率20.2%

• ケラス、9.5%

• テアノ、5.8%

その他のディープラーニングツール、4.8%

• マイクロソフト CNTK、3.4%

• カフェ、3.1%

• PyTorch、3.0%

• DL4J 2.2%

• MxNet、1.8%

• トーチ、1.2%

• ラザニア、0.9%

Hadoop/ビッグデータ ツール Hadoop システムにおける Hadoop/Spark ツールの分類を簡素化しました。 Hadoop、SQL、Spark の商用/オープンソース ツールの使用率は 33% を占めています。これは 2016 年の 39% よりわずかに低いですが、2016 年には多くのツールがビッグデータ ツールに分類されていました。 2015 年、Spark/Hadoop ツールの使用率は 29% でした。 2017年に使用されたビッグデータツールは次のとおりです。Spark、22.7%

• Hadoopオープンソースツール、15.0%

Hadoop SQL、10.3%

• Hadoop商用ツール 7.6%

Python、Java、Unix、Scala の人気が高まっている一方で、C/C++、Perl、Julia、F#、Clojure、Lisp の人気は低下しています。投票による主なプログラミング言語の順位は次のとおりです。Python、使用率52.6%(2016年の45.8%から増加)

• R、52.1%(2016年は49.0%)、6%増加

• SQL、34.9% (35.5%)、2%減

• ジャワ、13.8% (16.8%)、18%減

• Unix Shell/AWK/GAWK、9.6% (10.4%)、7%減

• C/C++、6.3%、(7.3%)、13%減

• パール、1.7%、(2.3%)、27%下落

• ジュリア、1.1% (1.1%)、変化なし

Python は競合の Julia から学び続け、成長を続けていますが、Julia の使用は驚くべきことに変わっていません。

<<:  自然言語処理にディープラーニングを使用するにはどうすればよいでしょうか?練習チェックリストはこちら

>>:  天馬株式:企業に力を与え、ビジネスをシンプルにする

ブログ    
ブログ    

推薦する

よく使われる4つの推奨アルゴリズムの一覧

[[416976]]この記事はWeChatの公開アカウント「Big Data DT」から転載したもの...

UiPath が前進中!企業が包括的な自動化を実現する可能性を探るのを支援する

[51CTO.com からのオリジナル記事] RPA は人間の働き方をシミュレートし、ルールベースの...

...

畳み込みニューラルネットワークの父:人工知能が動画から常識を学ぶための次のステップ

志東西(公式アカウント:zhidxcom)起源ディープラーニング分野の大物として、ヤン・ルカン氏は近...

PCの顔認証ログイン、驚くほど簡単

以前、オープンソース プロジェクトをやったことがあります。GitHub ログインが完成した後、もっと...

Meta、Xiaoice、NVIDIA が協力して何かを行っています!アジア初のメタバースエコロジー連盟が誕生

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ナンバーワンのディープラーニングフレームワークはどれですか? 2022年、PyTorchとTensorFlowが再び競い合う

PyTorch または TensorFlow を使用していますか?人々のグループによって答えは異なる...

...

...

...

人工ニューラルネットワークとBPアルゴリズムについての簡単な説明

[[338555]] 【51CTO.comオリジナル記事】 1 はじめに現在、機械学習技術とも呼ばれ...

エッジコンピューティング時代の到来は AI にどのような影響を与えるのでしょうか?

[[270736]]近年、人工知能はテクノロジー界で注目されている分野です。中国では、Megvii...

人工知能、自動化、新興技術のトレンドが4.6兆ドルの通貨市場に混乱をもたらしている

いくつかのスタートアップ企業は、最新のテクノロジーを活用して、最大かつ最も古いセクターの 1 つであ...

座標系の変換を本当に理解していますか?自動運転にはマルチセンサーが不可欠

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...