「データが王様」と言われる今日の世界では、データサイエンスに興味を持つ人が増えています。データ サイエンティストはアルゴリズムを使わずにはいられません。では、データ サイエンティストが最もよく使用するアルゴリズムは何でしょうか? 最近、有名なデータマイニング情報ウェブサイトKDnuggetsがトップ10アルゴリズムの調査を企画しました。この調査では、データサイエンティストがよく使用するアルゴリズムをランク付けし、最も「産業的」かつ「学術的」なアルゴリズムを見つけました。また、過去5年間(2011〜2016年)のこれらのアルゴリズムの変化についても詳しく紹介しました。 調査結果は844人の回答者の投票に基づいています。 KDnuggets は、上位 10 個のアルゴリズムとその投票シェアを次のようにまとめています。 すべてのアルゴリズムとメソッドの完全なリストについては、記事の最後を参照してください。 調査によると、回答者は平均 8.1 個のアルゴリズムを使用しており、2011 年の同様の調査と比べて大幅に増加している。 2011 年のデータ分析/データマイニングの投票アルゴリズムと比較すると、人気のあるアルゴリズムは依然として回帰アルゴリズム、クラスタリング アルゴリズム、決定木、視覚化であることがわかります。相対的に言えば、最大の成長は次のアルゴリズム (pct2016/pct2011-1) によって測定されます。
2016 年の新しいアルゴリズムは次のとおりです。
減少のアルゴリズム***は次のとおりです。
表1: 業種別アルゴリズムの使用状況 ほぼすべての人が教師あり学習アルゴリズムを使用していることに気付きました。政府や産業界のデータ サイエンティストは、学生や学術界よりも多様なアルゴリズムを使用しており、産業界のデータ サイエンティストはメタアルゴリズムを使用する可能性が高くなります。 次に、業界タイプ別に上位 10 のディープラーニング アルゴリズムの使用状況を分析します。 表2: 雇用形態別に使用されるディープラーニングアルゴリズム上位10件 表 2: 雇用形態別上位 10 アルゴリズム + ディープラーニングの使用状況 違いをより明確にするために、特定の業界タイプに関連付けられたアルゴリズムの平均使用率を Bias(Alg,Type)=Usage(Alg,Type)/Usage(Alg,All)-1 として計算します。 業界のデータ サイエンティストは、回帰アルゴリズム、視覚化、統計アルゴリズム、ランダム フォレスト アルゴリズム、時系列を使用する傾向があることに気付きました。政府機関や非営利団体では、視覚化、主成分分析、時系列を使用する可能性が高くなります。学術研究者は主成分分析とディープラーニングを好みます。学生は一般的にアルゴリズムをあまり使用しませんが、テキストマイニングとディープラーニングをより多く使用します。 次に、KDnuggets の訪問者全体を表す地域別の参加状況を見てみましょう。 有権者の地域分布は次のとおりです。
2011 年の調査と同様に、業界/政府を 1 つのグループに、学術研究者/学生を 2 番目のグループにまとめ、業界/政府に対するアルゴリズムの「親近感」を計算しました。 親和性が 0 のアルゴリズムは、産業界/政府機関と学術研究者/学生によって同様に使用されます。 IG 親密性委員会は、アルゴリズムがより「産業的」であることを示す一方、低いほどアルゴリズムがより「学術的」であることを示します。 その中で最も「工業的」なアルゴリズムは次のとおりです。
インクリメンタル モデリングは、今回も最も「産業的」なアルゴリズムですが、驚くほど使用率が低く、今回の調査で最も使用されているアルゴリズムであるにもかかわらず、わずか 3.1% にとどまっています。 最も「学術的な」アルゴリズムは次のとおりです。
次の図は、すべてのアルゴリズムと、業界/学術界におけるその人気を示しています。 以下の表には、アルゴリズムの詳細、2016 年と 2011 年の調査でそれらを使用した回答者の割合、変化 (%2016 / %2011 - 1)、および前述の業界との親和性が記載されています。 表3: KDnuggets 2016 調査: データサイエンティストが使用するアルゴリズム 次の表に、各アルゴリズムの詳細を示します。
|
<<: Spark を使用して行列分解推奨アルゴリズムを学習する
>>: [乾物] Tencent Cloud FPGA 上のディープラーニング アルゴリズム
MIT の新しいテクノロジーは、視覚データでトレーニングされたニューラル ネットワークの内部の仕組み...
マルチモーダル生体認証とは何ですか? マルチモーダル生体認証は、さまざまなシナリオやセキュリティ レ...
製造業の実際の発展状況は、国の経済発展と社会の安定に関係しています。伝統的な製造業のインテリジェンス...
アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hall によって開発された...
[[214770]]この記事はQuantum School(WeChat:quantumschool...
[[431387]]ビッグデータダイジェスト制作ヘッダー画像のロボットの名前はAi-Da。彼女は史...
「分野が違えば意味も違う」とよく言われます。機械学習コミュニティは部外者から見るとどのように見えるの...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能が広く活用されるようになり、将来の雇用環境に対する不安も広がっています。 2019年に調査会...
機械学習技術は、ヘルスケアから高エネルギー物理学に至るまでのさまざまな分野の進歩を推進しています。現...
1. AIと機械学習を採用する人が増える人工知能 (AI) と機械学習 (ML) は単なる流行語では...