最新の KDnuggets 調査では、データ サイエンティストが最もよく使用するアルゴリズムのリストが示されています。このリストには、最も学術的なアルゴリズムや業界向けのアルゴリズムなど、多くの驚くべきものが含まれています。 過去 12 か月間に、実際のデータ サイエンス関連のアプリケーションにどのような方法やアルゴリズムを適用しましたか? これは 844 人の投票者の結果に基づいています。 上位 10 のアルゴリズムとその投票者の分布は次のとおりです。 図1: データサイエンティストが最もよく使用するアルゴリズムトップ10 回答者 1 人あたりが使用したアルゴリズムの平均数は 8.1 で、2011 年の同様の調査と比べて大幅に増加しています。 2011 年のデータ分析/データマイニングに関する調査と比較すると、最も一般的に使用されている手法は依然として回帰、クラスタリング、決定木/ルール、視覚化であることがわかりました。相対的に最も大きな成長は、次のアルゴリズムを使用して (pct2016 /pct2011 – 1) によって決定されます。
***アルゴリズムには 2016 年の調査で新しいリストがあります:
最も大きく下落したのは次の通りです。
次の表は、さまざまなアルゴリズム タイプ(教師ありアルゴリズム、教師なしアルゴリズム、メタアルゴリズム)の使用状況と、職業の種類によって決まるアルゴリズムの使用状況を示しています。職業タイプNA(4.5%)とその他(3%)は除外します。 表1: 職業の種類に応じたさまざまなアルゴリズムの使用 ほぼすべての人が教師あり学習アルゴリズムを使用していることに気付きました。 政府や業界のデータ サイエンティストは、学生や学術研究者よりもさまざまな種類のアルゴリズムを使用しますが、業界のデータ サイエンティストはメタアルゴリズムを使用する傾向があります。 次に、職業種別にアルゴリズム+ディープラーニングの利用率上位10を分析しました。 表2: 職業別アルゴリズム+ディープラーニング使用率上位10位 違いをより明確にするために、特定の職業カテゴリのアルゴリズムバイアスを平均的なアルゴリズム使用率と比較して計算しました。つまり、バイアス(ALG、タイプ) = 使用率(ALG、タイプ) / 使用率(ALG、すべて)です。 図2: アルゴリズムの使用に関する職業上の好み 産業データ サイエンティストは、回帰、視覚化、統計、ランダム フォレスト、時系列を使用する傾向があることに気付きました。政府機関や非営利団体では、視覚化、主成分分析、時系列を使用する可能性が高くなります。学術研究者は主成分分析とディープラーニングを好みます。学生が使用するアルゴリズムは一般的に少ないですが、そのほとんどはテキストマイニングとディープラーニングです。 次に、KDnuggets ユーザー全体を表す特定の地域でのエンゲージメントを見てみましょう。
2011 年の調査では、産業界/政府を 1 つのグループに、学術研究者/学生を 2 番目のグループに分け、アルゴリズムの産業界/政府に対する親和性を計算しました。 したがって、親和性が 0 のアルゴリズムは、産業界/政府と学術研究者または学生の間で均等に使用されていることを示します。 IG 親和性が高いほど、アルゴリズムは業界で広く使用されていることになり、逆に、IG 親和性が低いほど、アルゴリズムは「学術的」になります。 最も「工業的」なアルゴリズムは次のとおりです。
最も「産業用アルゴリズム」であるアップリフティングモデリングについては、驚くべきことに使用頻度が低く、わずか 3.1% で、調査対象のアルゴリズムの中で最も低い値となっています。 最も学術的なアルゴリズムは次のとおりです。
下の図は、すべてのアルゴリズムとその業界/学術的親和性を示しています。 図 3: KDnuggets の世論調査: データ サイエンティストが最もよく使用するアルゴリズム: 業界 vs. 学術界 以下の表には、アルゴリズムの詳細、両方の調査でアルゴリズムを使用している割合、および上で説明した業界の親和性が記載されています。 次の図は、列ごとにアルゴリズムの詳細を示しています。 N: 使用頻度順
表3: KDnuggets 2016 調査: データサイエンティストが使用するアルゴリズム |
<<: エンジニアはETLを書くべきか? - 効率的なアルゴリズム/データサイエンス部門の構築方法を教えます
調査によると、人工知能はビジネスの生産性を 54% 向上させることができます。さらに、15% の組織...
本日、北京大学国家ソフトウェア工学研究センター知識コンピューティング実験室と四川天府銀行AI実験室は...
北京地下鉄は昨年11月から、セキュリティチェックに顔認識技術を使用する試験運用を開始し、ブラックリス...
我が国の「デュアルカーボン」目標の提唱により、データセンターにおける省エネと消費削減が社会的に注目さ...
6月25日、「AIによるソフトウェアとハードウェア製品のイノベーションの促進」をテーマにした西安...
2017年7月8日、5日間にわたる第2回Taobao Maker Festivalが杭州国際博覧セン...
[[416150]]グローバルな AI ガバナンスのコンセンサスを実装し、信頼できる AI テクノロ...
[[272155]] 2016年にAlphaGoが「人間対機械」の競争に勝利して以来、人工知能への...
大規模言語モデル (LLM) は、自然言語からコード スニペットを生成できることが示されていますが、...
起業プロジェクトの数、資金調達額、資金調達のスピードなど、AIは近年間違いなく注目の産業です。しかし...
人工知能 (AI) 技術の人気が高まるにつれ、さまざまなアルゴリズムがこの分野の発展を促進する上で重...
ケンブリッジ大学人工知能研究センターは、人工知能によってもたらされる新しい能力とそれが直面するリスク...