2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最も重要な 10 の機械学習スキルが挙げられています。以下はその翻訳です。

[[207324]]

1. ウラジミール・ノヴァコフスキーからの回答:

機械学習への最大の貢献は、多くの場合ジェネラリストによってなされます。特に 2017 年には、機械学習に関する話題が盛り上がりました。多くの求職者がオンラインでディープラーニングのコースを受講していますが、これは多くの人がコンピュータサイエンスの教科書を読まずに、「20日間でVBScriptを学ぶ」と主張する短期集中コースを読んでいた1990年代を思い出させます。 (実際、今でもそういう人はいる)

依然として重要なスキルとしては、(a) 統計、最適化、定量モデルの構築の基本原則を理解すること、(b) モデルとデータ分析が実際に製品やビジネスにどのように適用されるかを理解することなどが挙げられます。

上記の 2 つのポイントに加えて、2017 年には次のようなスキルも重要になります。

  • 高品質なソフトウェアの書き方を知る。 あるチームが粗悪なソフトウェアを作成し、別のチームがそれを完璧に仕上げる時代は終わりました。 Python や R などのプログラミング言語とそのパッケージを使用すると、データやモデルを簡単に操作できるため、データ サイエンティストや機械学習エンジニアは、高度なプログラミングが可能で、システム設計の基礎を理解できる必要があります。
  • 大規模なデータセットの操作。 「ビッグデータ」という用語は使い古されているが、データ保存のコストは確かに劇的に下がっている。これは、さまざまな分野からのデータセットがますます処理され、モデルが適用されていることを意味します。

はい、ある程度の知識とそれに対応する技術レベルの基礎を理解できたら、コンピュータービジョンと認識のためのディープラーニング、推奨エンジン、NLP(自然言語処理)など、少なくとも 1 つのホットな分野を理解しておくと役立ちます。

2. シヴァム・コーリからの回答:

スキル 1: プログラミング

これはおそらく、データ サイエンティストに求められる最も重要なスキルであり、従来の統計学者よりもはるかに実践的な仕事です。プログラミングは、次の 3 つを含め、さまざまな点で重要です。

  • プログラミングにより、統計を行う能力を高めることができます。統計が大量にあるのに、それを処理する方法がなければ、統計の知識は役に立ちません。
  • プログラミングにより、大規模なデータセットを分析できるようになります。業界で扱うデータセットは、サンプルのアイリス データセット (アイリス データセットは、Fisher (1936) が収集および編集した、一般的に使用されている分類実験データセット) ほど小さくてかわいいものではありません。数百万、あるいはそれ以上のデータを簡単に取得できます。
  • プログラミングを通じて、より優れたデータ処理ツールを作成できます。これには、データを視覚化するシステムの構築、分析実験を自動化するフレームワークの作成、必要なデータがすぐに利用できるように会社全体のデータフローを管理することが含まれます。

スキル2: 定量分析

定量分析は、データ サイエンティストに必要な中核的なスキルです。データ サイエンスの多くは、自然科学や実験によって生成されたデータを分析することで、特に複雑な科学システムの動作を理解することを伴います。定量的なスキルは、次の 3 つを含め、さまざまな点で重要です。

  • 実験の設計と分析: 特に消費者向けインターネット アプリケーションに取り組んでいるデータ サイエンティストにとって、データの記録方法と実験の実行方法は、多数の実験で幅広い仮説をテストする方法を提供します。実験分析ではエラーが発生しやすいため(統計学者に聞いてみてください)、ここでデータ サイエンティストが大いに役立ちます。
  • 複雑な経済/成長システムのモデリング: 顧客離脱モデルや顧客生涯価値モデルなど、いくつかの古典的なモデリングがより一般的です。より複雑なモデリング、たとえば、需要と供給のモデリング、経済的に最適な方法でのサプライヤーのマッチング、どの成長手段が最も価値があるかをより正確に定量化するための企業の成長パイプラインのモデリングなど。最も有名な例は、Uber の価格高騰モデリングです。
  • 機械学習: 機械学習モデルを実装しなくても、データ サイエンティストは、仮説をテストするためのプロトタイプの作成、機能の選択と作成、既存の機械学習システムの強みとこの分野における機会の特定を支援できます。

このスキルに対する需要が最も高いデータ サイエンスの分野はどれですか? 1.物理学者2。統計学者3。エコノミスト4。オペレーションリサーチャー5.さらに、彼らはトップダウンアプローチ(モデル)またはボトムアップアプローチ(データ推論)を通じて複雑なシステムを理解することに非常に慣れています。

スキル3: 製品に対する直感

製品直感は、データ サイエンティストがシステムの定量分析を実行する能力に関連するスキルです。製品知識とは、データ サイエンティストが分析するすべてのデータを生成する複雑なシステムを理解することを意味します。このスキルの重要性は以下に反映されています。

  • 仮説の生成: 製品を熟知しているデータ サイエンティストは、システムの動作を特定の方法で変更できます。仮定は、システムのある側面がどのように動作するかについての「勘」に基づいており、システムがどのように動作するかについての勘を持つには、システムについて知る必要があります。
  • 指標の定義: 従来の分析スキル セットには、企業が特定の目標に対する成功を追跡するために使用できる主要な指標と二次的な指標を特定することが含まれます。データ サイエンティストは、次の 2 つの製品メトリックを作成するために製品を理解する必要があります。1.意図の測定2.価値を生み出すものを測定します。
  • デバッグ分析: 「信じられない」結果は、多くの場合、システムの「信じられない」特性によって発生します。優れた製品知識は、製品検査のスピードアップに役立ち、問題のある箇所をより迅速に特定するのに役立ちます。

製品知識には通常、企業が作成した製品の使用が含まれます。それが不可能な場合は、少なくとも実際に製品を使用している人々と知り合うようにしてください。

スキル4: コミュニケーション

このスキルは重要であり、上記のすべてのスキルの影響を大幅に高めるのに役立ちます。これは非常に重要であり、優れたデータ サイエンティストと優れたデータ サイエンティストを区別するものです。良好なコミュニケーションは、次のようなさまざまな方法で実証できます。

  • 洞察を伝える: 一部のデータ サイエンティストはこれを「ストーリーテリング」と呼んでいます。ここで最も重要なのは、洞察を明確かつ簡潔で効果的な方法で伝え、社内の他の人が効果的に理解できるようにすることです。
  • データの視覚化: わかりやすいグラフは千の言葉に値します。
  • 全体的なコミュニケーション: データ サイエンティストになるということは、エンジニア、デザイナー、プロダクト マネージャー、運用スタッフなど、さまざまな役割とのコラボレーションを含め、チームとして作業することを意味します。全体的なコミュニケーションが良好であれば、信頼と理解が深まります。これは、データ管理を任されている人にとって非常に重要です。

スキル5: チームワーク

最後のスキルは上記の 4 つのスキルを結び付けます。特に、データ サイエンティストは孤立して存在することはできず、チームで作業する必要があります。私が見てきた限りでは、データ サイエンティストは、会社のあらゆる側面に組み込まれている (または少なくとも製品開発組織に存在する) 場合に最も効果を発揮します。

チームワークが重要な理由は、次のとおりです。

  • 無私: これには、他者に援助と指導を提供すること、そして個人のキャリア上の野心よりも会社の使命を優先することが含まれます。
  • 継続的な反復: データ サイエンティストはフィードバックを重視しており、その仕事の多くは、効果的なソリューションに到達するために他のユーザーとの反復とフィードバックの繰り返しを必要とします。
  • 他の人と知識を共有する: データ サイエンスのキャリアは比較的新しい仕事であるため、特に役立つ可能性のあるすべての統計手法、フレームワーク、ライブラリ、言語、ツールを収集する必要がある場合、完全なスキルセットを持っている人はほとんどいません。知識はさまざまなデータ サイエンティストやその組織に分散している可能性があるため、データ サイエンティストが知識、方法、結果を継続的に共有することは特に有用です。

<<:  ディープラーニングと機械学習の違いを理解する

>>:  AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

ブログ    

推薦する

中間レビュー: 2021 年注目のデータサイエンスおよび機械学習スタートアップ 10 社

今日の企業は、競争上の優位性を獲得するために、増え続けるデータを活用し、データ サイエンス、人工知能...

DeepMindは「Transformerは事前学習データを超えて一般化できない」と指摘しているが、疑問視する人もいる。

マスク氏の xAI が Grok を発表した翌日、xAI はプロンプトエンジニアリングと説明可能性の...

...

...

すべてのデータ サイエンティストに必要な 3 つのシンプルな異常検出アルゴリズム

外れ値検出の詳細と、Python で 3 つのシンプルで直感的かつ強力な外れ値検出アルゴリズムを実装...

NVIDIA が Tensor RT-LLM を発表、RTX 搭載 PC プラットフォームで大規模言語モデルを 4 倍高速化

10月18日、NVIDIAはハードウェア分野における生成型人工知能の王者となった。同社のGPUは、M...

この線虫は単純ではありません!脳は高精度に修復され、ダイナミックに前進できる

最高精度の「線虫脳」、ここに登場。この「脳」は、Caenorhabditis elegans 線虫の...

...

AI開発シンポジウム:機械学習を農家に役立てる方法について議論

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

天才少年・志慧君が志遠ロボットとともに会場に入場!脳としてAIモデル、目標価格は20万以下

Huaweiの才能あふれる若者Zhihuiの起業家デビューがついに登場!観衆の注目が集まる中、「Ex...

独立サイトへのアクセス数が10万を超えました。YidiantianxiaのKreadoAIのサポートにより、海外のウィッグ市場でこのように活躍できることがわかりました。

近年、ウィッグ業界は海外進出のホットな分野として、国際市場で急速に台頭してきました。 Statist...

...

機械翻訳から読心術まで、AIは人類のバベルの塔を再建できるのか?

[[183536]]聖書の旧約聖書創世記には、人類が団結して天国に通じるバベルの塔を建てたという話...

工業生産は変化している:機械は人間よりも製造に優れている

最近、ロボットが人気になってきました。家庭生活、ホテル経営、学校教育、医療などさまざまな場面でロボッ...