2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最も重要な 10 の機械学習スキルが挙げられています。以下はその翻訳です。

[[207324]]

1. ウラジミール・ノヴァコフスキーからの回答:

機械学習への最大の貢献は、多くの場合ジェネラリストによってなされます。特に 2017 年には、機械学習に関する話題が盛り上がりました。多くの求職者がオンラインでディープラーニングのコースを受講していますが、これは多くの人がコンピュータサイエンスの教科書を読まずに、「20日間でVBScriptを学ぶ」と主張する短期集中コースを読んでいた1990年代を思い出させます。 (実際、今でもそういう人はいる)

依然として重要なスキルとしては、(a) 統計、最適化、定量モデルの構築の基本原則を理解すること、(b) モデルとデータ分析が実際に製品やビジネスにどのように適用されるかを理解することなどが挙げられます。

上記の 2 つのポイントに加えて、2017 年には次のようなスキルも重要になります。

  • 高品質なソフトウェアの書き方を知る。 あるチームが粗悪なソフトウェアを作成し、別のチームがそれを完璧に仕上げる時代は終わりました。 Python や R などのプログラミング言語とそのパッケージを使用すると、データやモデルを簡単に操作できるため、データ サイエンティストや機械学習エンジニアは、高度なプログラミングが可能で、システム設計の基礎を理解できる必要があります。
  • 大規模なデータセットの操作。 「ビッグデータ」という用語は使い古されているが、データ保存のコストは確かに劇的に下がっている。これは、さまざまな分野からのデータセットがますます処理され、モデルが適用されていることを意味します。

はい、ある程度の知識とそれに対応する技術レベルの基礎を理解できたら、コンピュータービジョンと認識のためのディープラーニング、推奨エンジン、NLP(自然言語処理)など、少なくとも 1 つのホットな分野を理解しておくと役立ちます。

2. シヴァム・コーリからの回答:

スキル 1: プログラミング

これはおそらく、データ サイエンティストに求められる最も重要なスキルであり、従来の統計学者よりもはるかに実践的な仕事です。プログラミングは、次の 3 つを含め、さまざまな点で重要です。

  • プログラミングにより、統計を行う能力を高めることができます。統計が大量にあるのに、それを処理する方法がなければ、統計の知識は役に立ちません。
  • プログラミングにより、大規模なデータセットを分析できるようになります。業界で扱うデータセットは、サンプルのアイリス データセット (アイリス データセットは、Fisher (1936) が収集および編集した、一般的に使用されている分類実験データセット) ほど小さくてかわいいものではありません。数百万、あるいはそれ以上のデータを簡単に取得できます。
  • プログラミングを通じて、より優れたデータ処理ツールを作成できます。これには、データを視覚化するシステムの構築、分析実験を自動化するフレームワークの作成、必要なデータがすぐに利用できるように会社全体のデータフローを管理することが含まれます。

スキル2: 定量分析

定量分析は、データ サイエンティストに必要な中核的なスキルです。データ サイエンスの多くは、自然科学や実験によって生成されたデータを分析することで、特に複雑な科学システムの動作を理解することを伴います。定量的なスキルは、次の 3 つを含め、さまざまな点で重要です。

  • 実験の設計と分析: 特に消費者向けインターネット アプリケーションに取り組んでいるデータ サイエンティストにとって、データの記録方法と実験の実行方法は、多数の実験で幅広い仮説をテストする方法を提供します。実験分析ではエラーが発生しやすいため(統計学者に聞いてみてください)、ここでデータ サイエンティストが大いに役立ちます。
  • 複雑な経済/成長システムのモデリング: 顧客離脱モデルや顧客生涯価値モデルなど、いくつかの古典的なモデリングがより一般的です。より複雑なモデリング、たとえば、需要と供給のモデリング、経済的に最適な方法でのサプライヤーのマッチング、どの成長手段が最も価値があるかをより正確に定量化するための企業の成長パイプラインのモデリングなど。最も有名な例は、Uber の価格高騰モデリングです。
  • 機械学習: 機械学習モデルを実装しなくても、データ サイエンティストは、仮説をテストするためのプロトタイプの作成、機能の選択と作成、既存の機械学習システムの強みとこの分野における機会の特定を支援できます。

このスキルに対する需要が最も高いデータ サイエンスの分野はどれですか? 1.物理学者2。統計学者3。エコノミスト4。オペレーションリサーチャー5.さらに、彼らはトップダウンアプローチ(モデル)またはボトムアップアプローチ(データ推論)を通じて複雑なシステムを理解することに非常に慣れています。

スキル3: 製品に対する直感

製品直感は、データ サイエンティストがシステムの定量分析を実行する能力に関連するスキルです。製品知識とは、データ サイエンティストが分析するすべてのデータを生成する複雑なシステムを理解することを意味します。このスキルの重要性は以下に反映されています。

  • 仮説の生成: 製品を熟知しているデータ サイエンティストは、システムの動作を特定の方法で変更できます。仮定は、システムのある側面がどのように動作するかについての「勘」に基づいており、システムがどのように動作するかについての勘を持つには、システムについて知る必要があります。
  • 指標の定義: 従来の分析スキル セットには、企業が特定の目標に対する成功を追跡するために使用できる主要な指標と二次的な指標を特定することが含まれます。データ サイエンティストは、次の 2 つの製品メトリックを作成するために製品を理解する必要があります。1.意図の測定2.価値を生み出すものを測定します。
  • デバッグ分析: 「信じられない」結果は、多くの場合、システムの「信じられない」特性によって発生します。優れた製品知識は、製品検査のスピードアップに役立ち、問題のある箇所をより迅速に特定するのに役立ちます。

製品知識には通常、企業が作成した製品の使用が含まれます。それが不可能な場合は、少なくとも実際に製品を使用している人々と知り合うようにしてください。

スキル4: コミュニケーション

このスキルは重要であり、上記のすべてのスキルの影響を大幅に高めるのに役立ちます。これは非常に重要であり、優れたデータ サイエンティストと優れたデータ サイエンティストを区別するものです。良好なコミュニケーションは、次のようなさまざまな方法で実証できます。

  • 洞察を伝える: 一部のデータ サイエンティストはこれを「ストーリーテリング」と呼んでいます。ここで最も重要なのは、洞察を明確かつ簡潔で効果的な方法で伝え、社内の他の人が効果的に理解できるようにすることです。
  • データの視覚化: わかりやすいグラフは千の言葉に値します。
  • 全体的なコミュニケーション: データ サイエンティストになるということは、エンジニア、デザイナー、プロダクト マネージャー、運用スタッフなど、さまざまな役割とのコラボレーションを含め、チームとして作業することを意味します。全体的なコミュニケーションが良好であれば、信頼と理解が深まります。これは、データ管理を任されている人にとって非常に重要です。

スキル5: チームワーク

最後のスキルは上記の 4 つのスキルを結び付けます。特に、データ サイエンティストは孤立して存在することはできず、チームで作業する必要があります。私が見てきた限りでは、データ サイエンティストは、会社のあらゆる側面に組み込まれている (または少なくとも製品開発組織に存在する) 場合に最も効果を発揮します。

チームワークが重要な理由は、次のとおりです。

  • 無私: これには、他者に援助と指導を提供すること、そして個人のキャリア上の野心よりも会社の使命を優先することが含まれます。
  • 継続的な反復: データ サイエンティストはフィードバックを重視しており、その仕事の多くは、効果的なソリューションに到達するために他のユーザーとの反復とフィードバックの繰り返しを必要とします。
  • 他の人と知識を共有する: データ サイエンスのキャリアは比較的新しい仕事であるため、特に役立つ可能性のあるすべての統計手法、フレームワーク、ライブラリ、言語、ツールを収集する必要がある場合、完全なスキルセットを持っている人はほとんどいません。知識はさまざまなデータ サイエンティストやその組織に分散している可能性があるため、データ サイエンティストが知識、方法、結果を継続的に共有することは特に有用です。

<<:  ディープラーニングと機械学習の違いを理解する

>>:  AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

推薦する

人工知能が再び懸念を呼ぶ! AIが独自の「デジタル感覚」を進化させたのは、祝福か呪いか?

科学の最前線から世界を眺め、熱心に学び、宇宙を理解するホーキング博士はかつて、人工知能(AI)の発達...

世界情報会議が開幕、ロビン・リー、ジャック・マー、劉伝志ら著名人が集結

【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...

セマンティクスと機械学習が融合するとき

人工知能は歴史的に、やや相反する2つの陣営の間を揺れ動いてきました。一方では、ノーム・チョムスキー、...

Reverse Midjourneyがオンラインになりました!デジタルアーティストがスティーブ・ジョブズに魅了され、写真がボルヘスの精神世界に入る

ブラウザに住むアーティストが開発した、ニューヨーク発のAIカメラアプリが人気を集めている。もしスティ...

...

機械学習はデータに依存する

[[186928]]ビッグデータ、分析、モノのインターネット、クラウドテクノロジー...近年、これら...

...

AutoGPTオープンソースAIエージェントを理解する

こんにちは、ルガです。今日も引き続き、人工知能 (AI) エコシステムに関連するテクノロジーである ...

機械学習があなたの好きな音楽を発見する方法: パーソナライズされた音楽推奨の背後にある科学

今週の月曜日も、他の月曜日と同様に、Spotify の 1 億人を超えるユーザー全員に新しいプレイリ...

人工知能産業は各地で花開いています。この7つのロボットがあなたに近づいてきます!

現在、中国の製造業、農業、飲食業、企業、機関はすべて、自動化からインテリジェンス化、デジタル化への変...

百度は「ニューラル条件付きランダムフィールド」病理スライス分析アルゴリズムをオープンソース化、専門病理学者よりも高い精度を実現

最近、百度研究所は論文で「ニューラル条件付きランダムフィールド」病理スライス分析アルゴリズムを提案し...

新しいソートアルゴリズムの発明から始まる

このような単純なアルゴリズムは、先代のエンジニアが考え出したものであるに違いありません。初心者であっ...

...

[NCTSサミットレビュー] Rong360 Ai Hui: AIモデルテストの秘密を探る

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

ソートアルゴリズムを簡単に学ぶ: よく使われるソートアルゴリズムを視覚的に体験

1. クイックソート導入:クイックソートは、Tony Hall によって開発されたソートアルゴリズム...