2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最も重要な 10 の機械学習スキルが挙げられています。以下はその翻訳です。

[[207324]]

1. ウラジミール・ノヴァコフスキーからの回答:

機械学習への最大の貢献は、多くの場合ジェネラリストによってなされます。特に 2017 年には、機械学習に関する話題が盛り上がりました。多くの求職者がオンラインでディープラーニングのコースを受講していますが、これは多くの人がコンピュータサイエンスの教科書を読まずに、「20日間でVBScriptを学ぶ」と主張する短期集中コースを読んでいた1990年代を思い出させます。 (実際、今でもそういう人はいる)

依然として重要なスキルとしては、(a) 統計、最適化、定量モデルの構築の基本原則を理解すること、(b) モデルとデータ分析が実際に製品やビジネスにどのように適用されるかを理解することなどが挙げられます。

上記の 2 つのポイントに加えて、2017 年には次のようなスキルも重要になります。

  • 高品質なソフトウェアの書き方を知る。 あるチームが粗悪なソフトウェアを作成し、別のチームがそれを完璧に仕上げる時代は終わりました。 Python や R などのプログラミング言語とそのパッケージを使用すると、データやモデルを簡単に操作できるため、データ サイエンティストや機械学習エンジニアは、高度なプログラミングが可能で、システム設計の基礎を理解できる必要があります。
  • 大規模なデータセットの操作。 「ビッグデータ」という用語は使い古されているが、データ保存のコストは確かに劇的に下がっている。これは、さまざまな分野からのデータセットがますます処理され、モデルが適用されていることを意味します。

はい、ある程度の知識とそれに対応する技術レベルの基礎を理解できたら、コンピュータービジョンと認識のためのディープラーニング、推奨エンジン、NLP(自然言語処理)など、少なくとも 1 つのホットな分野を理解しておくと役立ちます。

2. シヴァム・コーリからの回答:

スキル 1: プログラミング

これはおそらく、データ サイエンティストに求められる最も重要なスキルであり、従来の統計学者よりもはるかに実践的な仕事です。プログラミングは、次の 3 つを含め、さまざまな点で重要です。

  • プログラミングにより、統計を行う能力を高めることができます。統計が大量にあるのに、それを処理する方法がなければ、統計の知識は役に立ちません。
  • プログラミングにより、大規模なデータセットを分析できるようになります。業界で扱うデータセットは、サンプルのアイリス データセット (アイリス データセットは、Fisher (1936) が収集および編集した、一般的に使用されている分類実験データセット) ほど小さくてかわいいものではありません。数百万、あるいはそれ以上のデータを簡単に取得できます。
  • プログラミングを通じて、より優れたデータ処理ツールを作成できます。これには、データを視覚化するシステムの構築、分析実験を自動化するフレームワークの作成、必要なデータがすぐに利用できるように会社全体のデータフローを管理することが含まれます。

スキル2: 定量分析

定量分析は、データ サイエンティストに必要な中核的なスキルです。データ サイエンスの多くは、自然科学や実験によって生成されたデータを分析することで、特に複雑な科学システムの動作を理解することを伴います。定量的なスキルは、次の 3 つを含め、さまざまな点で重要です。

  • 実験の設計と分析: 特に消費者向けインターネット アプリケーションに取り組んでいるデータ サイエンティストにとって、データの記録方法と実験の実行方法は、多数の実験で幅広い仮説をテストする方法を提供します。実験分析ではエラーが発生しやすいため(統計学者に聞いてみてください)、ここでデータ サイエンティストが大いに役立ちます。
  • 複雑な経済/成長システムのモデリング: 顧客離脱モデルや顧客生涯価値モデルなど、いくつかの古典的なモデリングがより一般的です。より複雑なモデリング、たとえば、需要と供給のモデリング、経済的に最適な方法でのサプライヤーのマッチング、どの成長手段が最も価値があるかをより正確に定量化するための企業の成長パイプラインのモデリングなど。最も有名な例は、Uber の価格高騰モデリングです。
  • 機械学習: 機械学習モデルを実装しなくても、データ サイエンティストは、仮説をテストするためのプロトタイプの作成、機能の選択と作成、既存の機械学習システムの強みとこの分野における機会の特定を支援できます。

このスキルに対する需要が最も高いデータ サイエンスの分野はどれですか? 1.物理学者2。統計学者3。エコノミスト4。オペレーションリサーチャー5.さらに、彼らはトップダウンアプローチ(モデル)またはボトムアップアプローチ(データ推論)を通じて複雑なシステムを理解することに非常に慣れています。

スキル3: 製品に対する直感

製品直感は、データ サイエンティストがシステムの定量分析を実行する能力に関連するスキルです。製品知識とは、データ サイエンティストが分析するすべてのデータを生成する複雑なシステムを理解することを意味します。このスキルの重要性は以下に反映されています。

  • 仮説の生成: 製品を熟知しているデータ サイエンティストは、システムの動作を特定の方法で変更できます。仮定は、システムのある側面がどのように動作するかについての「勘」に基づいており、システムがどのように動作するかについての勘を持つには、システムについて知る必要があります。
  • 指標の定義: 従来の分析スキル セットには、企業が特定の目標に対する成功を追跡するために使用できる主要な指標と二次的な指標を特定することが含まれます。データ サイエンティストは、次の 2 つの製品メトリックを作成するために製品を理解する必要があります。1.意図の測定2.価値を生み出すものを測定します。
  • デバッグ分析: 「信じられない」結果は、多くの場合、システムの「信じられない」特性によって発生します。優れた製品知識は、製品検査のスピードアップに役立ち、問題のある箇所をより迅速に特定するのに役立ちます。

製品知識には通常、企業が作成した製品の使用が含まれます。それが不可能な場合は、少なくとも実際に製品を使用している人々と知り合うようにしてください。

スキル4: コミュニケーション

このスキルは重要であり、上記のすべてのスキルの影響を大幅に高めるのに役立ちます。これは非常に重要であり、優れたデータ サイエンティストと優れたデータ サイエンティストを区別するものです。良好なコミュニケーションは、次のようなさまざまな方法で実証できます。

  • 洞察を伝える: 一部のデータ サイエンティストはこれを「ストーリーテリング」と呼んでいます。ここで最も重要なのは、洞察を明確かつ簡潔で効果的な方法で伝え、社内の他の人が効果的に理解できるようにすることです。
  • データの視覚化: わかりやすいグラフは千の言葉に値します。
  • 全体的なコミュニケーション: データ サイエンティストになるということは、エンジニア、デザイナー、プロダクト マネージャー、運用スタッフなど、さまざまな役割とのコラボレーションを含め、チームとして作業することを意味します。全体的なコミュニケーションが良好であれば、信頼と理解が深まります。これは、データ管理を任されている人にとって非常に重要です。

スキル5: チームワーク

最後のスキルは上記の 4 つのスキルを結び付けます。特に、データ サイエンティストは孤立して存在することはできず、チームで作業する必要があります。私が見てきた限りでは、データ サイエンティストは、会社のあらゆる側面に組み込まれている (または少なくとも製品開発組織に存在する) 場合に最も効果を発揮します。

チームワークが重要な理由は、次のとおりです。

  • 無私: これには、他者に援助と指導を提供すること、そして個人のキャリア上の野心よりも会社の使命を優先することが含まれます。
  • 継続的な反復: データ サイエンティストはフィードバックを重視しており、その仕事の多くは、効果的なソリューションに到達するために他のユーザーとの反復とフィードバックの繰り返しを必要とします。
  • 他の人と知識を共有する: データ サイエンスのキャリアは比較的新しい仕事であるため、特に役立つ可能性のあるすべての統計手法、フレームワーク、ライブラリ、言語、ツールを収集する必要がある場合、完全なスキルセットを持っている人はほとんどいません。知識はさまざまなデータ サイエンティストやその組織に分散している可能性があるため、データ サイエンティストが知識、方法、結果を継続的に共有することは特に有用です。

<<:  ディープラーニングと機械学習の違いを理解する

>>:  AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

ブログ    

推薦する

...

日本はAIと無人機械を使って月面基地を建設する計画で、2030年代までに完成することを目指している。

共同通信によると、国土交通省は月面に滞在できる基地を建設するため、無人重機の開発を進めている。日本は...

1 文でビデオ クリップを正確に見つけます。清華大学の新しい手法がSOTAを達成 | オープンソース

たった 1 文の説明で、長いビデオ内の対応するクリップを見つけることができます。たとえば、人が階段を...

Microsoft が Copilot の統合バージョンをリリース、Windows、Edge、その他のプラットフォームにも近日登場

マイクロソフトは米国現地時間9月22日木曜日、人工知能アシスタント「コパイロット」の最新バージョンを...

人工知能の知能を実現する方法

[[257748]]近年、ビジネスにおける人工知能 (AI) の重要性が急速に高まり、今では主要なテ...

Microsoft と Meta が提携し、Bing 検索を Meta AI チャットボットに統合

9月28日早朝、Meta Connect 2023において、MetaはMeta AIという新しいチャ...

2021年の人工知能と機械学習の5つのトレンド

人工知能と機械学習は長い間私たちの世界を変えてきましたが、2020年のコロナウイルスのパンデミックは...

予知保全のための機械学習

[[197940]]要点:将来のシステム障害を監視し、事前にメンテナンスをスケジュールするための予測...

清華大学とアイデアルは、自動運転機能を向上させる視覚言語モデルDriveVLMを提案した。

生成AIと比較して、自動運転も近年AIの研究開発が最も活発に行われている分野の1つです。完全自動運転...

中国チームは、自分たちが作るペイントトランスフォーマーを提案した。ネットユーザー:これもニューラルネットワークの使用が必要です

ニューラル ネットワークが優れた画家であることは周知の事実です。スケッチを風景画に変えたり、異なるス...

XML 圧縮アルゴリズムについての簡単な説明

XML 圧縮ユニットテストコードクラスプログラム { パブリック静的文字列XML = @"...

2023 年の IT ネットワーク トレンド トップ 10

2023 年には、IT ネットワーキング分野でいくつかの重要なトレンドが流行するでしょう。大まかに...

会話型AIが顧客体験を向上させる方法

[[380661]] [51CTO.com クイック翻訳] 会話型 AI により、アプリケーションは...

...