機械学習エンジニアとデータサイエンティストの戦い

機械学習エンジニアとデータサイエンティストの戦い

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。

人工知能の発展により、市場にはいくつかの新しい仕事が生まれています。しかし、私たちの多くにとって、これらの新興分野における新たなキャリア、特に機械学習エンジニアとデータサイエンティストの役割の違いを見分けるのは難しく、混乱を招きます。

[[334134]]

さまざまな記事やブログを読み、いくつかのビデオを見た後、比較することで両者の違いをより明確に説明したいと思いました。

まずは例え話をしてみましょう。作家と教授の違いは何でしょうか? 両者とも言語の「ルールと文法」を知っており、一方はストーリーテラーであり、もう一方は「ルール」を厳密に実践する人であると言えます。

データ サイエンティストは、生データを処理および分析し、点と点を結び付け、その他の視覚化ツールを使用してストーリーを伝えます。彼らは通常、幅広いスキルセットを持ち、1 つまたは 2 つの分野についてのみ深い知識を持っています。彼らは芸術家のように創造性に傾倒しています。

機械学習エンジニアは、データを、取り込んで適切な形式で効率的に出力する必要があるものと見なします。実装の詳細に関して、彼らのスキルは効率的である必要があります。

両者の間には多くの重複があるかもしれませんが、データ サイエンティストは機械学習エンジニアになることができますが、その逆はあり得ません。おそらく、より多くの経験を積むにつれて、機械学習エンジニアはデータサイエンティストであるという考えが現実になるだろう。

機械学習とデータサイエンスのベン図

データ サイエンスには、洞察力や学習に関してある程度のビジネス感覚を持つ人材が必要ですが、機械学習には、システム予測に関してある程度のビジネス感覚を持つ人材が必要です。例えば:

  • データサイエンス: 「この地区には、約 2 マイルごとにガソリンスタンドがあります」
  • 機械学習: 「ガソリンスタンドを見つけてから 2 マイル歩いたので、今度は別のガソリンスタンドを探し始める必要があります」

Netflixの例を見てみましょう。

Netflix が過去の選択に基づいて賢く映画を推奨していることは誰もが知っています。このレコメンデーション システムは機械学習アルゴリズムと連携して、レコメンデーション システムを使用して適切な映画の選択肢を提供します。

Netflix のデータ サイエンスについて話すとき、私たちが研究するパターンには、特定の時間に視聴しているレビューアーの数、年齢と性別の構成、その他多くのことが含まれます。これらの決定はビジネスの見通しを改善するために使用されます。企業が質問に答えたり問題を解決したりするためにデータを必要とするとき、生の非構造化データから有用な洞察を提供するのがデータ サイエンティストの仕事です。

データサイエンティストに必要なスキル:

  • 統計
  • データマイニングとクリーニング
  • データの視覚化
  • 非構造化データ管理技術
  • RやPythonなどのプログラミング言語
  • SQL データベースを理解する
  • Hadoop、Hive、Pigなどのビッグデータツールを使用する

機械学習エンジニアに必要なスキル:

  • コンピュータサイエンス財団
  • 統計モデリング
  • データ評価とモデリング
  • アルゴリズムを理解して適用する
  • 自然言語処理
  • データアーキテクチャ設計
  • テキスト表現技術

上記からわかるように、データ サイエンティストと機械学習エンジニアの仕事は依然として大きく異なります。混同しないでください。自分のスキルと個人的な興味に最も適したポジションを判断し、将来に備えて特定の方向に意識的にスキルを伸ばしてください。

<<:  トニー先生に別れを告げる:海外の専門家が流行中に独自の美容ロボットを製作

>>:  MIT、Wikipedia の更新、間違いの修正、偽ニュースの特定を行う AI 編集システムを開始

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

集中治療室における人工知能の未来

他の業界と同様に、ヘルスケアにおける AI の応用と議論は幅広く行われています。 AIはすでに診断の...

...

モノのインターネットを支援するAI搭載量子コンピューティング

量子コンピューティングはまだ開発段階にありますが、人工知能とモノのインターネットの開発を加速させる新...

4Paradigm が分子特性予測のための生成型 3D 事前トレーニング済みモデルを開発

論文タイトル: 分子特性予測のための自動 3D 事前トレーニング論文リンク: https://arx...

ニューラルネットワークはなぜそれほど強力なのでしょうか?

普遍近似定理ニューラル ネットワークは非常に強力であることが知られており、ほぼすべての統計学習問題を...

...

...

ガイドはここにあります! GPT3.5を微調整して大規模モデルをカスタマイズしましょう!

著者 | 崔昊レビュー | Chonglou一般的なモデルは優れていますが、技術者は、独自の大規模な...

...

...

アリババが国際AIサミットを主催、医療AIとマルチメディアコンテンツ理解が話題に

10月15日、記者はアリババが主催する2020 ACMマルチメディア(以下、ACM MM 2020)...

AppleはAI競争で遅れをとり、市場価値ランキングはAmazon、Google、Microsoftに追い抜かれる可能性も

米国現地時間9月8日木曜日、投資会社ニーダム・セキュリティーズは、アマゾン、グーグル、マイクロソフト...

WSLはAIトレーニングタスクとLinux GUIアプリケーションの実行をサポートします

WSL は Windows 上で GPU を使用してアプリケーションを実行することをサポートするよう...

機械学習がデータセンター管理をどう変えるか

機械学習はデータセンターの経済性を劇的に変え、将来のパフォーマンス向上への道を開きます。機械学習と人...