機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習エンジニアになるには、通常、博士号が必要です。

たとえそれがその立場の必要条件として書かれていなくても、それは次第に自然法則となっていきます。

では、独学の人は、面接官に自分も同じ能力を持っていると納得してもらうために、どのようなプロジェクト経験について書けばよいのでしょうか?

AddedWayという名のネットユーザーがRedditでこの心を揺さぶる質問を提起したところ、大きな議論が巻き起こり、2日間で500回以上閲覧されました。

ディスカッション掲示板では多くの人が適切な提案をしてくれました。

業界に必要なスキル

po-handzというネットユーザーがいるが、彼の意見は80ポイントの賛同を得て、コメント欄のトップを占めた。

プロジェクトを本番環境に導入することで、新卒者や現在の ML エンジニアの99%を上回ることができます。

この点に関して、ある人(モラヴァク)が強い同意を表明した。

この「大多数」は実際には 99.9% 以上を意味します。

ディンロウ氏は、たとえ多くの人が博士号を取得しても、自力でプロジェクトを製品化まで導く経験がないかもしれないと付け加えた。

では、そのような経験をするということはどういう意味でしょうか?

ネットユーザー(BernieFeynman)はそれを簡単に説明しました:

いくつかのモデルを構築します。超素晴らしいものである必要はありません。しかし、モデルがどこで実行されているかをユーザーが確認できるようにする必要があります。たとえば、呼び出すことができる API が存在する必要があります。

もちろん、これは簡単なことではありません。最上階では、プロセス全体がいかに難しいかが詳しく説明されています。

たとえば、通常はモデルが 1 つだけではなく、複数のモデルが存在します。したがって、これらの大きなモデルはサーバーの RAM にロードする必要があります。新しい入力データも受け入れます。これらのデータはテスト データと同じ形式で、スケーリングも行う必要があります。どのようにスケーリングすればよいでしょうか?推論には GPU が必要ですか?その場合、AWS では月額 1,000 ドルかかる可能性があります。予算で対応できますか?時系列データはどうでしょうか?継続的に更新されるモデルとパラメータを追跡する必要があります。さらに、リアルタイムで保守可能なデータ パイプラインも必要です。これは、クリーンなデータセットを扱うよりもはるかに困難です。最後に、ユーザーフレンドリーにするには、完全な UI、Web サイト、nginx スタックが必要です。

新しく博士号を取得したばかりの人はもちろん、経験豊富なデータ サイエンティストの多くは、自分の専門分野でのみ仕事をし、他の人からクリーンなデータ セットを渡されるため、これらのことについて何も知りません。

この点において彼らに勝てば、会社にとってより高い価値が生まれます。

履歴書を台無しにしないでください

実践的なスキルを訓練することは、一つの側面にすぎません。

履歴書の選考プロセスで失敗したくない場合は、ネットユーザー(rudiXOR)が「MLエンジニアを募集している中規模企業」の10大危険地帯をまとめたので、参考にしてください。

まず、MOOC 認定資格をいくつか取得します。役に立たない。試してみた。誰でもクイズをクリックできる。 2 つ目は、Kaggle での成果を誇りすぎることです。多くの大学生が Kaggle コンテストに参加しており、このコンテストが ML エンジニアの仕事とほとんど共通点がないことも知っています。 3 つ目は、3 か月のトレーニングを経て、PCA から LSTM まで、ほぼすべての ML テクニックを習得したことです。誰もそれを本当に信じませんでした。 4 番目に、GitHub プロジェクトは、コードが 1 回だけ送信されたプロジェクトです。それが自分でやったことかどうかは全く分かりません。 5 番目に、GitHub ホームページは新しく、プロジェクトがありません。 6 番目に、このモデルは、より本格的なプロジェクトではなく、おもちゃのデータセットでのみテストされています。 7番目に、どの言語でも「習得」という言葉があります。たとえば、C++、Python、Java、C# などです。8 番目は、履歴書を求人要件と慎重に照合することです (「HR アルゴリズムのバズワード最適化」)。 9番目に、数学/統計に関する知識を証明していません。 10番目は、ソフトウェア開発の経験がないことです。

最初の 9 つのポイントを忘れてしまったとしても、10 番目のポイントを真剣に参照することができます。地雷原を列挙した後、ネットユーザーらは次のように強調した。

独学の場合は、すぐにデータ サイエンティストや ML エンジニアに応募しないでください。まずはデータアナリストやソフトウェアエンジニアに応募してみましょう。 ML を独学で学び、ソフトウェア開発の経験がない場合は、採用しません。

前回の記事を参考にすると、博士号を取得していない場合は、博士号よりも業界での経験が豊富であることが有利になります。

もう一つ

しかし、独学で学ぶのに遅すぎるということはありません。

たとえば、Google Brain の研究者である David Ha 氏は、機械学習を採用する前はすでにゴールドマン・サックスのマネージング・ディレクター (MD) を務めていました。

[[271179]]

それでは皆様頑張って下さい。

Reddit フォーラムにはさらに多くの提案があります:

https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/

<<:  ディープニューラルネットワークはディープフェイクを検出できる

>>:  ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ブログ    
ブログ    

推薦する

AIエンジニアリングのためのJavaScriptツールトップ5

多くの人が驚くことに、Web 開発の分野で常に人気がある JavaScript は、大規模言語モデル...

...

ザッカーバーグ氏がCharacter.AIの1:1レプリカである仮想チャットAIをリリース?ユーザーの不満: 設定が古すぎる

ユーザーがTikTokにどんどん奪われ、毎日のアクティブユーザー数が減り続けているという現実に直面し...

...

メタバースの時代が来ます。準備はできていますか?

人類の進化の歴史を振り返ると、時代のあらゆる変化は不可逆的であることに気づくのは難しくありません。な...

人工知能が中小企業にもたらす5つのメリット

[[328993]] 【51CTO.com クイック翻訳】 AI 市場のトレンドはどのくらいの速さで...

5つのリソースカテゴリー:大規模言語モデルのリソース効率を向上させる方法、超詳細なレビューはこちら

近年、OpenAI の GPT-3 などの大規模言語モデル (LLM) は、人工知能の分野で大きな進...

AIアルゴリズムから製品実装までの8つのギャップを数える

今日、人工知能技術は急速に発展し続けており、画像認識、音声認識、意味理解など多くの特定の分野で人間の...

...

メルセデス・ベンツCIO:デジタル変革には人工知能の推進力が必要

メルセデス・ベンツは長年、機械学習と従来の人工知能に依存してきました。しかし、現在では、たとえば M...

...

機械学習情報工場になるためには、企業はリーン製造からこれらの6つの基本を学ぶ必要がある

【51CTO.com クイック翻訳】調査機関Forrester Researchが最近発表した調査レ...

快手八卦についての噂: TensorFlow と PyTorch の並列ボトルネックを打破する分散トレーニング フレームワーク

最近、KuaishouとETH Zurichはオープンソースの分散トレーニングフレームワークBagu...

ディープラーニングの次の段階:ニューラルアーキテクチャの自己学習により、優れたコンピュータビジョンモデルが実現

[[275255]]ディープラーニングは人工知能モデルの先駆けです。画像認識、音声認識、テキスト理解...