機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習エンジニアになるには、通常、博士号が必要です。

たとえそれがその立場の必要条件として書かれていなくても、それは次第に自然法則となっていきます。

では、独学の人は、面接官に自分も同じ能力を持っていると納得してもらうために、どのようなプロジェクト経験について書けばよいのでしょうか?

AddedWayという名のネットユーザーがRedditでこの心を揺さぶる質問を提起したところ、大きな議論が巻き起こり、2日間で500回以上閲覧されました。

ディスカッション掲示板では多くの人が適切な提案をしてくれました。

業界に必要なスキル

po-handzというネットユーザーがいるが、彼の意見は80ポイントの賛同を得て、コメント欄のトップを占めた。

プロジェクトを本番環境に導入することで、新卒者や現在の ML エンジニアの99%を上回ることができます。

この点に関して、ある人(モラヴァク)が強い同意を表明した。

この「大多数」は実際には 99.9% 以上を意味します。

ディンロウ氏は、たとえ多くの人が博士号を取得しても、自力でプロジェクトを製品化まで導く経験がないかもしれないと付け加えた。

では、そのような経験をするということはどういう意味でしょうか?

ネットユーザー(BernieFeynman)はそれを簡単に説明しました:

いくつかのモデルを構築します。超素晴らしいものである必要はありません。しかし、モデルがどこで実行されているかをユーザーが確認できるようにする必要があります。たとえば、呼び出すことができる API が存在する必要があります。

もちろん、これは簡単なことではありません。最上階では、プロセス全体がいかに難しいかが詳しく説明されています。

たとえば、通常はモデルが 1 つだけではなく、複数のモデルが存在します。したがって、これらの大きなモデルはサーバーの RAM にロードする必要があります。新しい入力データも受け入れます。これらのデータはテスト データと同じ形式で、スケーリングも行う必要があります。どのようにスケーリングすればよいでしょうか?推論には GPU が必要ですか?その場合、AWS では月額 1,000 ドルかかる可能性があります。予算で対応できますか?時系列データはどうでしょうか?継続的に更新されるモデルとパラメータを追跡する必要があります。さらに、リアルタイムで保守可能なデータ パイプラインも必要です。これは、クリーンなデータセットを扱うよりもはるかに困難です。最後に、ユーザーフレンドリーにするには、完全な UI、Web サイト、nginx スタックが必要です。

新しく博士号を取得したばかりの人はもちろん、経験豊富なデータ サイエンティストの多くは、自分の専門分野でのみ仕事をし、他の人からクリーンなデータ セットを渡されるため、これらのことについて何も知りません。

この点において彼らに勝てば、会社にとってより高い価値が生まれます。

履歴書を台無しにしないでください

実践的なスキルを訓練することは、一つの側面にすぎません。

履歴書の選考プロセスで失敗したくない場合は、ネットユーザー(rudiXOR)が「MLエンジニアを募集している中規模企業」の10大危険地帯をまとめたので、参考にしてください。

まず、MOOC 認定資格をいくつか取得します。役に立たない。試してみた。誰でもクイズをクリックできる。 2 つ目は、Kaggle での成果を誇りすぎることです。多くの大学生が Kaggle コンテストに参加しており、このコンテストが ML エンジニアの仕事とほとんど共通点がないことも知っています。 3 つ目は、3 か月のトレーニングを経て、PCA から LSTM まで、ほぼすべての ML テクニックを習得したことです。誰もそれを本当に信じませんでした。 4 番目に、GitHub プロジェクトは、コードが 1 回だけ送信されたプロジェクトです。それが自分でやったことかどうかは全く分かりません。 5 番目に、GitHub ホームページは新しく、プロジェクトがありません。 6 番目に、このモデルは、より本格的なプロジェクトではなく、おもちゃのデータセットでのみテストされています。 7番目に、どの言語でも「習得」という言葉があります。たとえば、C++、Python、Java、C# などです。8 番目は、履歴書を求人要件と慎重に照合することです (「HR アルゴリズムのバズワード最適化」)。 9番目に、数学/統計に関する知識を証明していません。 10番目は、ソフトウェア開発の経験がないことです。

最初の 9 つのポイントを忘れてしまったとしても、10 番目のポイントを真剣に参照することができます。地雷原を列挙した後、ネットユーザーらは次のように強調した。

独学の場合は、すぐにデータ サイエンティストや ML エンジニアに応募しないでください。まずはデータアナリストやソフトウェアエンジニアに応募してみましょう。 ML を独学で学び、ソフトウェア開発の経験がない場合は、採用しません。

前回の記事を参考にすると、博士号を取得していない場合は、博士号よりも業界での経験が豊富であることが有利になります。

もう一つ

しかし、独学で学ぶのに遅すぎるということはありません。

たとえば、Google Brain の研究者である David Ha 氏は、機械学習を採用する前はすでにゴールドマン・サックスのマネージング・ディレクター (MD) を務めていました。

[[271179]]

それでは皆様頑張って下さい。

Reddit フォーラムにはさらに多くの提案があります:

https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/

<<:  ディープニューラルネットワークはディープフェイクを検出できる

>>:  ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ブログ    

推薦する

在庫: 過去2年間の人工知能と機械学習の分野でのいくつかの買収

世界的なテクノロジー大手がトップクラスの人工知能の人材と技術をめぐる競争に参入し、市場は活況を呈して...

...

チップ設計に特化したNVIDIAが、カスタマイズされた大規模言語モデルChipNeMoをリリース!

先日開幕した ICCAD 2023 カンファレンスで、NVIDIA チームは AI モデルを使用して...

2018年の人工知能の発展に関する5つの予測

2017年は人工知能技術(AI)において画期的な発展があった年でした。過去 1 年間の大きな宣伝にも...

...

自然言語処理の商業的価値を示す5つの成功事例

これら 5 つの組織は、自然言語処理 (NLP) を使用して、顧客へのサービスの向上、反復的なタスク...

ビッグビデオモデルは世界モデルですか? DeepMind/UC Berkeley Chinese: 次のフレームを予測することで世界を変えることができる

今年初めにOpenAIが発表した壮大な傑作「Sora」が、ビデオ関連分野のコンテンツエコロジーを変え...

...

モジュラーコンピュータはこうあるべきだ: 1人の人間が作った超小型コンピュータがオタクコミュニティ全体に衝撃を与えた

手を汚すことが好きな人にとって、コンピューターはおもちゃのようなものです。 Raspberry Pi...

顧客サービスの革命: 現代のビジネスにおける広報ロボットの役割

人工知能 (AI) の登場により、企業の運営方法は劇的に変化し、PR ボットが顧客サービスの革命にお...

CNNを称賛するのはやめろ。類似点と相違点さえ区別できない

[[416629]]セサミストリートには「One of These Things Is Not Li...

人材情報プラットフォームの変革における人工知能の役割

人工知能 (AI) が人材情報プラットフォームを変革することで採用業界に革命をもたらしていることは否...

世界の主要なテクノロジー企業は新型コロナウイルスとどう戦っているのか?

[[319653]]新型コロナウイルスは、ウイルス自体の急速な拡散という点だけでなく、ますます多く...

...