機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習エンジニアになるには、通常、博士号が必要です。

たとえそれがその立場の必要条件として書かれていなくても、それは次第に自然法則となっていきます。

では、独学の人は、面接官に自分も同じ能力を持っていると納得してもらうために、どのようなプロジェクト経験について書けばよいのでしょうか?

AddedWayという名のネットユーザーがRedditでこの心を揺さぶる質問を提起したところ、大きな議論が巻き起こり、2日間で500回以上閲覧されました。

ディスカッション掲示板では多くの人が適切な提案をしてくれました。

業界に必要なスキル

po-handzというネットユーザーがいるが、彼の意見は80ポイントの賛同を得て、コメント欄のトップを占めた。

プロジェクトを本番環境に導入することで、新卒者や現在の ML エンジニアの99%を上回ることができます。

この点に関して、ある人(モラヴァク)が強い同意を表明した。

この「大多数」は実際には 99.9% 以上を意味します。

ディンロウ氏は、たとえ多くの人が博士号を取得しても、自力でプロジェクトを製品化まで導く経験がないかもしれないと付け加えた。

では、そのような経験をするということはどういう意味でしょうか?

ネットユーザー(BernieFeynman)はそれを簡単に説明しました:

いくつかのモデルを構築します。超素晴らしいものである必要はありません。しかし、モデルがどこで実行されているかをユーザーが確認できるようにする必要があります。たとえば、呼び出すことができる API が存在する必要があります。

もちろん、これは簡単なことではありません。最上階では、プロセス全体がいかに難しいかが詳しく説明されています。

たとえば、通常はモデルが 1 つだけではなく、複数のモデルが存在します。したがって、これらの大きなモデルはサーバーの RAM にロードする必要があります。新しい入力データも受け入れます。これらのデータはテスト データと同じ形式で、スケーリングも行う必要があります。どのようにスケーリングすればよいでしょうか?推論には GPU が必要ですか?その場合、AWS では月額 1,000 ドルかかる可能性があります。予算で対応できますか?時系列データはどうでしょうか?継続的に更新されるモデルとパラメータを追跡する必要があります。さらに、リアルタイムで保守可能なデータ パイプラインも必要です。これは、クリーンなデータセットを扱うよりもはるかに困難です。最後に、ユーザーフレンドリーにするには、完全な UI、Web サイト、nginx スタックが必要です。

新しく博士号を取得したばかりの人はもちろん、経験豊富なデータ サイエンティストの多くは、自分の専門分野でのみ仕事をし、他の人からクリーンなデータ セットを渡されるため、これらのことについて何も知りません。

この点において彼らに勝てば、会社にとってより高い価値が生まれます。

履歴書を台無しにしないでください

実践的なスキルを訓練することは、一つの側面にすぎません。

履歴書の選考プロセスで失敗したくない場合は、ネットユーザー(rudiXOR)が「MLエンジニアを募集している中規模企業」の10大危険地帯をまとめたので、参考にしてください。

まず、MOOC 認定資格をいくつか取得します。役に立たない。試してみた。誰でもクイズをクリックできる。 2 つ目は、Kaggle での成果を誇りすぎることです。多くの大学生が Kaggle コンテストに参加しており、このコンテストが ML エンジニアの仕事とほとんど共通点がないことも知っています。 3 つ目は、3 か月のトレーニングを経て、PCA から LSTM まで、ほぼすべての ML テクニックを習得したことです。誰もそれを本当に信じませんでした。 4 番目に、GitHub プロジェクトは、コードが 1 回だけ送信されたプロジェクトです。それが自分でやったことかどうかは全く分かりません。 5 番目に、GitHub ホームページは新しく、プロジェクトがありません。 6 番目に、このモデルは、より本格的なプロジェクトではなく、おもちゃのデータセットでのみテストされています。 7番目に、どの言語でも「習得」という言葉があります。たとえば、C++、Python、Java、C# などです。8 番目は、履歴書を求人要件と慎重に照合することです (「HR アルゴリズムのバズワード最適化」)。 9番目に、数学/統計に関する知識を証明していません。 10番目は、ソフトウェア開発の経験がないことです。

最初の 9 つのポイントを忘れてしまったとしても、10 番目のポイントを真剣に参照することができます。地雷原を列挙した後、ネットユーザーらは次のように強調した。

独学の場合は、すぐにデータ サイエンティストや ML エンジニアに応募しないでください。まずはデータアナリストやソフトウェアエンジニアに応募してみましょう。 ML を独学で学び、ソフトウェア開発の経験がない場合は、採用しません。

前回の記事を参考にすると、博士号を取得していない場合は、博士号よりも業界での経験が豊富であることが有利になります。

もう一つ

しかし、独学で学ぶのに遅すぎるということはありません。

たとえば、Google Brain の研究者である David Ha 氏は、機械学習を採用する前はすでにゴールドマン・サックスのマネージング・ディレクター (MD) を務めていました。

[[271179]]

それでは皆様頑張って下さい。

Reddit フォーラムにはさらに多くの提案があります:

https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/

<<:  ディープニューラルネットワークはディープフェイクを検出できる

>>:  ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ブログ    
ブログ    

推薦する

14,000元相当のコースノートはオープンソースで、fast.aiの創設者が新しい本のソースコードを公開

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google の 15 のオープンソース無料人工知能プロジェクト!開発者: 了解しました

開発者は人工知能に関するオープンソース プロジェクトを数多く目にしてきたと思いますし、Github ...

...

疫病流行中に物流の円滑化に全力を尽くし、無人配送市場が活況を呈している

最近、国務院は貨物物流の円滑な流れを確保するために関連業務を展開するよう通知し、各地域と関連部門に主...

AIoT は私たちの未来をどのように定義するのでしょうか?

[[417111]] AI と IoT ほどエキサイティングで重要なテクノロジーの組み合わせはほと...

...

Meta はヘッドマウントディスプレイを使用して全身のモーショントラッキングを実現します。脚の情報なしで正確な姿勢推定

ヘッドセットにより、Meta は新たな命を吹き込まれます! SIGGRAPH 2023 カンファレン...

年次レビュー: 2017 年の「愚かな」 AI 製品 8 つ

2017年は「人工知能実装元年」と言われています。 AIは人々の生活の隅々にまで浸透しており、AIハ...

...

...

...

物流自動化への人工知能導入の大きな影響

自動化はテクノロジーを利用して、人間がより多くのタスクを完了できるようにします。物流の自動化をあらゆ...

人工知能の市場推進要因、制約、機会

今日、ますます多くの企業が、事業運営に人工知能技術を活用しています。このテクノロジーは非常に建設的で...

AIの大覚醒:チューリング賞受賞者のベンジオ氏は、AIは意識を持ち、将来の機械学習の核となるのは注意メカニズムであると語る

人工知能は意識を発達させることができるか?これはアメリカのテレビシリーズ「ウエストワールド」で取り上...