Pythonを全く知らなかった私がAIエンジニアになるまでに2年かかりました

Pythonを全く知らなかった私がAIエンジニアになるまでに2年かかりました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習の分野で働きたいけれど、専門的なスキルがないと感じていますか?

Python をまったく知らなかった人が、AI エンジニアリングの仕事を見つけるまで 2 年かかりました。彼の記事はオンラインで5,000件以上の「いいね!」を獲得した。

一部のネットユーザーは彼のストーリーに情熱好奇心を感じた。

この道を歩くのは簡単ではありません。全然簡単ではありません。途中で得られる小さな勝利を楽しみ、遭遇する多くの挫折から学びましょう。ではごきげんよう!

彼の経験はあなたに何らかのインスピレーションを与えるかもしれません。

Pythonは分からないけど、「機械学習」に興味がある

デビッド・チョンさんはシンガポール経営大学で経済学と金融学を専攻し、卒業後は当初銀行で働く予定でした。

[[313537]]

彼は卒業の9か月前に日本の野村證券に就職した。この間、いくつかのデータ分析ソフトウェアに触れ、Excel VBAプログラミング、データ可視化ソフトウェアTableauとPower BI、ロボティックプロセスオートメーションソフトウェアUiPathを学びました。

「機械学習」の世界に彼は深く魅了され、その中でも最も興味をそそられたのは、データを入力して結果を予測するというプロセスでした。

彼は銀行商品の複雑さに魅了され、しばらく働いた後、それが顧客から利益を得るための単なる手段であると感じたことが判明しました。

つまり、古いものに対する彼の興味は薄れ、新しい興味が生まれたのです。彼は仕事の方向性を変えることにした。

しかし現実には、彼はプログラミングの仕方を全く知らないのです。

当時の辞書では、Python は蛇、Pig... は豚と書かれていました。

私はMOOCで必死に勉強しましたが、本から学んだことはまだ表面的なものでした

データサイエンスを学びたいと思っていた彼は、オンラインリソースが豊富にあるため、Mooc で多くのコースに登録しました。

  1. Python ブートキャンプ: Python 3 でゼロからヒーローになる [Udemy]
  2. データサイエンスと機械学習のための Python ブートキャンプ [Udemy]
  3. MySQL によるビッグデータの管理 [ Coursera ]
  4. 初心者向け Java チュートリアル [Udemy]
  5. Web 開発者ブートキャンプ [Udemy]
  6. 機械学習 A-Z: Python と R による実践的なデータサイエンス [Udemy]
  7. Docker を使用した機械学習と NLP モデル [Udemy]

しかし、彼は最初の3つのコースしか修了しませんでした。 Mooc コースの内容は非常に簡潔だったため、彼はすぐにコースへの興味を失い、コースを終える前に次のコースに移ってしまいました。

従来の機械学習手法が MOOC で教えられる場合、モデルが実際に何をしているかが省略されることがよくあります。たとえば、ランダム フォレストが決定木の集合体であることは教えられますが、決定木がどのブランチでどの特徴を選択するかを決定する方法 (つまり、エントロピーの概念とそれに関連する数学) は教えられません。また、サポート ベクター マシンが分類方法であることは簡単に紹介されますが、超平面を決定する方法は教えられません。

ディープラーニングコースでは、AI プロフェッショナルスキルの習得のニーズを満たすことができません。

関連するコースでは通常、Tensorflow や MNIST などの優れたデータセットに関する多くのコードが提供され、受講者はディープラーニングの専門家になったような気分になります。

しかし、これではまだ十分ではありません。研究論文には、ディープ ニューラル ネットワーク モデルでの特徴抽出の理解や、トランスフォーマーや双方向エンコーディングなどのより複雑な機能を含む複雑なアーキテクチャが含まれることがよくあります。一部の最先端モデルが他のモデルよりも優れている理由や、転移学習メタ学習などの概念を理解することも重要です。

この男性は、Mooc コースの利点はすぐに始められることだと考えています。上記の教訓も誤解を招きます。機械学習は .fit() と .predict() に関する数行のコードに過ぎないと考えれば、誰でも機械学習の実践者になれます。

練習と挫折

それで、オンラインコースを受講した後。プログラミング スキルを向上させるために、David は Hackerrank で SQL と Python に関する質問に回答して練習することにしました。

同時に、バドミントンコートのオンライン自動予約を実現するプロジェクトもPythonを使って進めました。シンガポールのバドミントンコートは事前に予約する必要があり、2週間前には満席になることがよくあります。

勉強と練習の期間を経て、デイビッドは自分のスキルレベルを大まかに把握しました。

Python を書くことには自信がありますが、コードの効率性については全くわかりません。

機械学習では、私は Jupyter ノートブックの専門家です。Jupyter ノートブックのテーマを「ダーク モード」に変更し、すべてのキーボード ショートカットを使用できます。

彼はデータサイエンティストになりたいと思っています。

しかし、コードに関する技術テストのほうが、彼が勉強していた「データサイエンス」よりも速かったため、面接に不合格となった。彼は当初、テクニカルアナリストの職に応募しましたが、ビジネスアナリストとして別の部門に異動されました。

これはまだ彼の目標からは程遠い。

専門的な学術トレーニングを受ける

彼は、さらにスキルを高めるために、学校でビジネスIT(AIを専門とする)の修士号取得に向けて勉強を続けることにしました。

専門教育を受けるプロセスにより、以前の知識の枠組みの欠陥が大幅に補われました。

彼は、従来の ML モデルの背後にある数学、カスタム データセットへの最新のディープラーニング アーキテクチャの適用、一般的な検索アルゴリズム、Q 学習、ディープ Q 学習などの AI の重要な概念、グラフ アルゴリズム、時間と空間の複雑さ、名前の一致アルゴリズムなどのアルゴリズム設計などを学びました。

彼はまた、いくつかの学校の修士課程にも参加しました。これらのプロジェクトは不完全で、データセットは多くの場合 Kaggle から取得され、最終的には Jupyter ノートブックに保存されます。ディープラーニング モデルは Docker 上で実行されますが、デプロイメントは考慮されていません。

デイビッド氏の意見では、修士課程の教育は AI 実践者に求められる厳格な学術的トレーニングを提供しますが、実践的な応用トレーニングが不足しています。修士課程では、データサイエンスの分野で仕事を得るために何が必要かは教えてくれません。この部分は自分で理解する必要があります。

ソフトウェア エンジニアリングと DevOps のスキルが求められることがよくあります (ただし、広く求められているわけではありません)。大規模な組織では、コードのコラボレーションも重要です。たとえば、Docker 環境の設定方法、AWS EC2 インスタンスの起動方法、Azure BLOB ストレージでのデータセットのホスト方法、コードの効果的な整理方法、バージョン管理に GitHub または GitLab を使用する方法などです。これらは授業では教えられません。

インタビューで蓄積する

デイビッドさんは面接を続け、技術面接と非技術面接の両方で多くの経験を積み(ほとんどの人は不合格でした)、自分に何が足りないのかを認識し、時間をかけてそれを補いました。

面接で得られたより重要な経験は、市場の状況を詳細に理解することができたことだ。

彼は、企業が同じ職務をどのように異なって説明しているか、そしてそれが AI 技術の導入における企業の成熟度とどのように相関しているかを学びました。

ついに、AI分野で働くことを決意してから2年後、彼はAIエンジニアとして訓練を受けられる良い機会を見つけました。

彼は現在、野村證券のオペレーショナルリスク部門のデータアナリストとして働いている。彼はQuantum位に宛てた電子メールで、来月新しい役職に異動することを伝えた。

彼は、これはまだ始まりに過ぎず、自分のキャリアパスは短距離走ではなくマラソンのようなものだと感じている。

もう一つ

デイビッドのキャリアパスを見て、何かインスピレーションを受けましたか?

デイビッド氏は、より多くの人々に刺激を与えるために自分の経験を共有したのであり、自分の経験が指針として見られるべきではないと述べた。

これは私の個人的な逸話ですが、人生は意味のない人生を送るには短すぎるので、人々が信念を持ち、やりたいことをやろうとするきっかけになればと思います。

人生の大部分を仕事に費やすことになるので、好きなことをしてください。

迷ったときは、エルサの言葉を思い出してください。「次に正しいことをしなさい」

[[313538]]

<<:  強化学習は2020年にブレークスルーを達成するでしょうか?

>>:  Alibaba が MNNKit をオープンソース化: Android と iOS をサポートする MNN ベースのモバイル ディープラーニング SDK

ブログ    
ブログ    
ブログ    

推薦する

アリインデックスシステムの設計と実践

今回の講演者は、アントグループの王高航氏です。講演のテーマは、アントインデックスシステムの設計と実践...

Alibaba Antの機械学習アルゴリズム - 第一、第二、第三の面接体験、役立つ情報を素早く収集!

アリ側1. 自己紹介:私はXXXの修士課程の学生で、機械学習を専攻しています。私の研究分野はディープ...

よく使われる4つの推奨アルゴリズムの一覧

[[416976]]この記事はWeChatの公開アカウント「Big Data DT」から転載したもの...

ガートナー: 高等教育における人工知能

人工知能 (AI) は高等教育に大きな進歩を遂げており、何らかの形で AI を導入した教育機関は、学...

...

疫病との戦いに人工知能とビッグデータが爆発的に役立つでしょうか?

[[315014]]新型コロナウイルス感染症の発生と蔓延は、全国の人々の心を動かしました。社会のあ...

Ant Group は、動画の著作権侵害検出用に 16 万本の動画ペアと 28 万本のクリップペアからなる大規模なデータセットを公開しました。

従来の著作権保護業界は、時間がかかり、労働集約的で、コストがかかります。膨大な量のコンテンツを完全に...

データセキュリティを保護しながらAIタスクを加速

MIT の研究者は、ディープ ニューラル ネットワーク アクセラレータの最適な設計を効率的に特定し、...

...

ディープラーニングの概要: パーセプトロンからディープネットワークまで

近年、人工知能の分野は再び活発化しており、伝統的な学術界に加え、Google、Microsoft、F...

...

...

自分のIQに挑戦してみませんか? 10 種類の機械学習アルゴリズムを理解してデータ サイエンティストになろう

データ サイエンティストになりたいですか? 十分な知識と新しいことに対する好奇心が必要です。このため...

機械学習の問題を解決する一般的な方法があります!これを読んでください

平均的なデータ サイエンティストは毎日大量のデータを処理します。データのクリーニング、処理、機械学習...

2020年から2024年までの中国のインテリジェント交通産業の予測分析

[[374436]] 1.1 中国の数千万規模のインテリジェント交通プロジェクトの競争環境中国投資産...