機械学習インフラストラクチャを Python ではなく Go で記述する理由は何ですか?

機械学習インフラストラクチャを Python ではなく Go で記述する理由は何ですか?

[[314943]]

Python が機械学習プロジェクトで人気のある言語であることは間違いありません。

R、C++、Julia などの言語にはそれぞれ独自のニッチとユースケースがあり、それによって長く使われていますが、Python は依然として最も広く使用されている言語であり、すべての主要な機械学習フレームワークで使用されています。

しかし、想像できますか? Cortex (機械学習モデルを API として展開するためのオープンソース プラットフォームの 1 つ) のコード ベースでは、コードの 87.5% が GO で書かれています。

画像ソース: Cortex GitHub

Python が誇る機械学習アルゴリズムは、実稼働の機械学習システムのコンポーネントの 1 つにすぎません。実際に大規模な本番環境で機械学習 API を実行するには、インフラストラクチャに次の要件が必要です。

  • トラフィックの変動が API に支障をきたさないように自動スケーリングします
  • API同期の展開を処理するためのAPI管理を実装する
  • ローリングアップデートにより、モデルの更新によってユーザーサービスが中断されることがなくなります。

Cortex は、上記のインフラストラクチャのすべてに加えて、ログ記録やコストの最適化などのその他の懸念事項も自動化することを目指しています。

Go は、次の理由から、上記の要件を満たすソフトウェアを構築するのに理想的な選択肢です。

1. Goエコシステムはインフラプロジェクトに適している

[[314944]]

出典: zcool

オープンソースの利点の 1 つは、尊敬するプロジェクトから継続的に学習できることです。たとえば、Cortex は Kubernetes (それ自体が Go で記述されています) エコシステム内に存在します。幸運なことに、このエコシステムには、次のような参照できる優れたオープンソース プロジェクトが数多くあります。

  • kubectl: Kubernetes CLI
  • minikube: Kubernetesをローカルで実行するためのツール
  • helm: Kubernetes パッケージ管理ツール
  • kops: 本番環境のKubernetesを管理するためのツール
  • eksctl: Amazon EKS の公式 CLI

上記のツールはすべて Kubernetes プロジェクトだけではなく、Go で書かれています。 CockroachDB や Hashicorp のインフラストラクチャ プロジェクト (Vault、Nomad、Terraform、Consul、Packer など) を見ると、すべて Go で書かれていることがわかります。

インフラストラクチャ分野での Go の人気によるもう 1 つの影響は、インフラストラクチャに関心のあるエンジニアのほとんどが Go 言語に精通していることです。したがって、GO を通じてこれらのエンジニアを引き付けるのは簡単です。実際、Cortex Labs の優秀なエンジニアの 1 人が、AngelList で Go 関連の求人を検索して私たちを見つけました。彼が私たちを見つけてくれたことはとても幸運だと思っています。

2. 機械学習のインフラストラクチャでは同時実行性が重要

ユーザーは、さまざまなモデルをさまざまな API として展開し、すべてのモデルを同じ Cortex クラスターで管理できます。 Cortex Operator は、これらのさまざまなデプロイメントを管理するためにいくつかの API も使用する必要があります。例:

  • Cortex は Kubernetes API を呼び出して、クラスターにモデルをデプロイします。
  • Cortex は、さまざまな AWS API (EC2 Auto Scaling、S3、CloudWatch など) を呼び出して、AWS 上のデプロイメントを管理します。

ユーザーはこれらの API と直接対話しません。代わりに、Cortex はこれらの API をプログラムで呼び出して、クラスターをプロビジョニングし、デプロイメントを開始し、API を監視します。

効率的かつ信頼性の高い方法で API を相互に呼び出すことは大きな課題です。 API を並行して使用するのが、最もパフォーマンスの高いアプローチですが、競合状態などを心配する必要があるため、問題も発生します。

Go はこの問題に対する簡単な解決策を提供します: Goroutines。

Goroutine は、並行してコードを実行する Go の通常の関数です。 Goroutine が舞台裏でどのように動作するかを詳しく説明するには、別の長い記事を書く必要がありますが、簡単に言うと、Goroutine は Go ランタイムによって自動的に管理される軽量スレッドです。複数の Goroutine を 1 つの OS スレッドに配置できます。Goroutine が OS スレッドをブロックすると、Go ランタイムは残りの Goroutine を新しい OS スレッドに自動的に移動します。

Goroutine は、ユーザーが Goroutine 間でメッセージを渡すことを可能にする「チャネル」と呼ばれる機能も提供し、ユーザーがリクエストをスケジュールし、競合状態を防ぐのに役立ちます。

もちろん、ユーザーは asyncio などの最新ツールを使用して Python でこれらの機能を実装することもできますが、Go はこれらの状況を念頭に置いて設計されており、GO を使用すると仕事や生活の負担を軽減できます。

3. Goでのプログラミングは楽しい

[[314945]]

出典: Pexels

Cortex の構築に Go を使用した最後の理由は、Go 言語が非常に優れているからです。

Python と比較すると、Go を使い始めるのは少し大変です。ただし、Go の包括性により、大規模なプロジェクトでも快適に使用できます。私たちは依然としてソフトウェアを厳密にテストしていますが、静的型付けとコンパイル(Go 初心者にとって大きな悩みの種)がガードレールとして機能し、(比較的)バグのないコードを書くのに役立ちます。

他の言語には特定の利点があると主張することもできますが、全体的には、Go が私たちの技術的および美的ニーズを最もよく満たしています。

4. Goを使用するとクロスプラットフォームCLIの構築が簡単になります

Cortex CLI は、ユーザーがコマンドラインから直接モデルをデプロイし、API を管理できるようにするクロスプラットフォーム ツールです。次のアニメーションは、CLI の動作を示しています。

画像ソース: Cortex GitHub

当初、CLI は Python で作成しましたが、プラットフォーム間で CLI を配布するのは非常に困難であることが判明しました。 Go はバイナリをコンパイルできるため (依存関係の管理なし)、追加のエンジニアリング作業を行わずにプラットフォーム間で CLI を配布するための便利で簡単なソリューションを提供します。

Go のコンパイルされたバイナリ コードは、インタープリタ型言語に比べて明らかにパフォーマンス上の利点があります。コンピュータのベンチマークによると、GO は Python よりもはるかに高速です。

他の多くのインフラストラクチャ CLI ツールも Go で書かれているのはおそらく偶然ではありません。

Pythonは機械学習用、Goはインフラ用

私たちはまた、特に推論の処理において Cortex で強力な存在感を発揮する Python も気に入っています。

Cortex は TensorFlow、PyTorch、scikit-learn、およびその他の Python モデルを提供します。つまり、モデルとのインターフェイス、事前推論、および事後推論の処理はすべて Python で実行されます。しかし、Python コードがパッケージ化されて Docker コンテナにデプロイされているとしても、それらのコンテナは Go で記述されたコードによってオーケストレーションされます。

出典: Pexels

機械学習エンジニアになりたい場合は、Python に精通していることが必須です。ただし、機械学習インフラストラクチャでの作業に興味がある場合は、Go を真剣に検討することで間違いなく多くのメリットが得られます。

<<:  Alipayの顔認識が「クラック」されましたが、私たちのお金はもう安全ではないのでしょうか?

>>:  AI とブロックチェーンは 2020 年にモバイル アプリ業界にどのような革命を起こすのでしょうか?

ブログ    

推薦する

顔認識訪問者システムの利点は何ですか?

[[373764]]顔認識訪問者システムの利点は何ですか?以前は、訪問者の管理に手書きの登録が使用...

生成型AIとデータが未来の産業をどう形作るか

私たちは、生成型 AI の出現によって推進される技術革命の真っ只中にいます。 これは単なる技術の漸進...

宝くじに当たるのは雷に打たれるより難しいですか?確率を向上させるためにアルゴリズムを使ってみる

宝くじで生計を立てる可能性はどれくらいありますか? 2005年、MITの学生グループが集まり、ギャン...

人工知能チュートリアル(II):人工知能の歴史とマトリックスの再考

このシリーズの最初の記事では、人工知能、機械学習、ディープラーニング、データサイエンスなどの分野間の...

2021年に注目すべき5つのAIトレンド

[[392513]] 2020年にCOVID-19が世界的に猛威を振るう中、人々は人工知能技術の助け...

大規模言語モデルの詳細な分析: トレーニングから大規模モデルの展開まで

導入データサイエンスの分野が進歩するにつれ、複雑な自然言語を処理および生成できる高度な AI システ...

MITとHKUは、Transformerを超える精度を持つ物理モデルに基づく視覚推論フレームワークを提案

[[437809]]動的視覚推論、特にオブジェクト間の物理的な関係についての推論は、コンピューター ...

機械学習を利用してデータベースの運用と保守の問題を解決します

著者についてPing An Technology のデータベース チームの運用保守開発エンジニアであ...

シンプルなデータ暗号化と復号化アルゴリズムの実装方法を教えます

この記事では、シンプルだが実用的な暗号化方式を実装する方法を紹介します。実際のプロジェクト開発におけ...

...

AIチップは誤った提案か?

[[333019]]この記事は、劉燕氏が執筆したWeChatパブリックアカウント「AI Front...

AI革命をリードする:企業がAIアプリケーションを推進するためのベストプラクティス

AI がより高度化し、普及するにつれて、多くの企業が最高 AI 責任者 (CAIO) を任命するかど...

...

NLP ビッグモデルを時系列に適用するにはどうすればよいでしょうか? 5つの方法をまとめました!

最近、カリフォルニア大学は時系列の大規模言語モデルに関する研究のレビューを発表しました。この記事では...

ついにアルゴリズムが「修正」されました!

[[427083]] 9月29日、中国サイバースペース管理局は他の8つの中央部門とともに、「インタ...