TensorFlow プロダクトマネージャー: 今後 10 年間で機械学習はソフトウェアとハードウェアをどのように変えるのでしょうか?

最近、Google Brain の従業員であり TensorFlow プロダクトマネージャーでもある Zak Stone 氏が、シリコンバレーの起業家コミュニティである South Park Commons で講演を行い、TensorFlow、XLA、Cloud TPU、TFX、TensorFlow Lite などのさまざまな新しいツールやトレンドが機械学習の未来をどのように形作っているのかについて語りました。同時に、彼はまだ公表されていないいくつかの興味深い事柄についてもほのめかした。

講演のタイトルは「Tensor Flow、Cloud TPU、ML の進歩」です。以下は、South Park Commons の公式ブログからまとめた講演全体の要約です。

プラットフォームとして、TensorFlow は大きな賭けです。高速で、柔軟性があり、本番環境で使用できるものでなければなりません。実験と実行の間の移行は、エンジニアリングの生産性を確保するのに十分な速さでなければなりません。静的画像の計算は、Python などの高水準で柔軟な言語で表現され、グラフのコンパイルにより、特定の目標に対する精度の最適化が可能になります。

オープンソースプロジェクトとして、TensorFlow は非常に成功しています。2015 年 11 月のリリース以来、Github で 20,000 件を超えるコミットを獲得しています。 TensorFlow の Github バージョンは、少なくとも週に 1 回、Google の内部イメージファイルと双方向に同期されます。同時に、TensorFlow は、Intel、Microsoft、IBM、Rstudio、Minds.ai などの企業の R&D チームから、あらゆる規模の貢献も受けています。

より多くのユーザーにリーチするために、モバイルデバイスで TensorFlow モデルを実行する効率を向上できる TensorFlow Lite が今年後半にデバイスに組み込まれる予定です。XLA などのプロジェクトはさらに野心的です。XLA はディープラーニングを使用して線形代数要素の事前コンパイルとジャストインタイムコンパイルをサポートし、任意のターゲットバックエンドシステム用の高速コードを生成します。 XLA の目標は、GPU アーキテクチャだけでなく、線形代数要素を並列化できるあらゆるアーキテクチャにおいて、階層的最適化における大きな進歩を達成することです。

Google では、CEO の Sundar Pichai 氏の「AI ファースト」企業になるという呼びかけの下、多くのプロジェクトに TensorFlow が適用されています。

機械学習ベースのソフトウェア開発の加速化の傾向は、Googleだけに起きているわけではありません。Amazon、Apple、Baidu、Facebook、Microsoft、Salesforce、Uber、Lyftなど、ほとんどすべての主流テクノロジー企業も、機械学習の産業化を推進するために専門的な研究開発チームを採用しています。これらの企業の中には、Facebook の PyTorch や Caffe2、Microsoft の CNTK、Apple の Core ML、Amazon の MXNet など、さまざまなディープラーニング開発プラットフォームがあります。

今後 10 年間のソフトウェアエンジニアリングはどのようになるでしょうか?

機械学習の台頭は、元々のクリーンな抽象化とモジュール設計が、高次元浮動小数点テンソルと効率的な行列乗算に置き換えられていることを意味します。

この傾向が続けば、ソフトウェアエンジニアリング業界は変化するでしょう。

Google のソフトウェアエンジニアである D. Sculley 氏はかつて、「機械学習: 技術的負債という高利のクレジットカード」というタイトルの記事を執筆し、機械学習システムが不適切なソフトウェア設計を誘発し、さらには不適切な設計を必要とするさまざまな可能性を列挙しました。同氏は、「これらのシステムの基本コードは通常のコードと同じ複雑さだが、システムレベルではより複雑であり、潜在的なリスクにつながる可能性がある」と述べた。(https://research.google.com/pubs/pub43146.html)

機械学習システムは、すべてのシステム入力を緊密に結合することでモデルの境界と抽象化を曖昧にします。望ましい動作の不変量は、ソフトウェアロジックからではなく、それを駆動する特定の外部データから得られます。静的分析とグラフ接続を使用してコードの信頼性を識別するツールはありますが、一般にこれらのツールにはデータの相関関係を分析する機能はありません。

D Sculley らは論文の中で、システム設計におけるいくつかの欠点について論じており、それは関連する実務家の共感を呼んでいます。

1. グルーコードシステム設計スタイル、「さまざまな目的でインストールパッケージとの間でデータを転送するために、大量のサポートコードを記述する必要がある」

2. パイプラインのジャングルは時間の経過とともに有機的に進化し、データ準備システムは「スケープ、結合、サンプリングのステップが絡み合った混乱状態になり、中間ファイル出力が発生することがよくあります」。

3. システムや生産ラインの開発に伴って蓄積される構成負債とは、「使用する機能、データのフィルタリング方法、特定の学習アルゴリズムの設定（範囲は多岐にわたる）、潜在的な前処理または後処理、検証方法など、さまざまなコンパイルオプション」の集合です。

より小規模で軽量なプロジェクトであっても、エンジニアは依然として次のような問題に悩まされています。

1. 実験で使用されるモデルアーキテクチャと重みのバージョン - 特に、モデルが別のシステムからトレーニングモデルの一部を借用する場合、または他のモデルから重みを借用する場合。

2. データソースと機能バージョン。

3. 実験環境と本番環境間の移行（ドメインシフト）

4. 運用中の推論の品質を監視します。

これらの問題に対する解決策の 1 つは、機械学習モデルを本番環境で配布および提供するために Google 社内で開発されたプラットフォームである TFX です。

機械学習モデルを確実に作成および展開するために使用できるプラットフォームを作成および管理するには、トレーニングデータに基づいてモデルを生成する学習者、データとモデルを分析および検証するためのモジュール、そして最終的にはモデルを運用環境に展開するためのインフラストラクチャなど、多くのコンポーネント間の慎重なオーケストレーションが必要です。データが時間の経過とともに変化し、モデルが継続的に更新されると、プラットフォームの管理が非常に困難になります。

残念ながら、これらの取り決めは通常、グルーコードと特定のスクリプトファイルを通じて 1 つずつ処理されるため、複製コストが高くなり、システムが脆弱になり、多くの技術的リスクが発生します。

TFX はこれらのプロセスとコンポーネントを標準化し、単一のプラットフォームに統合することで、プラットフォームのコンパイルプロセスを簡素化し、生産時間を数か月から数週間に短縮するとともに、プラットフォームの信頼性を確保し、サービスのクラッシュを削減します。

今後 10 年間でハードウェアはどのように変化するでしょうか?

ムーアの法則の減速により、私たちは「アーキテクチャの黄金時代」に再び突入し、さまざまなチップや命令セットの急速な発展を目の当たりにできるようになりました。

Intel の Nervana、Nvidia、Cerebras、Google などの企業はいずれも、機械学習で使用される線形代数演算を高速化できる次世代ハードウェアアーキテクチャに取り組んでいます。また、デフォルトでは、各アーキテクチャには、cuDNN のような独自の低レベルの手動で最適化されたプリミティブライブラリが必要です。 (cuDNN は CUDA Deep Neural Network ライブラリの略で、NVIDIA がディープニューラルネットワーク専用に設計した GPU コンピューティングアクセラレーションライブラリのセットです。)

この傾向を打破するには、同業者が XLA などのより汎用的なコンパイラフレームワークの開発にさらに力を入れる必要があります。

Google の TPU (Tensor Processing Units) は現在、GPU の優位性を打ち破る可能性が最も高いです。各 Cloud TPU は、1 秒あたり最大 180 兆回の浮動小数点演算、64 GB の超高帯域幅のストレージスペース、およびカスケード可能な機能を提供できます。これまでのスーパーコンピュータアーキテクチャとは異なり、TPU は機械学習で一般的な線形代数演算専用にゼロから設計されました。

TPUはTensorFlowと統合されており、Googleは有料のクラウドサービス（Cloud TPU）を提供しています。同時に、TensorFlow Research Cloud（TFRC）プロジェクトを通じて、TPUを事前に利用したい機械学習の専門家に補助金を支給し、1,000台のCloud TPUを提供し、彼らが研究成果を論文やオープンソースソフトウェアを通じて世界に発信することを期待しています。

まとめ

グラフコンピューティングと TensorFlow のようなディープラーニングライブラリは、コンピューティング業界の将来の発展の主な原動力であり、ハードウェアからコンパイラ、高レベルのプログラミング言語、設計仕様に至るまで、システムアーキテクチャを再検討する原動力となります。

したがって、ソフトウェアアーキテクト、エンジニア、研究者、その他の実務者にとっては大変な作業となりますが、同時にそのプロセスは非常に刺激的なものでもあります。ザック氏はスピーチの中で次のように要約した。

これらの素晴らしいアプリケーションのほとんどは、私が大学院生だったときには実現できませんでした。人々が機械学習の技術に慣れ、今では予測できないようなことをし始めたらどうなるでしょうか。最初の TensorFlow ネイティブ製品はどのようなものになるでしょうか。」

<<: Python での機械学習 K-means アルゴリズムの実装

>>: こんにちは。タクシーに乗って空へ行きたいです。右へ飛んでください。

TensorFlow プロダクトマネージャー: 今後 10 年間で機械学習はソフトウェアとハードウェアをどのように変えるのでしょうか?

市場動向 | 人工知能が光接続の需要を急増させる

「ロボット革命」は人類社会の発展にどのような影響を与えるのでしょうか？

ChatGPTの最強の対戦相手が実際のテストでWen Xin Yi Yanに敗れました！

Google が ML ベースのハンドトラッキングアルゴリズムをオープンソース化: 携帯電話でのリアルタイム検出、複数のジェスチャーの同時キャプチャ

伝染病警報！人工知能は何をするのでしょうか?

人工知能が「人工知能」にならないようにするための鍵は、まだ人間の脳にあるかもしれない

中国でドローン配送用の商用「操縦免許」が発行されるまでにどれくらいの時間がかかるのでしょうか？

450、バックトラッキングアルゴリズムとは何ですか? 一度見れば理解できますが、実際に書いてみると失敗します。

ディープラーニングがなぜディープラーニングと呼ばれるのかご存知ですか？

推薦する

このロボットはバッテリーなしで「自走」でき、バッテリー寿命は無制限です | ワシントン大学

SAIC Maxus、クローズドループエコシステム構築に向けた「RVスマートモビリティビジョン」を発表

130億バイトのモデルを訓練するのにたった3日しかかからなかった。北京大学は画像と動画の理解を統合するChat-UniViを提案した。

中国でApp Storeのランキング操作を禁止しアルゴリズムを調整

人工知能の成長がデータセンターの再設計を促している

映画での演技から運転まで、人工知能の実装の5つの主要な方向性は次のとおりです。

今後 30 年間、人工知能の時代において、どの職業が消滅し、あるいは存続するのでしょうか?

DNAロボットの進化！わずか数分で複雑なナノ構造のデバイスが作成され、体内に入り、タスクを実行します。

自動運転までどれくらい遠いのでしょうか?

2018年に人工知能はどのように発展するでしょうか?世界中のトップ20人の専門家がこう言う

6つの主要なディープラーニングフレームワークの詳細な説明

人工知能と教育や指導が出会うと、どんな火花が散るでしょうか?