Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

今後、Kaggle のコンペティションに参加する際には、AutoML を直接送信して、参加する AI モンスターを自動的にトレーニングできるようになります。 Google は本日、Cloud AutoML サービスを Kaggle プラットフォームに深く統合すると発表しました。有料サービスではありますが、無料トライアルと補助金プランのパッケージを提供しています。

Google は、機械学習アルゴリズムのトレーニング用 Cloud AutoML サービスを自社のデータサイエンス プラットフォーム Kaggle に統合すると発表した。

Cloud AutoML は、AI モデルをトレーニングするためのドラッグ アンド ドロップ インターフェースを提供するクラウドベースのツールキットです。 AutoML を使用すると、誰でも最小限の労力と機械学習の専門知識でカスタム機械学習モデルを作成できます。

[[281434]]

Kaggle は、データ サイエンティストやその他の機械学習愛好家が研究、分析、作業の共有を行うオンライン コミュニティです。2017 年に Google に買収されました。 Kaggle は、世界最大の機械学習およびデータサイエンスの競争プラットフォームでもあります。ちょうど本日、Google は、Kaggle コミュニティがユーザー数が 350 万人を超え、新たなマイルストーンに到達したことを発表しました。

Google は、Cloud AutoML を Kaggle と統合することで、「データ サイエンティストのコミュニティに、この分野をリードするために必要なスキルとツールを提供することで力を与える」という使命を推進していると述べている。

Cloud AutoML を使用すると、ユーザーはソフトウェア開発キットまたは Web ベースのユーザー インターフェースからデータを取得し、いくつかのパラメータを設定して、そのデータに基づいてモデルをトレーニングできます。トレーニングされたモデルは、Google のクラウド インフラストラクチャに直接デプロイできます。

この新しい統合により、Kaggle ユーザーは、データ サイエンティストがライブ コード、数式、視覚化、説明テキストを含むデータを作成および共有するために使用するオープン ソースの Web アプリケーションである Jupyter Notebooks で Cloud AutoML SDK を直接使用できるようになります。

「本日のリリースの焦点は、コミュニティが SDK を Kaggle Notebooks で直接使用できるようにすることです」と Kaggle プロダクト マネージャーの Devret Rishi 氏は述べています。

Cloud AutoML は有料サービスですが、初心者向けに無料トライアルも提供しています。 Google はまた、Kaggle での AutoML の使用コストを補助するために、年間を通じてユーザーに Google Cloud Platform (GCP) クレジットを提供しており、GCP にサインアップするすべての新しい Google アカウントには 300 ドルの補助金が支給されます。

今年 6 月、Google は BigQuery データ ウェアハウス サービスも Kaggle と統合しました。この統合により、BigQuery ユーザーは高速 SQL クエリを使用し、SQL で機械学習モデルをトレーニングし、Kaggle カーネルと呼ばれる Kaggle の Jupyter ノートブック環境で分析できるようになります。

Google によると、このアプローチの利点は、ユーザーがクエリを実行したり機械学習を実行したりするために、実際にデータを移動したりダウンロードしたりする必要がないことです。 Google Cloud アカウントをカーネル ノートブックまたはスクリプトにリンクすると、BigQuery API クライアント ライブラリを使用してノートブック内で直接クエリを作成し、BigQuery に対して実行して、データを使用してほぼすべての種類の分析を実行できるようになります。

AutoML の威力はどれほどか: Kaggle のコンテストで人間のプログラマーの 99% に勝利

AutoML が初めて注目を集めたのは、今年初め、Cloud Next ’19 の Kaggle Days で開催された機械学習のコンテストでトップ候補として浮上したものの、最後の最後でデータ サイエンティストのグループによって僅差で敗退した時でした。

今年 4 月、8.5 時間に及ぶ Kaggle Days データ処理チャレンジに非常に特別なチームが参加しました。この 3 人の Google 研究者グループは、自分たちだけで競争するつもりはなく、AutoML と呼ばれる AI ソフトウェアを使用して競争に参加しました。

残りの200人以上の参加者は、Kaggleプラットフォームのトップ層から集まり、「匿名の自動車部品メーカーからデータを入手し、それを使って工場の生産量における不良品バッチを予測する」という課題で複数のチームを結成した。

[[281435]]

Googleの研究者であるQuoc Leは同僚のMing ChenとYifeng LuとともにAutoMLプロジェクトを主導した。

会場には大会のリアルタイムランキングが映し出される大型スクリーンが掲げられており、参加プログラマーたちはこの大型スクリーンの影の下で懸命に作業に取り組んでいた。プログラマーは、テスト用のコードをウェブサイトに送信することでコンテストでの成功を測定し、スコアはリアルタイムで画面に表示されます。

Kaggle.com でトップランクの「第一人者」であるウラジミール・イグロビコフ氏は、AI がトップクラスのプログラマーに取って代わることができるかどうかについては懐疑的であり、会議に出席したほとんどの人々は、AI ソフトウェアが世界トップクラスのデータ サイエンティストの創造性に匹敵することは不可能であることに同意した。

しかし、コンテスト開始から数時間後、衝撃的な結果が明らかになりました。AutoML が初めて自動生成コードを提出し、ほとんどのグループを上回り、リーダーボードで 2 位にランクされたのです。しかし、これは Google チームにとってまったく驚くべきことではありません。彼らは 3 年前に多額の費用をかけてこのソフトウェアを開発しましたが、その本来の目的は彼ら自身の作業の一部を置き換えることでした。

Google で AutoML の開発を主導した AI 研究者の Quoc Le 氏は興奮しています。彼と彼のチームは、これまで何度か Kaggle コンテストで AutoML をテストしてきましたが、通常、数時間ではなく数か月かかります。 AutoML がライブ コンテストで上位 10% に入ることができれば成功だと考えています。

午後3時30分までに、最も近い人間チームがはるかに遅れをとっていたため、AutoMLの勝利は確実になったように見えました。午後 5 時 30 分に参加者が集まり、最終スコアを確認すると歓声が上がりました。AutoML が 2 位になったのです。

AutoML はトップクラスの人間のプログラマーの 99% に勝ちます。

さらに、コンテストでは、AutoML を使用したチームは、ドメインの専門知識や監督を必要とせずに、最小限の労力で優れたパフォーマンスを迅速に達成することができました。データの準備に費やす時間は非常に少なく、特徴エンジニアリング、モデルの選択、ハイパーパラメータの調整に費やす時間はほとんどありません。

さらに、別の IEEE コンテストでは、AutoML の時間効率の優位性がさらに顕著になり、数千のチームがリーダーボードで AutoML のベースライン レベルを大幅に上回るまでに数週間かかりました。

上の図は、コンテスト開始時に公開された AutoML Tables ベンチマーク スコア (緑の線) と比較した、コンテスト開始から最初の 4 週間の提出スコア (個々のスコア) を示しています。青い点線は、毎日の提出スコアの 90 パーセンタイル レベルを示しています。 AutoML Tables ベンチマークは、コンテストの最初の 2 週間の両方でこのレベルを超えました。

AutoML のシンプルさと有効性により、データ サイエンスの問題を抱える人 (必ずしもデータ サイエンスの深い知識を持っているわけではない人) でも強力なモデルを作成できるようになります。

大きな報酬: AutoML を使用する Kaggle ユーザーは、関連するアカウントごとに 300 ドルの補助金を受け取ります。

Cloud AutoML は、ユーザーがさまざまなタスク セット (ビジョン、言語から構造化データまで) 向けにカスタム機械学習モデルを構築するのに役立ちます。実際の使用方法はアプリケーションごとに異なりますが、すべての方法は、SDK または Web UI からデータを抽出し、ユーザーが設定を調整できるようにし、トレーニング済みのモデルを出力するという一般的なパターンに従います。今日のハイライトは、私たちのコミュニティが Kaggle Notebooks で SDK を直接使用できるようになったことです。

はじめに: Kaggle で AutoML を使用する方法

Kaggle と AutoML の統合は、BigQuery を Kaggle Notebooks に導入するという前回の取り組みに続くものです。

開始するには、GCP アカウントをリンクし、使用するクラウド サービスへのアクセスを承認するだけです。クラウド ストレージを有効にすると、AutoML がデータに簡単にアクセスできるようになります。

Google アカウントをリンクした後、クラウド アカウントの準備ができていることを再確認する必要があります。これを行うには、GCP プロジェクトで Machine Learning API と課金設定が有効になっていることを確認します。 AutoML は有料サービスです。より多くの Kaggler が AutoML を利用できるように、サービス利用コストを補助する GCP クレジットを年間を通じて提供することを計画しています。GCP に登録されたすべての新規アカウントには 300 ドルのクレジットが付与されます。

ユーザーは、Kaggle Notebook に組み込まれているクライアント SDK を使用するか、クラウド コンソールの Web インターフェースを使用して、AutoML を簡単に実行できます。 Notebook で AutoML を使用するには、ヘルプ ドキュメントまたはチュートリアルをご覧ください。自動化された機械学習のトピックと、それがデータ サイエンスのワークフローをどのように改善できるかについて詳しくは、説明ビデオをご覧ください。

現在、AutoML は Kaggle のコンペティション プラットフォームに深く統合されています。今後の Kaggle のコンペティションでは、ますます多くのプログラマーが AutoML を参加に送ってくると信じています。

<<:  ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

>>:  人工知能は企業で実用化されつつある

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

勾配降下法から準ニュートン法まで: ニューラル ネットワークをトレーニングするための 5 つの学習アルゴリズム

ニューラル ネットワークでは、システムの学習プロセスは一般にトレーニング アルゴリズムによって支配さ...

新たな美容問題:彼女がAIではないことをどうやって証明するか

私の家族の皆さん、人間として生きることが昨今こんなにも困難になっているとは誰が想像したでしょうか?最...

...

世界中の経営幹部の93%がAIに期待を抱いているが、65%はまだその恩恵を受けていないと答えている。

[[280194]]最近の調査、研究、予測、および AI アプリケーションの進捗状況と状況に関する...

二重あごをなくすコツがある。浙江大学の2000年代生まれの大学生が、ACM SIGGRAPHで発表した新しい美容アルゴリズムを開発

ソーシャルネットワーク、ライブ放送、ショートビデオの普及に伴い、他人により良い印象を与えるために、顔...

...

4090はA100の代替品になるのでしょうか?トークン生成速度はA100よりわずか18%低い。上海交通大学の推論エンジンが人気。

それだけでなく、PowerInfer は、モデルの精度を維持しながら、単一の RTX 4090 (2...

...

私が純粋アルゴリズムの面接の質問に反対する理由

アルゴリズム面接はマイクロソフトが開発した面接方法かもしれません。現在多くの企業が追随しており、私た...

Dianping.com における検索関連性技術の探求と実践

著者: Xiaoya、Shen Yuan、Judy など1. 背景レビュー検索は、Dianping ...

AI開発は断片化に直面しており、ディープラーニングフレームワークの統一が必要

人工知能の急速な発展の背後には、大手メーカー間の秘密戦争の始まりがあります。誰もが開発者をめぐって競...

...

素手でネジを動かす、ボストンダイナミクスのアトラスが再び進化:兄弟たち、工場に入る準備をしよう

現在注目を集めているヒューマノイドロボット分野において、ボストン・ダイナミクスは早期参入企業の1つで...

大きなモデルもスライスできます。Microsoft SliceGPTはLLAMA-2の計算効率を大幅に向上させます。

大規模言語モデル (LLM) には通常、数十億のパラメータがあり、数兆のトークンのデータを使用してト...