Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

5月6日、アント・ファイナンシャルの副CTOである胡曦氏はオープンソースの機械学習ツールSQLFlowを正式に発表し、「今後3年間で、AI機能はすべての技術者の基本的な機能となるでしょう。SQLFlowをオープンソース化することで人工知能アプリケーションの技術的ハードルを下げ、技術者がSQLと同じくらい簡単にAIを呼び出せるようにしたいと考えています。」と述べた。

現在、SQLFlow は GitHub で 1,636 個のスターと 236 個のフォークを獲得しています。 (GitHub アドレス: https://github.com/sql-machine-learning/sqlflow)

SQLFlow の目標は、SQL エンジンと AI エンジンを接続し、ユーザーがわずか数行の SQL コードでアプリケーションまたは製品全体の背後にあるデータ フローと AI 構造を記述できるようにすることです。関連する SQL エンジンには、MySQL、Oracle、Hive、SparkSQL、Flink など、SQL またはその派生語を使用してデータを記述したり、データに対する操作を記述したりすることをサポートするシステムが含まれます。ここで言う AI エンジンには、TensorFlow や PyTorch などのディープラーニング システムのほか、XGBoost、LibLinear、LibSVM などの従来の機械学習システムも含まれます。

SQLから機械学習へ

SQLFlow は、拡張構文を持つ SQL プログラムを、submitter と呼ばれるプログラムに変換して実行するトランスレータとして考えることができます。 SQLFlow は、さまざまな SQL エンジンを同じエンジンに抽象化する抽象化レイヤーを提供します。 SQLFlow は、さまざまな変換メカニズムをプラグインして、さまざまな AI エンジンに基づく送信プログラムを取得できる拡張可能なメカニズムも提供します。

SQLFlow が SQL 構文を拡張する目的は単純です。SELECT ステートメントの後に拡張構文を持つ TRAIN 句を追加することで、AI モデルのトレーニングを実装できます。あるいは、PREDICT 句を追加して、既存のモデルを使用して予測を行うこともできます。この設計により、データ アナリストの学習パスが大幅に簡素化されます。

さらに、SQLFlow は、データの特性に基づいてデータを自動的に機能に変換する方法を推測するために、さまざまな送信者翻訳プラグインで使用できるいくつかの基本関数も提供します。この方法では、ユーザーは TRAIN 句で変換を記述する必要がありません。

上記の設計意図は、SQLFlow のオープン ソース コードに反映されています。もちろん、SQLFlow の開発期間はまだ比較的短く、十分に詳細化されていない領域がまだたくさんあります。 Ant Financial のオープンソースのもう 1 つの目的は、さまざまな SQL エンジン チームや AI チームと連携して、データと AI の架け橋を構築することです。

以下は、サンプル データ Iris.train を使用して Tensorflow DNNClassifer モデルをトレーニングし、トレーニング済みのモデルを使用して予測を実行する例です。 SQL を使用してエレガントな ML コードを記述すると、いかにクールであるかがわかります。

  1. sqlflow> SELECT *
  2. iris.trainより
  3. DNN分類器のトレーニング
  4. n_classes = 3、hidden_​​units = [10, 20]の場合
  5. がく片の長さ、がく片の幅、花弁の長さ、花弁の幅
  6. LABELクラス
  7. sqlflow_models.my_dnn_modelにコピーします
  8.  
  9. ...
  10. トレーニングセットの精度: 0.96721
  11. トレーニング完了
  1. sqlflow> SELECT *
  2. iris.testより
  3. 予測 iris.predict.class
  4. sqlflow_models.my_dnn_model を使用します。
  5.  
  6. ...
  7. 予測完了。予測テーブル: iris.predict
  8. ...
  9. トレーニングセットの精度: 0.96721
  10. トレーニング完了

<<:  人材獲得競争で大学に残ることを選んだAI研究者

>>:  畳み込みニューラルネットワークが分かりませんか?怖がらないでください、このかわいい写真を​​見ればわかりますよ!

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

プロのアニメーターがGANを使って「怠け者」を助ければ、数週間かかる仕事を数分で終わらせられる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

AIが中国の山水画を生成!プリンストン大学の女子学生が卒業制作で描いた線と筆致は、人間の観察者の半数を騙した。

GAN を使用して作品を制作することは新しいことではないようです。 2019年、NVIDIAはGT...

サイバーセキュリティにおける AI の 4 つの主要なユースケースを理解する

サイバーセキュリティは、おそらく今日すべての企業が直面している最大の脅威です。これらの課題は新しいも...

移転可能で適応性のある運転行動予測

2022年2月10日にarXivにアップロードされた論文「移転可能で適応可能な運転行動予測」は、バー...

「新世代人工知能倫理規定」が発表:人工知能のライフサイクル全体に統合し、データプライバシーのセキュリティとアルゴリズムの倫理に重点を置く

9月26日、国家新世代人工知能ガバナンス専門委員会は「新世代人工知能倫理規範」(以下、「規範」という...

AIとビッグデータのつながり

ビッグデータと人工知能は、今日最も新しく、最も有用なテクノロジーの 2 つです。人工知能は10年以上...

最初にサンプルが多すぎますか? 5つのサンプリングアルゴリズムを数分で実行できます

データサイエンスはアルゴリズムの研究です。この記事では、データを処理するための一般的なサンプリング手...

九張雲吉DataCanvasマルチモーダル大規模モデルプラットフォームの実践と思考

1. マルチモーダル大規模モデルの歴史的発展上の写真は、1956年にアメリカのダートマス大学で開催さ...

...

2021 年の機械学習の今後はどうなるのでしょうか?

ああ、2020年!世界的なヘルスケア問題から、テクノロジーの採用と再利用の方法の革命まで、今年はこれ...

2050年の世界はどのようになっているでしょうか?新たなエネルギー源が出現し、人工知能が社会に浸透

次に、さらに詳しく見て、2025年という神秘的な年に足を踏み入れ、この壮大なベールを解き明かしてみま...

オプティマイザーを選択するにはどうすればいいですか?この記事では、さまざまなMLプロジェクトに適したオプティマイザーを選択する方法を説明します。

機械学習プロジェクトに適したオプティマイザーを選択するのは簡単な作業ではありません。オプティマイザー...

大規模モデル幻覚率ランキング:GPT-4は3%と最も低いが、Google Palmは最大27.2%

人工知能は急速に発展していますが、問題も頻繁に発生しています。 OpenAI の新しい GPT ビジ...