Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

5月6日、アント・ファイナンシャルの副CTOである胡曦氏はオープンソースの機械学習ツールSQLFlowを正式に発表し、「今後3年間で、AI機能はすべての技術者の基本的な機能となるでしょう。SQLFlowをオープンソース化することで人工知能アプリケーションの技術的ハードルを下げ、技術者がSQLと同じくらい簡単にAIを呼び出せるようにしたいと考えています。」と述べた。

現在、SQLFlow は GitHub で 1,636 個のスターと 236 個のフォークを獲得しています。 (GitHub アドレス: https://github.com/sql-machine-learning/sqlflow)

SQLFlow の目標は、SQL エンジンと AI エンジンを接続し、ユーザーがわずか数行の SQL コードでアプリケーションまたは製品全体の背後にあるデータ フローと AI 構造を記述できるようにすることです。関連する SQL エンジンには、MySQL、Oracle、Hive、SparkSQL、Flink など、SQL またはその派生語を使用してデータを記述したり、データに対する操作を記述したりすることをサポートするシステムが含まれます。ここで言う AI エンジンには、TensorFlow や PyTorch などのディープラーニング システムのほか、XGBoost、LibLinear、LibSVM などの従来の機械学習システムも含まれます。

SQLから機械学習へ

SQLFlow は、拡張構文を持つ SQL プログラムを、submitter と呼ばれるプログラムに変換して実行するトランスレータとして考えることができます。 SQLFlow は、さまざまな SQL エンジンを同じエンジンに抽象化する抽象化レイヤーを提供します。 SQLFlow は、さまざまな変換メカニズムをプラグインして、さまざまな AI エンジンに基づく送信プログラムを取得できる拡張可能なメカニズムも提供します。

SQLFlow が SQL 構文を拡張する目的は単純です。SELECT ステートメントの後に拡張構文を持つ TRAIN 句を追加することで、AI モデルのトレーニングを実装できます。あるいは、PREDICT 句を追加して、既存のモデルを使用して予測を行うこともできます。この設計により、データ アナリストの学習パスが大幅に簡素化されます。

さらに、SQLFlow は、データの特性に基づいてデータを自動的に機能に変換する方法を推測するために、さまざまな送信者翻訳プラグインで使用できるいくつかの基本関数も提供します。この方法では、ユーザーは TRAIN 句で変換を記述する必要がありません。

上記の設計意図は、SQLFlow のオープン ソース コードに反映されています。もちろん、SQLFlow の開発期間はまだ比較的短く、十分に詳細化されていない領域がまだたくさんあります。 Ant Financial のオープンソースのもう 1 つの目的は、さまざまな SQL エンジン チームや AI チームと連携して、データと AI の架け橋を構築することです。

以下は、サンプル データ Iris.train を使用して Tensorflow DNNClassifer モデルをトレーニングし、トレーニング済みのモデルを使用して予測を実行する例です。 SQL を使用してエレガントな ML コードを記述すると、いかにクールであるかがわかります。

  1. sqlflow> SELECT *
  2. iris.trainより
  3. DNN分類器のトレーニング
  4. n_classes = 3、hidden_​​units = [10, 20]の場合
  5. がく片の長さ、がく片の幅、花弁の長さ、花弁の幅
  6. LABELクラス
  7. sqlflow_models.my_dnn_modelにコピーします
  8.  
  9. ...
  10. トレーニングセットの精度: 0.96721
  11. トレーニング完了
  1. sqlflow> SELECT *
  2. iris.testより
  3. 予測 iris.predict.class
  4. sqlflow_models.my_dnn_model を使用します。
  5.  
  6. ...
  7. 予測完了。予測テーブル: iris.predict
  8. ...
  9. トレーニングセットの精度: 0.96721
  10. トレーニング完了

<<:  人材獲得競争で大学に残ることを選んだAI研究者

>>:  畳み込みニューラルネットワークが分かりませんか?怖がらないでください、このかわいい写真を​​見ればわかりますよ!

ブログ    
ブログ    
ブログ    

推薦する

AIによる高齢者介護についてどう思いますか?

2021年の両会期間中、百度の李ロビン会長の「地域社会におけるスマート高齢者ケアの推進を加速し、テ...

...

これが顔認識と画像認識がますます重要になっている理由です

捜査チームがスケッチアーティストを雇って、目撃者が語った犯人像を描いてもらう犯罪番組を見たことを覚え...

...

マシンビジョン: 2D ビジョンと 3D ビジョンのどちらを選択するか?

マシンビジョンは、人工知能の重要な分野として、今日最も注目されているテクノロジーの 1 つとなってい...

科学者は、掴んだまま物体を回転させることができるユニークなロボットハンドを開発

今日の多くのロボットハンドは物体をつかむことができるが、つかんだ物体を放さずにその向きを変えることは...

CPU、GPU、NPU、FPGA はディープラーニングでどのように優位性を発揮するのでしょうか?

AIの応用が広まるにつれ、ディープラーニングは現在のAI研究と応用の主流の方法となっています。膨大...

EleutherAIが200億パラメータのGPT風モデルを発表: GPT-3とは異なり、無料でオープン

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

生成 AI は、技術チームの全員が価値を実現するのにどのように役立ちますか?

この記事は、テンセントCSIGテクニカルディレクターの黄文馨氏が[WOT2023深圳駅]カンファレン...

画像を外国語として扱うKuaishouと北京大学のマルチモーダル大規模モデルはDALLE-3に匹敵する

GPT や LLaMA などの現在の大規模言語モデルは、自然言語処理の分野で大きな進歩を遂げており、...

人工知能の主な研究段階と将来の発展方向は何ですか?

人工知能は常にコンピュータ技術の最前線にあり、人工知能研究の理論と発見はコンピュータ技術の発展の方向...

...

...

...