Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

5月6日、アント・ファイナンシャルの副CTOである胡曦氏はオープンソースの機械学習ツールSQLFlowを正式に発表し、「今後3年間で、AI機能はすべての技術者の基本的な機能となるでしょう。SQLFlowをオープンソース化することで人工知能アプリケーションの技術的ハードルを下げ、技術者がSQLと同じくらい簡単にAIを呼び出せるようにしたいと考えています。」と述べた。

現在、SQLFlow は GitHub で 1,636 個のスターと 236 個のフォークを獲得しています。 (GitHub アドレス: https://github.com/sql-machine-learning/sqlflow)

SQLFlow の目標は、SQL エンジンと AI エンジンを接続し、ユーザーがわずか数行の SQL コードでアプリケーションまたは製品全体の背後にあるデータ フローと AI 構造を記述できるようにすることです。関連する SQL エンジンには、MySQL、Oracle、Hive、SparkSQL、Flink など、SQL またはその派生語を使用してデータを記述したり、データに対する操作を記述したりすることをサポートするシステムが含まれます。ここで言う AI エンジンには、TensorFlow や PyTorch などのディープラーニング システムのほか、XGBoost、LibLinear、LibSVM などの従来の機械学習システムも含まれます。

SQLから機械学習へ

SQLFlow は、拡張構文を持つ SQL プログラムを、submitter と呼ばれるプログラムに変換して実行するトランスレータとして考えることができます。 SQLFlow は、さまざまな SQL エンジンを同じエンジンに抽象化する抽象化レイヤーを提供します。 SQLFlow は、さまざまな変換メカニズムをプラグインして、さまざまな AI エンジンに基づく送信プログラムを取得できる拡張可能なメカニズムも提供します。

SQLFlow が SQL 構文を拡張する目的は単純です。SELECT ステートメントの後に拡張構文を持つ TRAIN 句を追加することで、AI モデルのトレーニングを実装できます。あるいは、PREDICT 句を追加して、既存のモデルを使用して予測を行うこともできます。この設計により、データ アナリストの学習パスが大幅に簡素化されます。

さらに、SQLFlow は、データの特性に基づいてデータを自動的に機能に変換する方法を推測するために、さまざまな送信者翻訳プラグインで使用できるいくつかの基本関数も提供します。この方法では、ユーザーは TRAIN 句で変換を記述する必要がありません。

上記の設計意図は、SQLFlow のオープン ソース コードに反映されています。もちろん、SQLFlow の開発期間はまだ比較的短く、十分に詳細化されていない領域がまだたくさんあります。 Ant Financial のオープンソースのもう 1 つの目的は、さまざまな SQL エンジン チームや AI チームと連携して、データと AI の架け橋を構築することです。

以下は、サンプル データ Iris.train を使用して Tensorflow DNNClassifer モデルをトレーニングし、トレーニング済みのモデルを使用して予測を実行する例です。 SQL を使用してエレガントな ML コードを記述すると、いかにクールであるかがわかります。

  1. sqlflow> SELECT *
  2. iris.trainより
  3. DNN分類器のトレーニング
  4. n_classes = 3、hidden_​​units = [10, 20]の場合
  5. がく片の長さ、がく片の幅、花弁の長さ、花弁の幅
  6. LABELクラス
  7. sqlflow_models.my_dnn_modelにコピーします
  8.  
  9. ...
  10. トレーニングセットの精度: 0.96721
  11. トレーニング完了
  1. sqlflow> SELECT *
  2. iris.testより
  3. 予測 iris.predict.class
  4. sqlflow_models.my_dnn_model を使用します。
  5.  
  6. ...
  7. 予測完了。予測テーブル: iris.predict
  8. ...
  9. トレーニングセットの精度: 0.96721
  10. トレーニング完了

<<:  人材獲得競争で大学に残ることを選んだAI研究者

>>:  畳み込みニューラルネットワークが分かりませんか?怖がらないでください、このかわいい写真を​​見ればわかりますよ!

ブログ    
ブログ    
ブログ    

推薦する

SMP、NUMA、MPP アーキテクチャの概要

[[198955]]現在の商用サーバーは、システムアーキテクチャの観点から、対称型マルチプロセッサ構...

...

人工知能を活用して機密情報を保護する 5 つの方法

研究者たちは、人工知能技術が機密情報のセキュリティを確保するための非常に優れたツールであることを発見...

大規模モデルの最大のバグは、正解率がほぼゼロであり、GPTからLlamaまで誰も免れないことです。

GPT-3とLlamaに「AはBである」という単純な知識を教え、​​次にBが何であるかを尋ねました...

工業情報化部など8つの部門:地域人工知能データ処理センターの建設を検討

12月29日、工業情報化部、国家発展改革委員会、教育部、財政部、中国人民銀行、国家税務総局、金融監督...

私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

高度な脅威検出における人工知能技術の応用

高度な持続的脅威は、その多様な形態、持続性、対立、隠蔽を特徴とし、現在、大手企業が脅威監視において直...

2020年職場のAIスキルランキング:TensorFlowが人気上昇、Pythonが最も人気、マーケティング部門も学習中

2020年まで残り1ヶ月となりました。最近、オンライン教育ウェブサイトのUdemyは、受講生のコース...

製造の自動化と効率化の新時代

18 世紀と 19 世紀の最初の産業革命は社会を完全に作り変え、物の製造方法、人々の働き方、そして生...

AI はあなたの仕事を奪うだけでなく、もっと恐ろしい脅威をもたらす可能性があります...

ビッグデータ時代の到来は、ビッグデータの波だけでなく、人工知能の台頭ももたらします。グーグルの人工知...

130 の大学が人工知能専攻を追加。次の「陥没穴」専攻になるのでしょうか?

大学の専攻の盛衰は、時代の発展と技術の進歩を最もよく物語る証拠でもあります。今日のいわゆる「落とし穴...

自動運転企業のほとんどは失敗する運命にある

「まだ非常に初期段階です。」これは、自動運転技術の現在の開発について、多くの業界関係者がYiou氏に...

2020 年の予測: AI セキュリティの 10 のトレンド

2020 年のサイバーセキュリティは転換点を迎えています。人工知能と機械学習の進歩はサイバーセキュリ...

...