Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

5月6日、アント・ファイナンシャルの副CTOである胡曦氏はオープンソースの機械学習ツールSQLFlowを正式に発表し、「今後3年間で、AI機能はすべての技術者の基本的な機能となるでしょう。SQLFlowをオープンソース化することで人工知能アプリケーションの技術的ハードルを下げ、技術者がSQLと同じくらい簡単にAIを呼び出せるようにしたいと考えています。」と述べた。

現在、SQLFlow は GitHub で 1,636 個のスターと 236 個のフォークを獲得しています。 (GitHub アドレス: https://github.com/sql-machine-learning/sqlflow)

SQLFlow の目標は、SQL エンジンと AI エンジンを接続し、ユーザーがわずか数行の SQL コードでアプリケーションまたは製品全体の背後にあるデータ フローと AI 構造を記述できるようにすることです。関連する SQL エンジンには、MySQL、Oracle、Hive、SparkSQL、Flink など、SQL またはその派生語を使用してデータを記述したり、データに対する操作を記述したりすることをサポートするシステムが含まれます。ここで言う AI エンジンには、TensorFlow や PyTorch などのディープラーニング システムのほか、XGBoost、LibLinear、LibSVM などの従来の機械学習システムも含まれます。

SQLから機械学習へ

SQLFlow は、拡張構文を持つ SQL プログラムを、submitter と呼ばれるプログラムに変換して実行するトランスレータとして考えることができます。 SQLFlow は、さまざまな SQL エンジンを同じエンジンに抽象化する抽象化レイヤーを提供します。 SQLFlow は、さまざまな変換メカニズムをプラグインして、さまざまな AI エンジンに基づく送信プログラムを取得できる拡張可能なメカニズムも提供します。

SQLFlow が SQL 構文を拡張する目的は単純です。SELECT ステートメントの後に拡張構文を持つ TRAIN 句を追加することで、AI モデルのトレーニングを実装できます。あるいは、PREDICT 句を追加して、既存のモデルを使用して予測を行うこともできます。この設計により、データ アナリストの学習パスが大幅に簡素化されます。

さらに、SQLFlow は、データの特性に基づいてデータを自動的に機能に変換する方法を推測するために、さまざまな送信者翻訳プラグインで使用できるいくつかの基本関数も提供します。この方法では、ユーザーは TRAIN 句で変換を記述する必要がありません。

上記の設計意図は、SQLFlow のオープン ソース コードに反映されています。もちろん、SQLFlow の開発期間はまだ比較的短く、十分に詳細化されていない領域がまだたくさんあります。 Ant Financial のオープンソースのもう 1 つの目的は、さまざまな SQL エンジン チームや AI チームと連携して、データと AI の架け橋を構築することです。

以下は、サンプル データ Iris.train を使用して Tensorflow DNNClassifer モデルをトレーニングし、トレーニング済みのモデルを使用して予測を実行する例です。 SQL を使用してエレガントな ML コードを記述すると、いかにクールであるかがわかります。

  1. sqlflow> SELECT *
  2. iris.trainより
  3. DNN分類器のトレーニング
  4. n_classes = 3、hidden_​​units = [10, 20]の場合
  5. がく片の長さ、がく片の幅、花弁の長さ、花弁の幅
  6. LABELクラス
  7. sqlflow_models.my_dnn_modelにコピーします
  8.  
  9. ...
  10. トレーニングセットの精度: 0.96721
  11. トレーニング完了
  1. sqlflow> SELECT *
  2. iris.testより
  3. 予測 iris.predict.class
  4. sqlflow_models.my_dnn_model を使用します。
  5.  
  6. ...
  7. 予測完了。予測テーブル: iris.predict
  8. ...
  9. トレーニングセットの精度: 0.96721
  10. トレーニング完了

<<:  人材獲得競争で大学に残ることを選んだAI研究者

>>:  畳み込みニューラルネットワークが分かりませんか?怖がらないでください、このかわいい写真を​​見ればわかりますよ!

ブログ    
ブログ    

推薦する

...

企業がビジネスで人工知能をどのように活用しているか

ビジネスにおける人工知能 (AI) は、今日の企業にとって急速に一般的な競争ツールになりつつあります...

AI軍拡競争により、将来のAIハードウェアアーキテクチャの開発に3つの主要な方向性が生まれました。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ブロックチェーンのコンセンサスアルゴリズムとは何ですか?

所有権や金額などの取引の基本的な特性は、基本的な数学的特性に基づいて機能する公開鍵暗号化のおかげで簡...

工業情報化部:電話ネットワークアクセスの物理チャネルに肖像マッチング技術を導入

今年12月1日より、物理チャネルでは顔認識技術対策を全面的に導入し、電話ネットワークへのアクセスプロ...

機械学習に効果的なデータを取得する方法 小さなデータを扱うための 7 つのヒント (一読の価値あり)

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Baidu の最新の IDL 成果: 自然言語から始めて、AI エージェントに人間のように学習することを教える

AI は驚異的な進歩を遂げていますが、多くの分野ではまだ限界があります。たとえば、コンピューター ゲ...

...

カーリー:プロのカーリング選手に匹敵するスポーツロボット

海外メディアの報道によると、ロボットは多くのスポーツや活動で優れているが、1つのタスクだけを実行する...

警告! 「リップリーディング」キーでデータを盗む、AIは本当に怖い

コンピューターに頼って悪者を即座に見つけることができれば素晴らしいのですが、問題は AI システムが...

顔認識における克服すべき困難

顔認識は、生体認証の分野、さらには人工知能の分野においても最も難しい研究テーマの 1 つと考えられて...

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

機械学習の進歩がモデルによってもたらされるのか、それともデータによってもたらされるのかは、今世紀の論...

人工知能がビジネスの生産性を変革する方法

[[244003]]既存の AI ツールやサービスは、従業員に代わるものではなく、ワークフローの改善...

顧客の声: AI はあなたにとって優先事項ですか? データ戦略から始める必要があります

[[337768]]現在、世界中のあらゆる部門が人工知能(AI)の研究を行っています。 AI の画...