AIプログラマーの負担を軽減!マイクロソフト、スケーラブルなインテリジェンスをサポートするためにディープラーニングライブラリ SynapseML を導入

AIプログラマーの負担を軽減!マイクロソフト、スケーラブルなインテリジェンスをサポートするためにディープラーニングライブラリ SynapseML を導入

[[435878]]

マイクロソフトは水曜日、開発者が機械学習の開発と展開を簡素化できるように、シンプルで多言語対応の超並列機械学習ライブラリ SynapseML (旧称 MMLSpark) をオープンソースとして発表しました。

機械学習パイプラインの構築は、最も経験豊富な開発者にとっても難しい場合があります。まず、異なるエコシステムのツールを組み合わせるには大量のコードが必要であり、多くのフレームワークはサーバー クラスターを考慮して設計されていません。データ サイエンス チームも、より多くの機械学習モデルを使用するよう求めるプレッシャーに直面しています。

Microsoft は、SynapseML を使用すると、開発者はテキスト分析、翻訳、音声処理などのクロスドメインの課題を解決するスケーラブルなインテリジェント システムを構築できると述べています。

SynapseML を使用すると、開発者は 45 種類を超える最先端の機械学習サービスをシステムやデータベースに直接組み込むことができます。

最新リリースでは、分散フォーム認識、会話の文字起こし、翻訳のサポートが追加され、さまざまなドキュメントを解析し、複数の対話者の音声をリアルタイムで文字起こしし、100 を超えるさまざまな言語を翻訳できる、すぐに使用できるアルゴリズムが搭載されています。

▲オープンソース機械学習ライブラリSynapseMLのインターフェース

オープンソースのリンクは次のとおりです: https://github.com/microsoft/SynapseML

1. 5年間の開発を経て、SynapseMLはAI実装の問題点に直接対処します。

SynapseML は、Apache Spark、SparkML、および産業用ビッグ データ処理の分野におけるその他の「インターネット セレブ」コンピューティング エンジンを含む、Microsoft の強力な Spark (コンピューティング エンジン) エコシステム上に構築されています。

SynapseML は、Spark 機械学習ビルドフローとその他のディープラーニング ツールのシームレスな統合を含む、多くのディープラーニングおよびデータ サイエンス ツールを Spark エコシステムに追加します。これらのツールは、さまざまなデータ ソースに対して強力で拡張性の高い予測および分析モデルを提供します。

SynapseML ライブラリは Azure Synapse Analytics ツールで使用でき、アルゴリズムの動作要件に応じて、または開発者が事前に構成したリソースに基づいて、AI モデルのデータを収集および処理できます。

「過去 5 年間、私たちは運用ワークロード向けの SynapseML ライブラリの改善と安定化に取り組んできました。Azure Synapse Analytics を使用している開発者は、SynapseML がエンタープライズ サポート付きのサービスで一般提供されるようになったことを喜んでいただけるでしょう」と、Microsoft のソフトウェア エンジニアである Mark Hamilton 氏はブログ投稿で述べています。

AI技術の活用と分析能力は徐々に高まっていますが、データサイエンスプロジェクトの約87%はまだ産業化されていません。米国のAIアルゴリズム取引サービスプラットフォームであるAlgorithmiaの最近の調査によると、ビジネス価値を実現するためのモデル導入に1~3か月を要する企業は22%、3か月以上を要する企業は18%となっている。

SynapseML は、Microsoft が開発した既存の機械学習フレームワークとアルゴリズムを 1 つの API にパッケージ化し、データ プロジェクトの失敗という課題を解決します。この API は、Python、R、Scala、Java で使用できます。 SynapseML を使用すると、開発者は、検索エンジンの作成など、複数のフレームワークを必要とするユースケースを組み合わせて、サイズ変更可能なコンピュータ クラスターでモデルをトレーニングおよび評価できます。

2. 教師なし学習機能は研究のギャップを埋めることができる

Microsoft はプロジェクトの Web サイトで次のように説明しています。「SynapseML のツールを使用すると、複数の機械学習エコシステムにまたがる強力で拡張性の高いモデルを作成できます。SynapseML は、Spark エコシステムに新しいネットワーク機能も提供します。HTTP on Spark プロジェクトを使用すると、ユーザーは任意の Web サービスを SparkML モデルに埋め込み、Spark クラスターを使用して大規模なジョブを実行できます。」

▲エンジンライブラリ SynapseML アーキテクチャ

SynapseML は、Microsoft と Meta (旧 Facebook) が共同で開発したフレームワークである Open Neural Network Exchange (ONNX) とも統合されており、実行時にさまざまな機械学習エコシステムのモデルを使用できるようになります。この統合により、開発者はわずか数行のコードでさまざまな従来の機械学習モデルを実行できるようになります。

この API は「教師なし学習 AI」を特徴としており、トレーニング データにラベルを付けずに、人種や性別などの機密データセット機能が過剰に解釈されているか認識できないかなど、データセットの不均衡を理解する機能や、モデルが特定の予測を行った理由とトレーニング データセットを改善する方法を説明するモデルの説明可能性などが含まれます。

SynapseML は、パーソナライズされた推奨事項のための Vowpal Wabbit フレームワークと、強化学習用の新しいアルゴリズム モデルであるコンテキスト バンディットを導入し、開発者が AI モデルをトレーニングできるようにします。

ラベル付けされたデータセットを必要とせず、教師なし学習はドメイン知識の特定のギャップを埋めるのに役立ちます。たとえば、Facebook が最近リリースした教師なしモデル SEER は、10 億枚の画像でトレーニングでき、さまざまなコンピューター ビジョン ベンチマークで最先端の結果を達成しています。

ただし、教師なし学習では、システムの予測における偏りや欠陥の可能性が排除されるわけではありません。一部の専門家は、これらのバイアスを排除するには、教師なしモデルの専門的なトレーニングと、バイアスを排除するための追加の小規模データセットの使用が必要になる可能性があると考えています。

「私たちの目標は、開発者が分散実装の詳細について心配する必要がなくなり、開発者のコ​​ードを変更することなく、さまざまなデータベース、クラスター、プログラミング言語に展開できるようにすることです」とハミルトン氏は付け加えた。

結論:オープンソースエンジンライブラリはアルゴリズムの実装を促進する

科学技術の急速な発展に伴い、AIによる技術革命も急速に発展しています。機械学習などの分野におけるAI研究は、性能と効率性が絶えず向上していますが、そのアルゴリズムの実装は依然として困難に直面しており、大規模に活用するには至っていません。

Microsoft は、機械学習アルゴリズムを継続的に改善し、既存の機械学習フレームワークを Microsoft が開発したアルゴリズムと統合し、AI のデータ処理および分析機能を向上させ、AI テクノロジの開発をさらに促進するために、SynapseML ライブラリをオープンソース化しました。

<<:  2 つの小型モデルで大型モデルに勝つことができます。北京大学卒業生、Google 中国版第一著者「モデルコレクション」、CNN や Transformer にも応用可能!

>>:  AI向けに構築されたコンピューターに最適なアクセサリと外部コンポーネント

ブログ    
ブログ    

推薦する

将来世界に革命を起こす可能性のあるトップ 10 のテクノロジーをご存知ですか?

将来世界に革命を起こす可能性のあるトップ10のテクノロジー1.4Dプリント[[277651]]映画の...

PyTorch と TensorFlow のどちらが優れていますか?最前線の開発者の声

Theano、TensorFlow、Torch、MXNetから最近人気のPyTorchなど、ディープ...

PyTorch モデルのトレーニングを高速化するための 9 つのヒント!

[[353240]]ニューラルネットワークをこのようにしないでください正直に言えば、あなたのモデル...

デジタルマーケティングにおけるAI革命

ほんの数年前までは、マーケティングに特化した AI エンジンがマーケティングの未来につながると信じて...

AI実践者が適用すべき10のディープラーニング手法

過去 10 年間で、機械学習への関心は爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエ...

OpenAIの画像検出ツールが公開され、CTO: AI生成画像の99%を認識可能

OpenAI は AI 画像認識を開始しようとしています。最新のニュースとしては、同社が検出ツールを...

額をタップして入力できる。Googleエンジニアの「帽子型キーボード」は数え切れないほどのファンを魅了。自分で作ることもできる

キーボードと帽子を組み合わせたらどうなるでしょうか?冗談はさておき、Google 日本支社のエンジニ...

...

クラウドコンピューティングは AI を民主化するための鍵となるのでしょうか?

日本の収穫期には、農家の中には毎日多くの時間を費やして、農場で収穫したキュウリを種類ごとに仕分けする...

中国でドローン配送用の商用「操縦免許」が発行されるまでにどれくらいの時間がかかるのでしょうか?

[[264191]]少し前、米国で初となるドローン配送の「操縦免許」が正式に発行された。これを取得...

人工知能とロボットが医療業界を「支配」していますが、あなたは安心していますか?

人間社会が発展するにつれて、知性は新たな生産要素になりました。近年、人工知能産業の発展は爆発的な成長...

AIが予測分析アプリケーションに与える影響

人工知能 (AI) を使用した予測分析により、企業は過去のデータに基づいて将来の結果を予測し、運用効...

フェイフェイ・リーがリストに載っています!バイデン氏、AI研究者にデータを公開するため12人からなるタスクフォースを設置

バイデン政権は木曜日、国家人工知能研究リソース(NAIRR)作業部会の設立を発表した。ワーキンググル...

産業分野におけるAIの重要な役割

人工知能 (AI) は、多くの保守および制御エンジニアにとって新しい概念ではありません。デジタル変革...

データ分析とAIのミスが原因の注目度の高い事件9件

2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...