【WOT2018】AIの敷居は下がり続け、AIツールは誰でも利用可能に

【WOT2018】AIの敷居は下がり続け、AIツールは誰でも利用可能に

[51CTO.comより引用] 2018年11月30日から12月1日まで、WOT2018グローバル人工知能技術サミットが北京JWマリオットホテルで盛大に開催されました。国内外の人工知能エリート60名以上と業界専門家1,000名以上が集まり、人工知能プラットフォームツール、アルゴリズムモデル、音声・視覚などの技術コンテンツを共有し、人工知能が業界に新たな活力を与える方法について議論しました。 2日間にわたるカンファレンスは、一般技術、応用分野、産業エンパワーメントの3つの主要な章をカバーし、機械学習、データ処理、AIプラットフォームとツール、推奨検索、ビジネスプラクティス、ハードウェア最適化など、13の主要な技術セッションが開かれ、人工知能技術の壮大なイベントと言えます。

「AIプラットフォームとツール」サブフォーラムでは、ThoughtWorksインテリジェントサービスチームのテクニカルディレクターである白法川氏、百度のディープラーニングテクノロジープラットフォーム部門のディレクターである馬延軍氏、欧州技術のAI責任者である劉大偉氏を含む3名の専門家が、TensorFlow、PaddlePaddleなどのさまざまなディープラーニングフレームワークとツール、およびその他のアプリケーションとテクニックを共有しました。

継続的インテリジェンス - スケール化された AI サービスの構築

ThoughtWorks インテリジェント サービス チームのテクニカル ディレクターである Bai Fachuan 氏は、基調講演「継続的インテリジェンス - 拡張 AI サービスの構築」の中で、継続的インテグレーション、継続的デリバリー、継続的デプロイメントによって、ソフトウェアを迅速に反復しながら高いソフトウェア品質を維持できると述べました。機械学習の普及に伴い、ますます多くのサービスがパーソナライズ化、カスタマイズ化されています。「継続的インテリジェンス」は、このようなサービスを迅速に反復してリリースするための一連の方法を定義します。

インテリジェンスの定義は、大まかに3つのレベルに分けられます。1つ目は、現在の運用ニーズに応じて実行する必要がある一連の作業です。2つ目は、AIを基本サービスにしてビジネスシナリオに統合することです。3つ目は、AIを組み合わせて新しいビジネスシナリオを作成できるパーソナライズされたサービスにすることです。このうち第3レベルは、人工知能を活用して新たなビジネスや価値ポイントを発見し、より優れたユーザーエクスペリエンスを実現する、より理想的な状態です。

全体として、人工知能は企業における実装において依然として多くの課題に直面しています。 1つ目は規模の問題です。AIモデルの境界を測定することは難しく、既存のモデルの構築プロセスを再利用することも困難です。 2 つ目は、エンジニアリング実践における 3 つの大きな課題、つまり追跡の難しさ、再現の難しさ、展開の難しさです。さらに、データやシミュレーション データの不足、不十分なデータ ガバナンス、データ セキュリティ リスクなど、データに関する問題も数多くあります。多くの開発者は、マシン モデルの場合、データによってもたらされる課題は、ニューラル ネットワーク パラメータの調整やアルゴリズムの選択の難しさよりもはるかに大きいことに気づいています。

ThoughtWorks インテリジェント サービス チームのテクニカル ディレクター、Bai Fachuan 氏

ビジネスシステムやエコシステム環境への人工知能の実装は、大きく分けて 3 つの段階に分けられます。 1つ目は、PoC(凸集合への射影)を実施して、モデル、サービス、またはソリューションが実現可能かどうかを評価・検証し、単一のモデルのリリースと立ち上げを完了することです。第 2 段階では、最適化されトレーニングされたモデルを本番環境で使用できるため、規模の問題に対処し始めます。 3 番目の段階は、ビジネス システム全体にわたって AI サービスを統合することです。

PoC 段階では、データ ミドル プラットフォームの概念を導入し、データ ガバナンス、系統分析、アクセシビリティ、多言語データ ストレージを使用して最新のデータ アーキテクチャを構築する必要があります。従来のデータ ウェアハウス アーキテクチャでは、インテリジェンスの 1 つの側面、つまりサポート操作しか解決できません。機械学習のシナリオでは、非構造化データと半構造化データには大規模な ETL 操作が必要であり、そのためにはデータ ミドルエンド アーキテクチャを使用する必要があります。

第 2 段階では、開発からリリース、トレーニング、実装までのプロセス全体が手作業であるため、製品化された機械学習アーキテクチャが必要になります。 CI/CD、TDD、パイプラインなどのベストプラクティスやその他の技術的手法を導入することで、モデルの作成からリリースまでのプロセス[Yuan Wei 2]を再利用、追跡、再現することができます。

第3段階では、事業横断的な機械学習アーキテクチャを構築し、エンドツーエンドの機械学習パイプラインを通じてプラットフォームを構築し、企業のAIサービス、データ、アルゴリズムを可能な限り共有し、事業ラインを超えたインテリジェントなサービス統合を実現する必要があります。

再利用可能なモデル構築プロセス

  • データ プラットフォームと組み合わせ、データ プラットフォームの機能をデータ サポートとして使用して、データ プラットフォームの価値をより有効に活用します。
  • サービス構築プロセスを分割し、インテリジェントなサービス開発を合理化し、ビジネスニーズに迅速に対応します。
  • メタデータ管理方法を使用し、統一された標準形式を提供することで、複数の人が共同でシナリオを開発できるようになります。
  • インフラストラクチャの共有、モデルトレーニングと公開をデータプラットフォームに効果的に結び付け、サービスの構築を自動化します。
  • モデルのライフサイクル全体を管理する統合メタデータ管理システム。
  • 一般的な AI 機能はプラットフォーム化されており、人員要件を削減し、コラボレーションの効率を向上させます。

データセンター

継続的なインテリジェンスを実現し、AI モデルを組立ラインのように継続的にリリースできるようにするには、まず以下の問題を解決する必要があります。まず、データミドルプラットフォームは、データ統合、データ処理、データ処理、データリリースのための完全な組立ラインを形成できます。第二に、モデル公開に必要なアルゴリズム、フレームワーク、サービス、動作環境を選択し、パイプライン運用を実装できるAI基盤プラットフォームが必要です。 3 つ目は、データと AI 機能のコンバージェンス レイヤーです。これは、モデル データの取得元、モデルの公開場所、モデルの保存場所など、データと AI 基本プラットフォーム間の接続問題を解決します。これら 3 つの層の機能が構築されると、継続的なリリース、継続的な反復、継続的なオンライン リリースを実現できます。これは、AI パイプラインと呼ばれることもあります。

継続的なインテリジェントアーキテクチャを構築するための手順

  • ハードコードされたモデルから適応型モデルへ。
  • 大規模なデータを使用して特定のモデルをトレーニングします。
  • スケーラブルなシステムを構築する。
  • インタラクティブな AI 探索および開発ツールを作成します。
  • アルゴリズム、ソフトウェア、製品を共同で設計します。

エンタープライズレベルの機械学習の目標

  • 大規模データセットでのモデルトレーニング。
  • モデル分析および比較ツール。
  • エンドツーエンドのモデルワークフロー。
  • スケーラブルな機械学習モデルエコシステム。
  • 再利用可能なアルゴリズムとサービス。
  • 実験管理。

エンタープライズレベルの機械学習ソリューション

  • 分散トレーニングツール。
  • パフォーマンス報告プロセス。
  • 建設プロセスを視覚化します。
  • Python Jupyter、R、Sklearn、TensorFlow、PyTorch、SparkML、ONNX など。

オプションツール

白法川氏は、1 つのモデル、複数のモデル、および事業ラインや部門をまたいだエンタープライズ レベルの機械学習の事例を挙げ、機械学習のフレームワークとツールをリストアップしました。同氏は、AIの大規模導入を検討する際には、まず基礎となるAIの能力をどのように向上させるかを検討し、次に上位のAIモデルとビジネスシナリオを構築する必要があると強調した。ビジネスシナリオの問題解決を先に考えてしまうと、AIのスケールアップの過程で障害にぶつかることが多い。

詳細なコースを見るには、下のQRコードをスキャンしてください

PaddlePaddle ディープラーニングフレームワーク

百度のディープラーニング技術プラットフォーム部門のディレクターである馬延軍氏は講演の中で、ディープラーニング技術の発展の歴史と将来の動向、およびディープラーニングフレームワークの現在の開発状況を分析しました。 Baiduのディープラーニング技術の応用と組み合わせることで、国産オープンソースディープラーニングフレームワークであるPaddlePaddleの進歩を参加者に紹介し、PaddlePaddleの技術的リーダーシップを紹介し、さまざまな業界でAIを強化するPaddlePaddleの経験と実績を共有しました。

Baidu によるディープラーニング技術の活用は 2012 年にまで遡ります。わずか 1 年で、この技術は Baidu の検索および推奨ビジネスに適用され、ビジネスに大きな改善をもたらしました。 2015年、Baiduは完全にディープラーニングに基づいた翻訳エンジンをリリースしました。ディープラーニング技術が普及するにつれて、その応用シーンはますます多様化し、いわゆるディープラーニングフレームワークとしてツール化され始めました。例えば、TensorFlowやPaddlePaddleは相次いでオープンソース化されており、PaddlePaddleはBaiduが長年開発してきたディープラーニングフレームワークです。

百度のディープラーニング技術プラットフォーム部門ディレクター、馬延軍氏

実際、ディープラーニング フレームワークのオープン ソースにより、このテクノロジの参入障壁は大幅に下がりましたが、開発者には依然として特定の知識背景とハードウェア リソースのサポートが必要です。このシステムはまだ深く研究するには複雑すぎるため、一連のツールが生まれました。例えば、ディープラーニングのパラメータ調整の難しさに対処するため、百度はネットワーク構造自動設計ツール「AutoDL」を公開し、開発者が特別なトレーニングを受けなくてもそれを完了できるようにしました。さらに、Baidu は、よりシンプルなカスタマイズ AI モデル アプリケーション プラットフォームである EasyDL もリリースしました。これは、アルゴリズム基盤を一切持たない高速アプリケーション プラットフォームです。コードや専門的な知識を必要とせず、簡単にモデルをカスタマイズできます。クラウドと組み合わせることで、ユーザーは心配する必要がありません。

ディープラーニングフレームワークを核とした「オペレーティングシステムエコシステム」

馬延軍氏は、AIのシナリオにおいて、ディープラーニングフレームワークはオペレーティングシステムに似ていると述べました。それはユーザープログラムとハードウェアリソースの間にあり、カーネルを通じてユーザープログラムにリソーススケジュールを提供し、インターフェースを通じてユーザープログラムの開発利便性を提供します。ディープラーニング フレームワークでは、基盤となるハードウェアのパフォーマンスをより高いレベルにまで最大化する方法という問題を解決し、企業が独自のアルゴリズムを実装できるように API を提供する必要があります。もちろん、ディープラーニング フレームワーク上では、多くのアルゴリズム、視覚化ツール、インストールおよび展開ツールが公開されます。企業や個人は、これらのモデルを直接開発して使用し、独自の AI プログラムを構築できます。

PaddlePaddle が他のディープラーニング フレームワークと異なる点は、第一に、モデルと API の互換性を重視し、ディープラーニングのインストール環境の適応において徹底的な最適化と検証を行っており、開発者が真に使用できるようになっていることです。第二に、二次開発に便利で、企業のアプリケーション コストを削減できます。第三に、パフォーマンスがより安定しており、単なる基礎ツール アプリケーションではなく、上位レベルのビジョン、言語処理、感情分析、対話システムなどのシナリオ アプリケーションのサポートに重点を置いています。さらに、PaddlePaddle には、AutoDL、VisualDL、EasyDL など、幅広いサポート ツールとコンポーネントもあります。

また、PaddlePaddleが公式にリリースしたモデルは豊富で多様であり、そのすべてがBaiduによって長期間検証されており、効果が持続的かつ安定しています。大規模なデータ シナリオの場合、PaddlePaddle の並列機能も大きな強みとなります。展開面では、Baidu は推奨モデル、ビジュアル モデル、NLP モデルなど、多数の独自モデルを公開しています。

馬延軍氏は、百度はオープンデータ、評価基準、プラットフォームなど、AIエコシステムに関する多くの取り組みを行っており、一連の専門家向け講座を開催していると述べた。その目的は、ディープラーニングの敷居を下げ、AI技術が業界に力を与え、業界の生産性を向上させることだ。

誰もがAIを使えるように

欧樹科技AI部門責任者の劉大偉氏は、人工知能産業の現在の発展状況から始め、産業発展の機会と課題を列挙した後、人工知能モデリングシステムの利点と利便性を紹介した。さらに、欧州科技のマネーロンダリング防止金融プロジェクトを例に挙げ、「一般の人々がAIを気軽に受け入れ、業界の実践を支援できるようにする」方法について詳しく説明しました。

劉大偉氏は、人工知能技術は音声認識や画像認識の分野で急速に進歩し、AI技術は複数の分野に浸透していると述べた。例えば、AIモデルは網膜を通して糖尿病を診断することができ、AIは工業生産ラインの設備の状態を予測することができ、AI動態検出システムを使用してシベリアトラなどの野生動物を保護することができる。

Oushu TechnologyのAI責任者、Liu Dawei氏

Even Technologyは、AI技術を応用することでマネーロンダリング対策の分野で成功事例を達成しています。米国の大手信用調査機関は、違法取引を阻止するために、FICOスコアリングシステムの計算にAIモデルを使い始めたと報じられている。中国では、毎年2000億件のマネーロンダリング取引が発生し、金融の安定性を損なっています。わが国でもマネーロンダリング防止法と規制政策が導入されており、各銀行は銀行内で発生するすべての取引を監視し、マネーロンダリング行為を特定し、中央銀行に報告して統一的に処理する責任と義務を負っています。

Even Technology のマネーロンダリング対策ソリューションの基盤となるレイヤーは、トランザクションフロー、顧客情報、マネーロンダリングパターンのサンプル、トレーニングモデルなどのデータソースです。中間の 2 つの層は、OushuDB と LittleBoy 人工知能プラットフォーム、および分散ストレージ コンポーネントです。上位層は、データクリーニング、データ変換、相互検証を通じて、マネーロンダリングに関連する意味のあるデータを取得します。 Oushu Technologyは、AIモデリングを通じて複数の実行可能なモデルソリューションを提供し、疑わしいケースのプッシュ数と手動調査の作業負荷を数百倍削減できます。

実現可能なモデルソリューション

  • 既存の方法:再現率 100%、適合率約 1%。
  • モデルAでも再現率100%、適合率51.43%。
  • モデルBでも再現率86.11%、適合率92.08%。

Oushu Lava AI Cloud には、OushuDB データ ウェアハウスと LittleBoy 人工知能プラットフォームが搭載されています。クラスター全体をパブリック クラウドで管理することも、ユーザー独自のプライベート クラウドに展開することもできます。データ、モデリング、公開から銀行のシステムへのアクセスまで、マネーロンダリング防止ソリューションのプロセス全体は複雑に聞こえますが、実際には非常にシンプルで、専門的な AI の知識を習得する必要さえありません。たとえば、LittleBoy の AI スタジオには、既製のコンポーネントが多数あります。ユーザーは、ノードの構成方法を理解するために、最低 30 分のトレーニングを受けるだけで済みます。その後、ドラッグ アンド ドロップでコンポーネントをさまざまなワークフローに接続したり、複雑なアプリケーションを構築したりすることもできます。

分類モデルをトレーニングするための 5 つのステップ

さらに、Even Technology はより簡単な方法を見つけ、別のモデリング方法を追加しました。5 ステップのガイド付きインターフェースを通じて、多くの AI 知識がなくても AI モデルを構築できます。

  • 最初のステップ: データをトレーニングし、すべてのクラスター、データベース、データ テーブル内のデータをツリー構造で表示します。
  • ステップ 2: 特徴とラベルを選択します。ネットワークはどの特徴がより有用であるかを自動的に識別するため、特徴エンジニアリングをあまり行う必要はありません。
  • ステップ 3: モデルを評価する。
  • ステップ 4: アルゴリズムを設定します。システムはデフォルトで AutoML を使用してアルゴリズムを自動的に調整します。必要なニューラル ネットワーク構造を自動的に探索し、ハイパーパラメータの組み合わせのセットを自動的に一致させます。したがって、設定する必要はありません。AI エンジニアの場合は、パラメータを自分で入力することもできます。
  • ステップ 5: [開始] をクリックしてトレーニングを開始します。トレーニング プロセス中、モデルの収束ステータスをリアルタイムで監視できます。

モデルのトレーニングが完了したら、「公開」をクリックするだけで、システム内でモデルの公開とサービスが自動的に完了します。

さらに、Oushu Technology は一般的な REST API 呼び出しツールも提供しています。ユーザーは、このインターフェイスを独自のアプリケーションに統合することで、すぐに AI 機能を取得できます。これは、短期間で更新できない既存のシステムに非常に適しています。API を呼び出すことで、これらのシステムはすぐに人工知能システムになります。

詳細なコースを見るには、下のQRコードをスキャンしてください

上記内容は、WOT2018グローバル人工知能技術サミットの「AIプラットフォームとツール」サブフォーラムの講演内容をもとに51CTO記者がまとめたものです。WOTに関するその他の内容については、please follow.comをご覧ください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  突風か潮か?AIが音声だけで止まってしまったら、一体いつまで苦労し続けることができるのだろうか?

>>:  スポーツへの人工知能とビッグデータの導入は、市場を混乱させたり、破壊したりするのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

iAnalysis 中国データインテリジェンスアプリケーショントレンドレポート

ビジネスが発展し、テクノロジーが成熟するにつれて、企業はデータの大幅な増加に直面しています。ビッグデ...

初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

2018年の初めに、人工知能は大きな進歩を遂げました。 1月11日、スタンフォード大学が主催する世界...

人工知能の時代が到来した今、子どもたちはどんな仕事に就くことができるのでしょうか?

昨年11月には世界インターネット会議が開催され、その期間中、人工知能が私たちの生活にどのような変化を...

顔認識技術の開発と実用的なソリューションの設計

顔認識技術は、Google、Facebook、Alibaba、Tencent、Baiduなどの国内外...

人工知能の主要技術分野のレビュー

[[441598]] AI への準備プロセスの多くは組織の変更です。人工知能の利用には、ニューカラー...

数時間のビデオを視聴するだけで人間のチャットを真似できますか? Facebookのロボットは表情が豊か

ヒューマノイドロボットの類似性は人間の好感度に比例するわけではありません。 1970年に日本のロボッ...

...

1 つのニューロンには 5 ~ 8 層のニューラル ネットワークがあります。ディープラーニングの計算の複雑さは生物学によって克服されています。

人工知能の開発にはまだまだ長い道のりが残っているようです。エルサレムのヘブライ大学の研究者らは、単一...

AI研究者の邢波氏:機械学習には明確な理論的枠組みが欠けており、評価の目標と方法を再定義する必要がある

[[426278]] 2021年1月、コンピュータサイエンスと人工知能分野のトップ学者であるエリッ...

ロボット兵士はもはやSFではない

ロボット兵士はまもなく現実のものとなり、戦争作戦の遂行において人間の兵士を支援し、負傷した兵士に医療...

...

2015年9月のプログラミング言語ランキング: 新しいインデックスアルゴリズムにより急上昇が解消

9月に、TIOBE Indexは改良されたアルゴリズムを使用してプログラミング言語の人気度を計算しま...

...

AIがコンピューティングをエッジに押し上げる

[[408175]]ここ数年の流行語といえば、エッジ コンピューティングは 5G や AI と密接に...