PaddlePaddle パノラマビューが初めて公開され、11 の新機能とサービスハードコアリリース

ディープラーニングが注目を集めています。 4月23日、北京で第1回WAVE SUMMIT 2019ディープラーニング開発者サミットが開催されました。1,000人を超える開発者が集まり、AIの専門家や学者とともに、中国のディープラーニング開発者にとってまさに壮大なイベントを目の当たりにしました。

会議で、百度の高級副社長で国家深層学習技術応用工程研究室長の王海鋒氏は「深層学習は人工知能を大規模な工業生産の段階に押し上げており、深層学習フレームワークはインテリジェント時代のオペレーティングシステムである」と述べた。同氏は、深層学習技術は汎用性が強く、人工知能を大規模な工業生産の段階に押し上げ、標準化、自動化、モジュール化の特徴を示していると考えている。ディープラーニングフレームワークは、下部のチップや大規模コンピュータシステムと上部のさまざまなビジネスモデルや産業アプリケーションをリンクするものであり、インテリジェント時代のオペレーティングシステムです。

PaddlePaddleのパノラマ写真が初公開 11の新機能とサービスがリリース

Baidu はディープラーニング技術を研究する最も初期の企業の一つとして、2013 年に Global Deep Learning Institute を設立しました。長年の蓄積と蓄積を経て、Baidu PaddlePaddle は 2016 年に正式にオープンソースとなり、中国で唯一のオープンソースで完全に機能するエンドツーエンドのディープラーニングプラットフォームとなりました。 2017年、百度は国家発展改革委員会の承認を得て、ディープラーニング技術および応用のための国家工程研究所の設立を主導しました。ディープラーニングの分野における百度の強さは明らかです。

中核技術は国の最も重要な武器です。オープンソースになって3年になるPaddlePaddleは、Deep Learning Developer Summitで印象的な「成績表」を発表しました。

Baiduのディープラーニング技術プラットフォーム部門のディレクターである馬延軍氏は、コアフレームワーク、ツールコンポーネント、サービスプラットフォームを統合したエンドツーエンドのオープンソースディープラーニングプラットフォームであるPaddlePaddleの全体像を発表しました。これには、実際のアプリケーションをサポートし、産業グレードのアプリケーション効果を実現するモデル、大規模データシナリオ向けの分散トレーニング機能、さまざまな異種ハードウェアをサポートする高速推論エンジンが含まれます。今回、PaddleNLP、ビデオ認識ツールセット、Paddle Serving、PaddleSlim、AutoDL Designなど、ディープラーニングの開発、トレーニング、予測のための「ハードカレンシー」を含む11の新機能とサービスがリリースされました。「1億元」のAI Studioコンピューティングパワーサポートプランもその場で発表され、PaddlePaddleの中国名「飛楊」も発表されました。

馬延軍氏は「百度はディープラーニングのフレームワークだけでなく、密接に関連し、柔軟に組み合わせられたツールコンポーネントとサービスプラットフォームの完全なセットも提供しており、初心者、アルゴリズムの基礎知識がないエンジニア、アルゴリズムエンジニア、研究者を完全にカバーしています。このプラットフォームは機能のカバー範囲がより広く、より包括的なユーザーをカバーし、各部分間の接続がよりスムーズです」と述べました。

まず、コアフレームワークレイヤーにより、開発からトレーニング、予測に至るまでの完全な機能セットが実現します。 PaddlePaddleは開発段階で、実際のビジネスシナリオで検証された60以上の公式モデルをオープンソース化しており、ビジョン、NLP、推奨などのコアAIテクノロジー分野をカバーしており、最も公式にサポートされているモデルを備えたディープラーニングプラットフォームとなっています。新しくリリースされた PaddleCV とビデオ認識ツールセット。産業用アプリケーション向けの中国製 NLP ツールセットである PaddleNLP は、一連の共有スケルトンコードを使用して自然言語処理の分野で複数のモデルを実装し、開発プロセス中の開発者の反復作業を削減できます。業界における現在の中国語意味表現モデルと、ユーザーのビッグデータトレーニングに基づくアプリケーションタスクモデルを備えており、業界の実践から派生したモデルであり、業界レベルのアプリケーション効果を実現します。

新しくリリースされたビデオ認識ツールセットは、ビデオの理解、ビデオの編集、ビデオの生成など、一連のタスクに対するソリューションを開発者に提供します。 7 つの古典的なビデオ分類モデルが開かれ、データの読み取りと評価に関して、一連の設定ファイルと一連のコードが共有されます。これらは、ビデオ認識の分野で主流となっている主要なモデルをカバーしており、トレーニングと予測のためのワンクリックの効率的な設定も実現できます。

トレーニングフェーズでは、大規模分散トレーニングが主に3つの側面でアップグレードされました。まず、複数マシンと複数カードの包括的かつ効率的なサポートにより、速度が向上しました。次に、CPU アプリケーションシナリオの面では、大規模なスパース機能向けに大規模なスパースパラメーターサーバーが設計および公開されており、開発者は関連イメージを簡単にダウンロードして使用できます。大規模な分散トレーニングは、さまざまなコンテナーでの高速実行をサポートし、K8S エコシステムでのトレーニングに PaddlePaddle を使用することもサポートします。

データ処理に関しては、分散 IO を最適化し、リモートファイルシステムのストリーミング読み取り機能を強化しました。 GPU マルチマシンマルチカード同期トレーニングは、スパース通信機能を高めることで、帯域幅に依存しないトレーニング機能を向上させます。10G ネットワークなどの低帯域幅ネットワーク環境では、同期トレーニングを 10 倍高速化できます。

開発とトレーニングの後、モデルをさまざまなアプリケーションシナリオに展開することは非常に重要なステップです。展開フェーズでは、高速な推論エンジンが必要です。これに基づいて、より多くのハードウェアに展開するために、モデルの圧縮が必要になることがよくあります。実際に使用する場合は、ハードウェアとソフトウェアの統合機能のサポートも必要です。これを基に、PaddlePaddle は完全なエンドツーエンドの全プロセス展開ソリューションを準備し、さまざまな種類のハードウェアのサポートを継続的に拡大していきます。 PaddlePaddle は、複数のハードウェアのサポートに基づいて、高性能な基盤アクセラレーションライブラリと推論エンジンを備えています。新しくリリースされた Paddle Serving は、サーバー側での迅速な展開をサポートします。それだけでなく、モデルボリューム圧縮ライブラリ PaddleSlim も開発者向けに用意された「大きなサプライズ」です。すでに小さい MobileNet モデルでも、モデル効果を失うことなく 70% 以上のボリューム圧縮を実現できます。

柔軟性、効率性、使いやすさこそが、PaddlePaddle が人気を博している重要な理由です。数多くの新リリースとメジャーアップグレードの中で、ツールコンポーネントが際立っています。今回、PaddlePaddleはAutoDL Designをオープンソース化しPARLをアップグレードしただけでなく、ワンストップの事前トレーニング管理ツールであるPaddleHubを提案し、リリースしました。

従来のニューラルネットワークの構造設計は、経験に基づいて人間が行い、最適化の結果を得るためにパラメータを継続的に調整してトレーニングします。このプロセスは比較的複雑で、時間がかかり、労働集約的です。 AutoDL Designは、ディープラーニングを活用したネットワーク構造の自動設計で、人間の専門家が設計したネットワークの成果を超えています。アップグレードされた強化学習ツール PARL は、アルゴリズムの範囲、高性能通信、並列トレーニングの面で多くのサポートと拡張を提供しました。 PaddleHub は、事前トレーニング済みモデルの管理、ワンクリックのコマンドライン使用、転移学習という 3 つの主要機能を提供する、シンプルで使いやすい事前トレーニング済みモデル管理ツールです。開発者は、わずか 10 行のコードでモデルの移行を完了できます。

百度はコンピューティングパワーの束縛を打ち破るために開発者に無料のコンピューティングパワーを提供するために1億元を費やしている

ビッグデータ、ビッグモデル、高い計算能力はディープラーニングの発展に不可欠な要素であり、計算能力の重要性は自明です。百度は、一般開発者の計算能力の束縛を打ち破る取り組みの一環として、無料の計算能力に1億元を投資した。馬延軍氏は、百度のワンストップ開発プラットフォームAI Studioがコンピューティングパワー支援計画を開始したことを発表し、「開発者の成功を支援するために、総額1億元のコンピューティングパワーを無償提供する」と述べた。報道によると、無料のコンピューティングパワーは主に2つのモードで提供されます。1つ目は1人1カードモードです。V100トレーニングカードには、16Gのビデオメモリと最大2Tのストレージスペースが含まれています。もう 1 つは、リモートクラスターモードです。PaddlePaddle は、開発者が無料で使用できる高性能クラスターを提供します。

ディープラーニングの標準化、自動化、モジュール化により、人工知能は大規模な工業生産の段階に進み、さらに産業のアップグレードに強力な「支援」を提供しました。北京林業大学はPaddlePaddleをベースに、フェロモントラップ用のインテリジェント昆虫モニタリングシステムを開発し、研究対象はアカカミキリです。この検出システムの適用により、昆虫モニタリングの人件費が大幅に削減されました。以前は手動での検出に1週間の作業が必要でしたが、現在は自動検出により1時間以内に完了できます。中国科学院リモートセンシングおよびデジタルアース研究所は、PaddlePaddle Faster R-CNNモデルを使用し、特徴抽出ネットワークVGG16とRegion Proposal Network（RPN）を組み合わせ、さらに注目メカニズムを統合したDeeplab v3ネットワークを使用して、リモートセンシング画像に対するターゲット検出とセマンティックセグメンテーションを実行し、主要な工事ターゲットと建設用地変更パッチの抽出を実現しました。国が主要プロジェクトに使用する土地の拡大と変更を監視し、土地資源の使用を効果的に管理および制御できるように支援します。

ディープラーニングの発展には、一方では継続的な技術革新とブレークスルーが必要であり、他方では完全かつ健全なエコシステムの構築が必要です。大学に対しては、百度はディープラーニングの教師養成を提供し、共同教育特別基金とAIスタジオ教育版を通じてディープラーニング分野の大学生の人材を育成しています。開発者コミュニティに対しては、PaddlePaddleが無料のオンラインコース、無料のコンピューティングパワーサポート、途切れることのない競争インタラクションを提供し、ディープラーニング技術の発展を継続的に推進しています。企業に対しては、黄埔学院を主催するだけでなく、「AIファストトラック」計画とAI技術エコシステムサポート計画も立ち上げ、1,000社のAI企業を強力にサポートする予定です。

さらに、百度は今回のカンファレンスで、開発者向けにディープラーニングの「江湖」も用意しました。ディープラーニングの「武術の秘訣」を教える公開クラスだけでなく、「実戦」の開発者マーケットも用意されており、「精神力と技術」から「対面での競争」まで、ディープラーニング開発者のニーズを一度に満たすことができます。

1,000人以上の開発者が参加するこのディープラーニング開発者サミットは、中国で前例のないディープラーニングの波を引き起こし、ディープラーニング技術の発展と産業応用を加速させ、歴史に消えない足跡を残すことは間違いないでしょう。

<<: WAVE SUMMIT での Baidu Wang Haifeng: ディープラーニングが人工知能を産業大量生産に導入

>>: モデルを最適化する方法だけを心配する必要はありません。これは機械学習のすべてではありません。