国産ディープラーニングフレームワーク「MegEngine」が3月末にオープンソース化

国産ディープラーニングフレームワーク「MegEngine」が3月末にオープンソース化

2020 年にどのディープラーニング フレームワークを選択すべきでしょうか?今、新たな選択肢があります。信頼できる情報筋によると、Megvii Brain++ のコアディープラーニングフレームワークは 3 月末にオープンソース化される予定です。 Megvii は、強力なコンピューティング能力、さまざまな SOTA モデル、フレームワーク リソースをオープンかつ開放的な方法ですべての開発者、大学の教員、学生に提供します。

中国人が独自に開発し、Megvii の先進技術をすべてサポートしたこのフレームワークは、大きな注目を集めることになるだろう。

MegEngine を紹介する前に、Megvii の人工知能アルゴリズム プラットフォームである Brain++ を紹介する必要があります。 Megvii の主任科学者であり Megvii 研究所所長の Sun Jian 氏はかつてこう語った。「Megvii Brain++ は大規模なアルゴリズムのトレーニングを可能にします。」簡単に言えば、アルゴリズムを大量生産できる Brain++ を持つことは、Megvii にとって生産性の飛躍的向上です。 Megvii の開発者が、開拓段階から近代化プロセスに迅速に移行できるようにします。

Megvii Brain++は、大きく分けて3つの部分に分かれています。まもなくオープンソース化されるディープラーニングアルゴリズム開発フレームワークMegEngineが中核となり、コンピューティングパワーのスケジューリングサポートを提供するディープラーニングクラウドコンピューティングプラットフォームMegCompute、そしてデータサービスと管理を提供するデータ管理プラットフォームMegDataが続きます。コンピュータービジョンからスタートしたMegviiが急速に発展し、AIコンペティションで繰り返しトップに立つことができたのは、Brain++を通じてアルゴリズムの革新において小さな一歩と自立性を達成したからだ。さらに研究を進めると、その成功の最も根本的な理由は、Megviiのコアフレームワークが実に並外れていることだ。

しかし、さまざまなメーカーが AI ツールをオープンソース化し続けている中、Megvii はどのような考慮をしながら、その「切り札」をコミュニティ全体に売り込んだのでしょうか?これは、ディープラーニング フレームワークの開発の歴史から始まる必要があります。

国内ディープラーニングフレームワークへの道

フレームワークとは何ですか?つまり、先人たちがすでに道を切り開いており、後世の人々はただその道を辿ればいいのです。

ご存知のとおり、人工知能は60年以上前から存在しており、ディープラーニングの出現により、人工知能業界の発展曲線は新たな転換点を迎えました。しかし、初期の開発者には従うべき「先人の道」がありませんでした。ディープラーニングの初期の頃は、Theano などのベテラン フレームワークが強力なニューラル ネットワークの最初のバッチの作成を導いてくれました。その後、TensorFlow などの後継フレームワークにより、ニューラル ネットワークの作成は徐々にビルディング ブロックと同じくらい簡単になりました。

ディープラーニングの最初の先駆者の多くは海外の著名な学者であり、彼らが依存していたディープラーニングのフレームワークもほとんどが海外の開発者によって作成され、維持されていました。当初はモントリオール大学とバークレー大学が提案したTheanoやCaffeフレームワークから、現在ではGoogleやFacebookが保守するTensorFlowやPyTorchまで、ディープラーニングフレームワークの主流は学術機関からテクノロジー大手へと移行しています。

フレームワークは基本的にオープンソースなので、国内のテクノロジー企業は独自に開発する必要があるのでしょうか?答えはイエスです。DLフレームワークが大学から企業に移行した理由は、AIが象牙の塔の知識に限定されず、現実世界のシナリオの問題に向けられなければならないためであり、生産現場で使用でき、さまざまな実用的なビジネスに適用できるためです。中国には技術的に先進的なテクノロジー企業が数多く存在し、それぞれに独自のビジネスシナリオと問題を抱えています。これにより、独立したディープラーニング フレームワークを開発し、より完璧なハードウェアおよびアルゴリズム システムを構築する機会が生まれます。 Baidu のオープンソース PaddlePaddle は、自然言語処理などの面で優れた蓄積があり、Huawei が間もなくオープンソース化する Mindspore は、ソフトウェアとハ​​ードウェアの連携とモバイル展開の能力を重視しています。

オープンソースツールの選択は、「最高のコンピュータ言語は何か」という質問に似ています。開発者にはそれぞれ好みや不満があります。現状では、PyTorchとTensorFlowが最も人気があることは間違いありません。また、国産フレームワークの開発も活発に行われています。

しかし、コンピュータービジョン技術における世界有数のスタートアップ企業である Megvii Research Institute は、AI 技術や製品の開発に TensorFlow や PyTorch を使用したことはありません。 Megvii が設立された当初は、AI 開発ツールが不足していました。Megvii は先駆者としてのプロセスを通じて独自のアプローチを確立し、使いやすいツールセットを開発しました。

2014年、Megvii研究所はBrain++のコアエンジンであるMegEngnieを構築し、社内でこのアルゴリズムフレームワークの使用を推進しました。 Megvii は多数のコンピューター ビジョン タスクとビジネス シナリオで経験を積んできたため、このディープラーニング フレームワークは Megvii で磨き上げられてきました。Megvii には 1,400 人以上の研究者がおり、全員が独自のフレームワークを使用してアルゴリズムをトレーニングおよび展開しています。新入生でもすぐに学習して Megvii の R&D エコシステムに統合できます。

Megviiのディープラーニングフレームワーク、MegEngine

Megvii がクラウド、エッジ、モバイル端末に展開できる一連のディープ ニューラル ネットワークを開発したのは、まさに同社の研究開発プロセス全体にわたるこのフレームワークに依存しているからだと理解されています。その中でも、業界に大きな影響を与えているのがShuffleNetです。これは、ARMベースのモバイルデバイス上でAlexNetよりも20倍高速に実行でき、GoogleのMobileNetよりも効率的である、非常に効率的で軽量なモバイル畳み込みニューラルネットワークです。

現在、MegEngine は 5 年以上にわたって改良されてきました。Megvii はディープラーニング フレームワークに基づいて、この AI 開発ツールをツール スイートにアップグレードし、データ管理とコンピューティング リソースの調整をフレームワークと統合したプラットフォーム、Brain++ が誕生しました。少なくとも Megvii にとって、この 3 in 1 アルゴリズム プラットフォームは、AI エンタープライズの生産性を向上させるための基盤です。

まさにこのようなエンドツーエンドのソリューションにより、Megvii は世界中のさまざまな人工知能コンテストで繰り返し優勝してきました。2017 年から 2019 年にかけて、Megvii は COCO チャンピオンシップを 3 回連続で優勝しました。 COCO は、人工知能の分野で最も影響力のある一般物体検出チャレンジであり、コンピューター ビジョンの分野で高い評価を得ています。

Megvii の生産性プラットフォームの効率性と使いやすさは実践から生まれています。ビジネスの真のニーズに基づいたフレームワークを構築することが、より現実的なアプローチです。国内の主要な自律型AIフレームワークは、積極的にその方向性を模索しています。開発者にとっては、探索の結果に基づいて、国内のビジネスシナリオに最も適した有用なアルゴリズムを作成できます。自律型AIフレームワークが意義深いものであるからこそ、Megviiのような企業の取り組みは国からも支援を受けている。

2019年8月、WAIC人工知能カンファレンスにおいて、MegviiはHuawei、JD.com、中国平安、Xiaomiなどの企業とともに国家人工知能オープンイノベーションプラットフォームに選ばれました。画像認識の面では、科学技術部は、Megviiが独自に開発した人工知能アルゴリズムプラットフォームBrain++と統合機能に基づいて、「画像認識のための国家新世代人工知能オープンイノベーションプラットフォーム」を構築すると発表した。このプラットフォームは全国の科学研究者に公開され、クラウド、モバイル、エッジコンピューティングプラットフォームでの高度なディープニューラルネットワークの展開の実現に役立ちます。

軽量、便利、経済的なMegEngineは、個人使用からオープンソースへと移行しています

Megvii 社内の研究開発担当者によると、自身の経験に基づき、MegEngine は先進的なアーキテクチャを備え、統合されたトレーニングと推論をサポートしています。開発者は最新のテクノロジー、最も合理的な API、最もユーザーフレンドリーなプレゼンテーション方法を使用して、独自のアイデアを実現できます。パフォーマンスと使いやすさの面で独自の機能を備えています。

現在、MegEngine は主に Megvii の内部アルゴリズム開発作業、特にコンピューター ビジョンの高度な最適化と大規模な分散トレーニングをサポートしています。 5 年間の産業実践と数百の競技会での検証を経て、MegEngine は徐々に成熟し、いくつかの独自の機能が徐々に登場しています。

まず、計算速度の面では、MegEngine は高性能コンピューティング コアを備えており、動的コンピューティングと静的コンピューティングを組み合わせたメモリ最適化メカニズムにより、計算速度が速くなり、メモリ リソースの占有量が少なくなります。次に、使いやすさの面では、MegEngine はプラットフォームの詳細をカプセル化し、インターフェイスは PyTorch と互換性があるため、新しいユーザーはすぐに使い始めることができます。最後に、MegEngine はさまざまなハードウェア プラットフォームと異種コンピューティングもサポートしています。フレームワーク全体をトレーニングと推論の両方に使用できるため、モデルを一度トレーニングして複数のデバイスに展開することができ、不要な変換プロセスによるパフォーマンスの低下や精度の低下を回避できます。

MegEngine は、上記の性能に加え、IoT やビジュアルタスクに特に最適化されており、さまざまなチップを幅広くサポートしているとも言われています。最先端の定量コンピューティング サポートにより、8 ビット未満のネットワーク推論をサポートしながら、統一された量子化モデルを通じて複数のデバイスをサポートできます。

大手コンピュータービジョン企業およびAIユニコーンとしての地位を確固たるものにしたMegviiは、AI業界でこれまで多くの困難を乗り越えてきました。現在、同社は得意とするオープンソースやオープン開発ツールを通じて次世代に恩返しをし、大学の教員や学生、伝統産業や中小企業の人工知能アルゴリズム開発を支援し、伝統産業と人工知能技術の融合の敷居を下げ、より多くの人々が人工知能エコシステムの構築に参加するよう促したいと考えています。

アクセンチュアが最近発表した「人工知能:中国の経済成長の原動力」レポートによると、2035年までにAIは中国の年間経済成長率を6.3%から7.9%に引き上げると予想されています。将来、人工知能は経済発展に貢献し、その過程で私たちはますます独自のコア技術を習得するでしょう。

MegEngine のオープンソース化は、その始まりとなるかもしれません。

<<:  10行のコードで物体検出を実行する方法

>>:  顔認識アプリケーションにおける人工知能の利点と欠点についての簡単な説明

ブログ    
ブログ    
ブログ    

推薦する

中国の新世代人工知能レポートが発表:中国はAI論文数で世界一

[[266390]] 5月24日、浦江イノベーションフォーラムで「中国の新世代人工知能発展報告書20...

デジタル時代において、クラウドインテリジェンスはクラウドの未来を再定義します

[51CTO.comからのオリジナル記事] デジタル時代において、人工知能の普及はクラウドコンピュー...

無駄な文化に抵抗しましょう!チューリング賞受賞者のジューディア・パール氏と21人の学者が共同で公開書簡を発表

2020年末、チューリング賞受賞者のジュディア・パール氏、機械学習の専門家ペドロ・ドミンゴス氏、量子...

サイバーセキュリティにおける人工知能の応用

1956年、ダートマス大学で開催された会議で、コンピューターの専門家であるジョン・マッカーシーが初め...

新時代の人工知能の優位性を獲得し、時代に淘汰されないためにはどうすればよいか

企業で人工知能が応用され、開発されるにつれて、ビジネスリーダーは市場競争力を向上させるためにクラウド...

AIチップと人工知能産業は密接に連携している

[[355495]]人類社会は情報化から知能化へと移行しています。人工知能は知能化を実現するための重...

Zoomに狂った外国人がビデオ会議ロボットを開発、同僚たちはすでに大笑い

[[321983]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

あなたが言う、私が描く、あなたが描く、私が言う:ERNIE-ViLG、世界最大の中国語クロスモーダル生成モデル

テキスト生成画像に関しては、Wenxin ERNIE-ViLG はユーザーが入力したテキストに基づい...

このロボットは食べられますか?科学者は副作用なく食べても安全だと言っている

ロボットを食べるというのはあまり魅力的に聞こえないかもしれないが、近い将来、食べられる機械があなたの...

...

Java 配列から HashMap へのアルゴリズムの説明

1. 配列とは何ですか?どの本にこのような文章があったか忘れましたが、「すべてのデータ構造は配列の進...

...

人工知能について知っておくべきことすべて

人工知能とは何でしょうか? この質問に対する答えは、誰に尋ねるかによって異なります。 1950 年代...