このクラウドは、AIが後半にどのように発展するかを知っている

このクラウドは、AIが後半にどのように発展するかを知っている

今年はAI技術の導入が話題になっています。 AIは本当に実装されているのでしょうか?真実を語るには実際の数値を見る必要があるかもしれません。

IDCが今年7月に発表したレポートによると、中国のAIクラウドサービス市場の年間複合成長率は2018年から2024年にかけて93.6%に達すると予想されている。

もちろん、高い成長率が必ずしも業界の真の繁栄を意味するわけではありません。業界の構造変化を見れば、バランスがどの方向に傾いているかがよりよく説明できます。

Alibaba Cloud は最近、一連の興味深い数字を発表しました。4 年前は、トレーニング タスクがクラウド上の計算能力の 80% 以上を占めていましたが、現在では推論タスクが計算能力の半分以上を占めています。

Alibaba Cloud は、その主な理由は、過去 4 年間に AI 業界で起こった静かな変化であり、クラウドベースの推論に対する需要がトレーニングに対する需要よりもはるかに速いペースで増加していることを明らかにしました。アプリケーション全体の半分以上を占めているという事実は、推論が今後クラウドAIコンピューティングの需要としてより主流になることを示しており、AI業界が起業、研究開発、起業から実際の実装へと移行していることも示しています。

なぜそんなことを言うのですか?

Alibaba Cloud の異種コンピューティング研究開発ディレクターの Long Xin 氏は、トレーニングはバックエンドの研究開発段階であると説明しました。推論は、成熟した製品を大規模アプリケーション向けに市場に売り込むためのものです。この観点から、計算能力がトレーニングにあるか推論にあるかによって、実際にこの製品の AI 技術が大規模に実装され始めたかどうかがわかります。

Alibaba Cloudも一連の数字を明らかにした。クラウドGPUが初めて登場した当時、ビジネスモデルや事業探索を検証するためにコンピューティングパワーをレンタルしていたのは、ほんの一握りのインターネット企業と人工知能技術の新興企業だけだった。現在、AIユーザーはスマート製造、医療、教育など数十の業界をカバーしている。

例えば、今年の流行はオンライン教育などの業界の急速な成長につながりました。 Alibaba Cloud は、オンライン教育が過去 1 年間で異種コンピューティングの需要が最も急速に増加した業界であり、ほぼ 200% 増加したことを明らかにしました。これは、この業界における AI アプリケーションの急速な導入を間接的に反映しています。

「実際、AIはすでに後半期に入っており、推論ビジネスの多様化は、異種シナリオやデバイスの多様化ももたらしています。クラウドゲームと5Gはどちらも現在非常に人気のある分野です。」ロン・シン氏は、クラウド上の異種コンピューティングも、より多くの新興分野を支えていると語った。

AI技術は、もはや一部の人や企業だけのニッチな領域ではなく、従来の産業に浸透し、全面的に開花し始めているところまで来ています。

つまり、AI は、トレーニングを多用する研究開発段階から、トレーニングと推論を同等に重視する実装段階へと移行し、その応用範囲はますます広がっています。

アルゴリズムから「アルゴリズム + 計算力」へ
ディープラーニングに代表されるAI技術は急速に発展しており、コンピューティングパワーの需要も急増しています。 OpenAI の年次レポートによると、AlexNet から AlphaGo Zero まで、最先端の AI モデルの計算能力要件はわずか 6 年で 30 万倍に増加しています。

アルゴリズムは確かに AI 技術の向上の中核ですが、AI を迅速に実装したい場合、最も「単純かつ大雑把な」方法は計算能力を追加することです。今年登場した超自然言語モデルGPT-3はその代表例です。

一方、R&D 活動に近いトレーニング フェーズでは、コンピューティング能力の需要には上限があり、特定のビジネス規模とは直接関係がありません。今日の AI 製品の実装は、フロントエンド ユーザーの規模が拡大するにつれて、対応する推論ビジネス モデルの計算能力に対する需要が直線的、あるいは爆発的に増加することを意味します。たとえば、Alibaba Cloud はかつて、人気の AI 製品向けに数日間のうちに数万個のクラウド GPU を「ポップアップ」し、ユーザーの流入を獲得しました。

「料理が上手な人も、米がなければ料理はできない」コンピューティングリソースを制御するAIインフラは、構想から実装までAIを支える重要な存在となっている。

AI は、単一のアルゴリズム ベースのシステムから、アルゴリズムと計算能力のデュアル コア システムへと徐々に進化してきました。

クラウドは間違いなく、コンピューティング能力を得るための最も便利で柔軟な方法です。クラウドを通じて、企業はいつでも十分なクラウド AI コンピューティング能力を得ることができます。

インフラプロバイダーとして、クラウドコンピューティングは業界の発展のニーズを満たすためにハードウェアを積み重ねる必要があります。しかし、AIコンピューティングパワーを提供することは、単にハードウェアを積み重ねることと同じではありません。包括的なソフトウェアとハ​​ードウェアの技術がなければ、効果は1+1<2にしかなりません。

これらのリソースをどのようにスケジュールし、ユーザーが使用する際のパフォーマンスの低下を解決するかは、クラウド コンピューティング ベンダーが考慮しなければならない問題です。

クラウド異機種コンピューティングの 3 つのフェーズ
これはクラウド AI インフラストラクチャの開発段階から始まります。

AIの効率を最大限に高めることができるコンピューティング方法として、クラウドヘテロジニアスコンピューティングの開発は3つの段階に分けられます。
最初の段階は、異種コンピューティングのニーズが 0 から 1 に変化することです。

2013 年、AlexNet は GPU の助けを借りて 80% の精度を達成し、GPU が AI コンピューティング能力を提供できることを実証し、業界に新たな道を開きました。 Taobao Pailitao、Sina Weiboなどは、機械学習製品の開発にGPUを使用する試みを始めています。 2016年、アリババクラウドは最初の一歩を踏み出しました。それは、主にAIイノベーションを求める最初の一群の顧客のニーズに応えるために、異種コンピューティング事業を立ち上げたことです。この段階での主な問題は、企業の異機種コンピューティング能力の必要性の問題です。

[[361160]]

第二段階はスケールアップです。

2016年にAlphaGoが大きな話題を呼んだ後、ディープラーニングなどのAI技術は研究室から産業界へと移行し始めました。多数のインターネット企業が人工知能アルゴリズムの研究開発に注力し始めるにつれ、AI コンピューティング能力のボトルネックがますます顕著になってきました。

大規模なモデルトレーニングの需要と大規模なコンピューティング能力の需要の高まりにより、大規模で弾力性に優れた高性能のクラウド コンピューティング インフラストラクチャの実装が促進されました。 Alibaba Cloud は、クラウド上で異種コンピューティング能力を大規模に展開し始めました。
アリババクラウドはわずか3年で、1秒あたり100京回の異種演算をサポートできるクラウド上の超大規模異種コンピューティングクラスターを開発しました。これは、1秒間に5億3000万枚以上の画像を理解し、4000万の文章を翻訳し、9万2000時間分の音声を認識することに相当します。

前述の通り、2020年に人工知能業界の転換点が到来し、AIはまさに研究開発や起業から実用化へと移行しました。これにより、異種コンピューティング製品も第 3 段階に進みます。

第三段階は、洗練多様化を特徴とします。

AIが研究開発から実装へと移行するにつれ、トレーニングシナリオはより複雑で多様なビジネスに直面することになります。企業顧客にとって、クラウドコンピューティングの需要は、大規模なコンピューティングパワーから推論コストの削減と極めて迅速な展開へと移行し、シナリオもより多様化します。

これら 3 つの段階の変化は、技術の進歩と産業の発展が共同で推進された結果であることは容易に理解できます。

[[361161]]

ビッグコンピューティング向けのインフラストラクチャを構築する第 2 フェーズは、すべてのクラウド ベンダーにとって必須であると言えます。また、多くのベンダーにとって依然として競争の焦点となっています。

しかし、インフラストラクチャを超えて、AI 実装中にコストをさらに削減し、効率を高めるために、顧客はどのように迅速にリソースを活用できるのでしょうか?

中国のクラウドコンピューティング市場で最大の市場シェアを持つクラウドサービスプロバイダーとして、Alibaba Cloud は、このステップを先導し、次のような答えを出しました。

ソフトウェアとハ​​ードウェアの統合
2017 年、主要なクラウド サービス プロバイダーの間では、ハードウェアとソフトウェアの統合がコンセンサスとなりました。
クラウドコンピューティングの大きな問題の1つである、仮想マシンによるクラウド構築プロセスにおける仮想化によるパフォーマンス損失を解決するために、Alibaba Cloudは2017年9月に第1世代のX-Dragonアーキテクチャを発表しました。ソフトウェアとハ​​ードウェアの設計を組み合わせることで、業界で初めてパフォーマンス損失ゼロを実現しました。海の反対側にある AWS も、2017 年末に同様の製品である AWS Nitro アーキテクチャをリリースしました。

これを基に、Alibaba Cloud ヘテロジニアス コンピューティングは、クラウド リソースをより効率的かつ使いやすくするためのソフトウェア ツールを垂直産業向けにさらに提供します。

たとえば、 Shenlong AI Acceleration Engine (AIACC) は人工知能業界向けに設計されています。

大規模なディープラーニングのシナリオでは、大規模な GPU リソースは運用および保守コストの増大につながるだけでなく、マシンの数が増えるにつれて、異なるマシンの GPU 間の調整が困難になり、単一の GPU カードの使用率が低下します。 AIACC は、通信、帯域幅などを徹底的に最適化することで、リソースのコラボレーションの効率と利用率を向上させることができます。

AIACCの支援により、Alibaba Cloudは今年3月にスタンフォード大学のDAWNBench ImageNetの4つのリストで世界第1位を獲得しました。

実際に実装されたケースに基づいて、AIACC は、クラウド トレーニング シナリオでは 2 ~ 14 倍、推論シナリオでは 2 ~ 6 倍のパフォーマンス向上をお客様に支援できます。
AIチップ分野のユニコーン企業であるHorizo​​n Roboticsは、Alibaba Cloud AIACCチームと緊密に連携し、Alibaba Cloud異種コンピューティングに基づく分散トレーニングのパフォーマンスを4倍に向上させ、Horizo​​n Roboticsのアルゴリズム研究開発の効率を大幅に向上させ、コストを大幅に削減しました。

Alibaba内では、Alibaba Cloud IoTの画像分類事業を例に挙げてみましょう。 AIACC チームは、IoT スマートビジネス R&D チームと協力して、大規模画像分類分散トレーニングのパフォーマンスを 5 倍向上させました。

Alibaba Heterogeneous のもう 1 つのユニークなソフトウェア製品は、シャード cGPU コンテナ テクノロジーです。これにより、顧客はコンテナを通じて基盤となる GPU リソースをスケジュールし、より細かい粒度で GPU の使用をスケジュールし、GPU リソースの使用率を向上させ、コストの削減と効率の向上という目標を達成できます。

アリババクラウドの異種コンピューティング製品責任者であるパン・ユエ氏は、量子ビットにおける「ソフトウェアとハ​​ードウェアの統合」の必要性についてさらに説明した。

計算能力だけの観点から見ると、ハードウェアは道路建設に使われるセメントや石などの基礎に相当します。しかし、基本的なスタッキングだけでは問題を解決するのに明らかに不十分です。

ハードウェア リソースを基盤インフラストラクチャとして使用する場合、基盤となるハードウェアの機能を最大限に活用し、対応する技術的利益を顧客に提供するには、仮想化などのテクノロジをソフトウェア製品の形で反復する必要があります。

ハッシュパワープーリング
ハードウェアとソフトウェアの統合に加えて、Alibaba Cloud の異種コンピューティング製品のもう 1 つの開発トレンドは、コンピューティング パワーのプールであり、これによりコンピューティング パワーのより柔軟なスケジューリング機能がもたらされます。

長い間、ユーザーがクラウド上で GPU コンピューティング能力を選択する場合、仕様比率によって制限されていました。たとえば、メモリと GPU の間には特定の比率がいくつかしかありませんでした。ただし、各 AI 推論モデルに必要なリソース割り当ては大きく異なります。

Alibaba Cloud Heterogeneous Computingは今年、エラスティックアクセラレーテッドコンピューティングインスタンスEAISをリリースしました。ソフトウェアプーリングを通じて、GPU、FPGA、NPUなどの異種アクセラレータとCPU/メモリの分離を実現した国内初のクラウドベンダーです。

EAIS は、顧客に異種コンピューティング パワー プールを提供します。ユーザーは、必要な GPU リソースを任意の Alibaba Cloud ECS サーバーに一致させ、さまざまなアプリケーション要件に応じて CPU/メモリと GPU の比率を柔軟に最適化し、適切なリソースの組み合わせを一致させ、AI 推論の効率を向上させながらコストを大幅に削減できます。

包括的なレイアウト
AI の後半では、そのインフラストラクチャはより豊富で多様である必要があります。

ロン・シン氏は、推論は非常に複雑なビジネスシナリオに直面しており、関連する技術はAIだけにとどまらない可能性が高いと述べた。 C エンド ユーザーが使用する機能には、オーディオとビデオのエンコードとデコード、ディープラーニングなどの複数のテクノロジが統合される場合があります。基盤となるインフラストラクチャとして、異種コンピューティングも多様なニーズに対応する必要があります。

Alibaba Cloud の異種コンピューティングは AI から生まれましたが、すでに AI 以外の分野にも取り組んでいます。

Alibaba Cloud の異種コンピューティング製品がサポートする典型的な事例は、もはや AI 分野に限定されません。

Alibaba Cloud の異機種 GPU/FPGA サーバーは、Tmall Double 11 Gala ライブ ブロードキャストのリアルタイム ビデオ トランスコーディングのサポートに重点を置き、4k、1080p、720p などのさまざまな解像度のトランスコーディング サービスを提供しています。

業界最大のシングルサービス FPGA コンピューティング クラスターにより、Taobao は数百万 QPS を超える画像トランスコーディング処理機能を実現しています。今年初めて、FPGAクラウドサーバーが双十一淘宝の画像トラフィックの100%を処理し、数億元のコンピューティングコストを節約すると期待されています。

クラウド異機種コンピューティングの次のステップ
国内のクラウド異種コンピューティング製品の開発の歴史を振り返ると、Alibaba Cloud は間違いなく最も古いクラウドサービスプロバイダーです。

[[361163]]

アリババグループの研究者であり、アリババクラウドのエラスティックコンピューティング責任者である張先涛氏によると、アリババには豊富な社内事業があり、それがアリババクラウドの技術成果に対する最も直感的な業界洞察を提供しているという。結果的に、アリババクラウドの技術的蓄積はグループの事業にフィードバックされました。

これにより好循環が形成され、Alibaba Cloud はクラウド コンピューティング事業の将来を見据えた計画をしっかりと立てることができるようになります。

では、第 3 段階以降、クラウド異種コンピューティングはどこに向かうのでしょうか。また、Alibaba Cloud はそれをどのように判断するのでしょうか。

アリババクラウドの異種コンピューティング製品責任者であるパン・ユエ氏は、製品の観点から見ると、クラウド異種コンピューティングの今後の発展は間違いなくエコロジカルなプロセスになるだろうと述べた。

一方、Alibaba Cloud などの基盤インフラストラクチャは、業界の ISV (独立系ソフトウェア開発者) やソリューション企業によって統合され、AI などの分野で革新的な実践を可能にしています。

一方で、NVIDIAなどのアクセラレータメーカーとの連携を強化し、アクセラレータハードウェアエコシステムをさらに充実させていきます。

技術的な観点から、アリババクラウドのヘテロジニアスコンピューティング研究開発ディレクターのロン・シン氏は、将来的には単一のアクセラレータではAIやビデオのエンコードとデコードなど多くの分野のビジネスニーズを満たすことができなくなり、アクセラレータのハードウェア統合のトレンドがすでに現れていると述べた。

将来、ヘテロジニアスコンピューティングでは、ソフトウェアプーリングとハードウェアプーリングの分離により、複数のアクセラレータを統合して、AI などの業界のビジネス実装段階におけるより幅広いアクセラレーションニーズに対応できるようになり、新たな技術革命が起こる可能性があります。

これは、次の段階における Alibaba Cloud の主要な探索方向でもあります。

さらに、5Gの導入やビデオなどのビジュアルコンピューティングの需要の高まりにより、クラウドヘテロジニアスコンピューティングはAI分野だけでなく、ビデオやクラウドゲームなど、より多くの業界でより重要な役割を果たすようになります。

<<:  2021年の10のAIトレンド

>>:  「AI+」が世界を変える!さまざまな分野における 5 つの主要な AI トレンド

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能関連のキャリアと給与に関する 7 つの統計

現在、人手不足で高収入の AI 職種は何でしょうか? 需要が高い職種はどれでしょうか? AI はどれ...

...

AIで製造業を解放する: 企業がアプリケーションシナリオを発見し、課題に対処する方法

まとめ現在、さまざまな業界がデジタルビジネスシナリオを実装または強化するために機械学習機能を構築して...

マイクロソフトはソフトからハードへの変革に向けてカスタム AI チップを開発中。その計画とは?

噂は本当で、Microsoft は大規模な言語モデルのトレーニングに使用できるカスタム AI チップ...

蘇寧電子商取引プラットフォームにおけるAI技術+短編動画の応用

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

Java プログラミング スキル - データ構造とアルゴリズム「フィボナッチ検索」

[[398011]]基本的な紹介フィボナッチとは、線分を 2 つの部分に分割し、一方の長さと全体の...

世界のAIチップ投資環境が明らかに、5つのシナリオにチャンスあり

[[241691]]画像出典: Visual China AIチップ投資マップAI チップの設計は、...

...

OpenAI の Whisper モデルを使用して音声をテキストに変換する

翻訳者 |ブガッティレビュー | Chonglou図1. OpenAI Whisperモデルの動作原...

「人工知能+ヘルスケア」が急成長

「人工知能+ヘルスケア」が急速に発展しています。医学は、帰納的論理、経験的学習、証拠に基づく応用に依...

人工知能とビッグデータを完璧に組み合わせる方法

[[271155]]ビッグデータと AI ツールを組み合わせることで、新しい形式の分析と自動化が可能...

「無人運転」の技術的道筋

無人運転車が実際に走行するには、認識、意思決定、実行における技術的な問題を解決する必要があります。 ...

...

人工知能のボトルネックを解決し、フードデリバリー業界の発展を促進

近年、消費者向けインターネットが深化し、産業向けインターネットが徐々に向上するにつれて、さまざまな業...