Huaweiの大型モデルがNature誌に掲載されました!評論家:予測モデルの将来を再検討する

Huaweiの大型モデルがNature誌に掲載されました!評論家:予測モデルの将来を再検討する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これは従来の方法よりも 10,000 倍高速で、24 時間の世界の天気予報を完了するのにわずか 1.4 秒しかかかりません。これがHuawei Cloud のPangu 気象モデルです

本日、ネイチャー誌に掲載されましたが、近年発表されたネイチャー論文の中で、中国のテクノロジー企業が単独署名単位(つまり、ファーウェイクラウドが単独で執筆)となったのは初めてだと言われています。

写真

評論家たちは、このモデルによって人類が気象予報モデルの将来を再検討できるようになると高く評価した。

つまり、これによって、従来の伝統的な方法がもはや効果的ではなくなるということです。

写真

それで、それはどのように開発されたのですか?どのような重要な問題が解決されましたか?具体的な成果と応用は何ですか?

すべて読むにはこの論文に従ってください。

既存のAI天気予報モデルの精度不足の問題を解決

1920 年代以降、特に過去 30 年間のコンピューター処理能力の急速な発展により、従来の数値天気予報は、日常の天気予報、極度の災害警報、気候変動予測などの分野で大きな成功を収めてきました。

しかし、コンピューティング能力の成長が鈍化し、物理モデルがますます複雑になるにつれて、このアプローチのボトルネックがますます顕著になってきます。

その後、研究者たちは、ディープラーニング手法を使用して将来の天気を予測するなど、新しい天気予報のパラダイムを模索し始めました。

Huawei Cloud R&Dチームは2年前にこの分野の研究を開始しました。

中期・長期予測など数値手法が最も広く使用されている分野では、既存のAI予測手法の精度は依然として数値予測手法に比べて大幅に低く、説明可能性の欠如や異常気象の予測の不正確さなどの問題によって制約されていることがわかった。

AI 天気予報モデル精度が低い主な理由は 2 つあります。

まず、既存の AI 天気予報モデルは 2D ニューラル ネットワークに基づいており、不均一な 3D 天気データをうまく処理できません。

第二に、AI 手法には数学的および物理的なメカニズムの制約がないため、反復プロセス中に反復エラーが蓄積され続けます。

ここで、Huawei Cloud の研究者は、複雑で不均一な 3D 気象データを処理する3D Earth-Specific Transformer (3DEST)を提案し、Pangu 気象モデルを作成しました。

主なアイデアは、複雑で不均一な気象要素を処理するためにビジュアルトランスフォーマーの 3D バリアントを使用し、階層的な時間領域集約戦略を使用して、異なる予測間隔(1 時間間隔、3 時間間隔、6 時間間隔、24 時間間隔)を持つ 4 つのモデルをトレーニングすることです。これにより、特定の時間の気象条件を予測するための反復回数が最小限に抑えられ、反復エラーが削減され、再帰トレーニングによるトレーニングリソースの消費が回避されます。

各モデルをトレーニングするために、研究者らは1979年から2021年までの気象データを使用し、1時間ごとにサンプリングして100エポックにわたってトレーニングした。

各モデルには、192 枚の V100 グラフィック カードで 16 日間のトレーニングが必要でした。実際、100 エポック後でも、これらのモデルはまだ完全に収束していません。

つまり、十分なコンピューティングリソースがあれば、AI 予測の精度をさらに向上させることができます。

最終推論中、Pangu気象モデルは、V100グラフィックカードで1.4秒間実行するだけで、電位、湿度、風速、温度、海面気圧などを含む24時間の世界の天気予報を完了できます。水平空間解像度は0.25∘×0.25∘に達し、時間解像度は1時間で、13の垂直層をカバーし、きめ細かい気象特性を正確に予測できます。

従来の数値予測方法を上回る精度を持つ初のAI手法であり、その計算速度は従来の数値予測方法の10,000倍以上です。

複数の下流シナリオに直接適用可能

今年5月、台風マワの進路が大きな注目を集めた。

中央気象局は、ファーウェイのクラウドパングービッグデータが「マバ」の進路予測で優れた性能を発揮し、5日前に台湾島東側の海上に方向を変えると予測したと発表した。

写真

第19回世界気象会議において、欧州気象庁もファーウェイのクラウドPangu気象モデルが精度において紛れもない能力を持っていると指摘した。純粋にデータ駆動型のAI気象予報モデルは、欧州中期予報センターの運用数値モデルに匹敵する予報能力を実証した。

欧州中期予報センター所長フローレンス・ハビエ氏は、ファーウェイクラウドPangu気象モデルと欧州中期予報センターのリアルタイム運用テストの比較を詳細に説明しました。

AI が異常気象を捉える能力を探るため、今年 2 月にフィンランドで -29°C の寒波が観測された事例を研究したところ、Pangu がこの現象の深刻さを早い段階で認識していたことがわかりました。

写真

フローレンス・ハビエ氏はまた、AI予測手法は大規模なスーパーコンピューティングリソースを必要としないため、消費リソースが少なく、発展途上国にとって重要な機会になると強調した。また、AI予測手法は世界的な予測能力を高める貴重な機会も提供する。

ファーウェイクラウドがAI天気予報の分野を「ブレークスルー」として選んだ理由について、一方では天気予報、特に大雨、台風、干ばつ、寒波などの異常気象の正確な予測は、世界中の人々の生活に関係している。他方では、天気予報の問題は非常に複雑である。AIは膨大なデータから大気の進化の新たな法則を掘り出すことができ、精度と速度の向上に大きな可能性を秘めている。

世界気象機関(WMO)がまもなく発表する2024~2027年の戦略計画には人工知能の要素が取り入れられ、気象科学技術の発展を促進する上で重要な力となることが分かっている。

WMOはまた、ナウキャスティングや数値天気予報などの分野でのAIの実証応用を積極的に推進し、人工知能製品の応用に関する国際比較プラットフォームを構築し、AI気象応用の標準とガイドラインを策定し、人工知能データセットの共有やその他の関連作業を促進し、気象分野におけるAIの応用可能性を探求して発揮し、国家の早期警報イニシアチブを効果的にサポートします。

未来への3つの鍵

最後に、Huawei Cloud Pangu 気象モデル チームは AI 天気予報の将来をどのように見ていますか?

答えは次の 3 つの重要なポイントにあります。

まずビッグデータ。膨大な気象データは AI モデルの基礎です。現在の Pangu 気象モデルは ERA5 再解析データの一部のみを使用しています。将来の AI モデルは、より大規模で詳細な地球観測データに基づくものになります。

2番目は、高い計算能力です。気象データの超高解像度は、AIモデルのトレーニングに大きな課題をもたらします。Pangu気象モデルの現在の入力解像度は1440×720×14×5で、これはコンピュータービジョンタスクで一般的に使用される224×224×3の解像度の約500倍です。解像度がさらに高くなり、モデルが大きくなると、必要なコンピューティングパワーリソースも急速に増加します。

最後に、大きなモデル。複雑な気象法則、超高解像度、膨大な量のデータにより、AI 天気予報には極めて計算複雑度の高い AI モデルの使用が必要になります。
同時に、最先端の AI 天気予報モデルを継続的に反復するには、安定したクラウド環境、作業スイート、およびそれに応じた運用と保守も不可欠です。

論文アドレス: https://www.nature.com/articles/s41586-023-06185-3

<<:  データ分析は一文で完了します。浙江大学の新しいビッグモデル データ アシスタントを使用すると、データ収集の手間が省けます。

>>:  効率的なコーディングのための 5 つの IntelliJ IDEA プラグイン

ブログ    
ブログ    

推薦する

世界中の経営幹部の93%がAIに期待を抱いているが、65%はまだその恩恵を受けていないと答えている。

[[280194]]最近の調査、研究、予測、および AI アプリケーションの進捗状況と状況に関する...

...

Google I/O 2018 に注目: AI に始まり、AI に終わる

北京時間9日午前1時(米国現地時間5月8日午前10時)、カリフォルニア州マウンテンビューで2018 ...

...

...

...

機械学習の基礎チャート: 概念、原則、歴史、トレンド、アルゴリズム

1. 機械学習の概要1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば、猫...

Facebook、AIが著作権侵害を正確に識別できるようにソースデータ拡張ライブラリを公開: 100以上の拡張方法が提供される

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIはデジタル変革をどのように変えるのでしょうか?

人工知能は、企業のデジタル変革の方法を変え、効率性、俊敏性、顧客中心の機能を最前線にもたらします。要...

機械学習プロジェクトにおけるデータの前処理とデータ ラングリング

要点一般的な機械学習/ディープラーニング プロジェクトでは、データ準備が分析パイプライン全体の 60...

AIストレージアーキテクチャの構築方法

今日、データの処理と保存に関する懸念が高まっています。生成されるデータの量、データが作成される場所、...

TCPとUDPの違いと、フロー制御、輻輳制御、高速再送、高速回復アルゴリズムの詳細な説明

[[413351]] UDPとTCPの違い前回の記事では、TCP の接続を確立するための 3 ウェイ...

パフォーマンスは 5000 個の H100 でトレーニングされた GPT-4 に近いです。 DeepMindが新世代の大規模モデルを共同開発

最近、InflectionAI は新しい AI モデルをリリースしました。さらに衝撃的なのは、Inf...

...

梅の花の山の上を歩くロボット犬?自転車は自分でバランスをとることができますか?テンセント・ロボティクスXラボ研究初の「開封」

テンセントは11月20日、移動ロボット研究における新たな進展を発表し、四足移動ロボット「ジャモカ」と...