NIOにおける時系列予測アルゴリズムの応用の検討

NIOにおける時系列予測アルゴリズムの応用の検討

1. 事業背景

1. NIOの紹介

2014 年 11 月に設立された NIO は、ハイエンドのスマート電気自動車市場の先駆者でありリーダーです。 NIOの使命は楽しいライフスタイルを創造することです。 NIOは、スマート電気自動車を起点に、ユーザーとともに喜びを分かち合い、成長していくコミュニティの構築を目指しています。

NIO はコミュニティを中心に 5 つの主要な事業セグメントを展開しています。

  • NIOハウス
  • NIOライフ
  • NIOパワー
  • NIOサービス
  • NIO認定

NIOは、世界規模の革新的なスマートエネルギーサービスシステムの構築を目指しています。この記事では、NIO Power事業に焦点を当てます。 NIO Powerはモバイルインターネットを基盤とした充電ソリューションで、充電・交換設備のネットワークを広く展開しています。NIOクラウドテクノロジーを基盤に、「充電・交換・アップグレード可能」なエネルギーサービスシステムを構築し、主に家庭用充電スタンド2.0、家庭用急速充電スタンド、スーパー充電スタンド、バッテリー交換スタンド、ワンクリック充電など、あらゆるシーンの充電サービスを自動車所有者に提供しています。ユーザーはNIO APPの充電マップから充電リソースを検索できます。

NIOは、6人乗りスマート電動フラッグシップSUV ES8、中大型5人乗りスマート電動SUV ES7(またはEL7)、5人乗りオールシナリオスマート電動SUV ES6、5人乗りスマート電動フラッグシップクーペSUV EC7、5人乗りスマート電動クーペSUV EC6、スマート電動フラッグシップセダンET7、中型スマート電動セダンET5など、豊富な車種システムを持っています。

2. 時系列予測の背景

時系列予測の場合、最初に答えなければならない質問は、「時系列データとは何か」ということです。

時系列データとは、時間の経過とともに順序が変化するデータです。時系列分析には通常、時間領域と周波数領域の 2 つの分析方法が含まれます。時系列予測の本質は、時間領域と周波数領域における時系列の変化の固有の法則を調査することです。

下の図は時間領域を示しています。水平軸は時間、垂直軸は測定された信号の値です。時間領域は、時間の経過に伴うシーケンスの変化を最も直感的に反映できます。

時間領域分析には通常、サイクル、季節、トレンドの 3 種類のルールが含まれます。

  • 周期性: 上昇と下降を繰り返し、元の状態に戻ります。
  • 季節性: 固定された頻度の上昇と下降、ほとんどが事前要因。
  • トレンド: 長期にわたって成長または下降を維持すること。

時系列解析のもう 1 つの方法は、周波数領域解析です。下の図は、シーケンスの周波数の変化を反映した時系列の周波数領域を示しています。横軸は信号の周波数、縦軸は信号の振幅やエネルギーなどの物理量です。

周波数領域解析にはスペクトル密度と呼ばれる重要な概念があり、その中心となる考え方は、信号がいくつかの主要な周波数の重ね合わせで構成されているというものです。

  • スペクトル密度:信号はいくつかの主な周波数で構成されます。


上記の考え方は、時系列の主成分分解など、他の分野でも頻繁に使用されます。

3. バッテリー交換ステーションの需要予測

(1)共通タスク

時系列予測の一般的なタスクは、入力変数の数、出力シーケンスの長さ、出力シーケンスの時間範囲の 3 つの次元に分けることができます。

① 入力変数の数に応じて、以下が含まれます。

  • 単変量: 単一の変数
  • 多変量: 少なくとも2つの変数

② 出力シーケンスの長さに応じて、次のものが含まれます。

  • 単一出力: 予測長は1
  • マルチ出力: 予測長が 1 より大きい

③出力シーケンスの時間範囲に応じて分割され、以下が含まれます。

  • 短期予測
  • 中期予測
  • 長期予測

さらに、出力変数も単一変数と複数変数に分けることができ、この方法では、処理のために前述の複数の異なるタスクに分割できます。

NIO 充電マップを通じて近くの充電リソースをチェックして、燃料補給よりも充電の方が便利になります (以下のリンク)。

https://chargermap.nio.com/pe/h5/static/mchargermap/?btn=rounded&channel=vxofficial&wv=lg

(2)応用シナリオ

上図に示すように、全国1,000以上のバッテリー交換ステーションの予測を行う必要があります。予測の適用シナリオは主に次のとおりです。

①新駅の立地選定

新しく建設されるバッテリー交換ステーションの場合、バッテリー交換ステーションに最適な場所を選択するために、さまざまな住所での需要を予測する必要があります。

②オフピーク充電

バッテリー交換ステーションの目的は、充電量が少ないバッテリーを交換し、完全に充電されたバッテリーを交換することです。

電力網は1日24時間の中でピーク時、谷間時、平らな時間帯の電気料金に差があるため、「谷間」時間帯にできるだけ多くの電気を充電すれば、電気料金のコストも削減されます。

③バッテリースケジューリング

バッテリーは取り外し可能なので、ユーザーの日常および休日の旅行時のバッテリー交換のニーズを満たすには、バッテリー交換ステーションの実際のニーズに応じてスケジュールを設定する必要があります。

(3)事業要件

上記のアプリケーション シナリオに基づいて、次のビジネス要件が発生します。

  • 短期予測: 今後 24 時間の注文量を予測します
  • 中期予測: 今後30日間の注文量を予測します
  • 長期予測: 今後 12 か月間の注文量を予測します

(4)アルゴリズム課題

上記の 3 種類のビジネス要件に基づいて、次の 3 種類の Seq-to-seq ベースのアルゴリズム タスクに変換されます。

  • 多変量多出力短期予測
  • 多変量多出力中期予測
  • 多変量多出力長期予測

2. 主な課題

1. 複数の系列の複雑な季節性

(1)バッテリー交換ステーションによって手順が異なる

下の図に示すように、異なるバッテリー交換ステーションに対応するシーケンスの周期は異なります。

明らかに、バッテリー交換ステーション A、バッテリー交換ステーション B、バッテリー交換ステーション C の毎日の周期的な変化は異なります。

(2)系列間の季節性の不一致

周期性に加えて、季節性はバッテリー交換ステーションのシーケンスによって異なります。

明らかに、同じ休日でも、バッテリー交換ステーション A、バッテリー交換ステーション B、バッテリー交換ステーション C の季節性は異なります。

2. 時間特性のドリフト

(1)休日の時間は決まっていない

春節などの主要な祝日の日付は、年によって固定されていません。

(2)予測には事前の時間がある

従来の教師あり学習では、X 変数に基づいて y を予測しますが、これは f(X) 問題です。時系列予測では、将来の時間変動変数 t がわかっているため、f(X,Xy) 問題になります。

前述のように、休日の時間は固定されていないため、従来の教師あり学習は適用できず、予測の事前時間が特に重要になります。

3. 成長と競争

(1)電力住宅利用者の増加

パワーゾーンルームは、一般的にバッテリー交換ステーションから3km以内に設置されており、カバーするユーザー数は継続的に増加しています。

(2)バッテリー交換ステーション間の競争

バッテリー交換ステーションの新設・廃止は、ユーザーに影響を与え、周辺エリアの注文数の急激な変化につながります。したがって、成長と競争の両方が非常に重要な要素となります。

3. アルゴリズムの練習

1. システムアーキテクチャ

まず、アルゴリズム システム アーキテクチャの一般的な状況を紹介します。

(1)データ

  • データはデータ ウェアハウスに保存されます。
  • 収集されるデータは主に属性データ、操作データ、注文データ、ユーザーデータ、車両データ、気象データ、その他の一般データが含まれます

(2)特徴

  • 特徴エンジン: 主に分布、周期性、および関連変数を含む
  • 埋め込みエンジン: 主に従来のトークン、値、位置、時間、その他の埋め込みが含まれます

(3)モデル

  • 特徴エンジンは機械学習モデルに役立ち、埋め込みエンジンはディープラーニングに役立ちま す。
  • モデル アルゴリズムの進化パスは、ARIMA、Prophet、LGB、TCN、CRNN、Informer、DCN などです。

(4)組み合わせ

  • モデル効果を向上させるために、元のモデルに基づいていくつかのモデル融合が実行されます。
  • これには、最大値、平均、最小値などの統計コンポーネントと、LR、SVM、GBDT、DQN などのモデル コンポーネントの 2 つの部分が含まれます。

(5)サービス

  • アルゴリズム展開プラットフォームを通じて、上記のコンポーネントとサービスが生成され、オンライン化されます。

2. 機械学習モデル

時系列予測モデルの場合、一般的に使用される機械学習モデルには、主に ARIMA、Prophet、LGB の 3 つのカテゴリが含まれます。これら 3 種類のモデルの利点と欠点は次のとおりです。

(1)有馬

①メリット

  • シンプルで使いやすく、説明もわかりやすいです。
  • データ量の要件は低いです。
  • 計算速度が速く、各ステーションごとにオンラインフィッティング推論を行うことができます。

②デメリット

  • 単一の変数のみがサポートされます。
  • 機能エンジニアリングは不可能です。
  • 精度が低い。

③適用シナリオ:プロジェクトのコールドスタート

(2)預言者

①メリット

  • シンプルで使いやすく、説明もわかりやすいです。
  • データ量の要件は低いです。
  • 計算速度が速くなり、各ステーションごとにオンラインで推論を適合できます。

②デメリット

  • 単一の変数のみがサポートされます。
  • 機能エンジニアリングは不可能です。
  • 精度は低いです。

③適用可能なシナリオ:プロジェクトの初期反復

(3)LGBT

①メリット

  • 精度率が高くなります。
  • シンプルで使いやすく、説明もわかりやすいです。
  • バッチ予測とより高速な計算速度をサポートします。

②デメリット

  • モデルを反復することは、機能を反復することと同じです。
  • 反復機能にボトルネックがあります。
  • カテゴリ機能の使用が不十分です。

③適用シナリオ:プロジェクトの中期反復

3. ディープラーニングモデル

前述の通り、機械学習の操作性やモデル効果には限界がありボトルネックに遭遇するため、ディープラーニングモデルが導入されます。

① ディープラーニングモデルアーキテクチャ

時系列予測タスクに関係する CNN、RNN、および Transformers モデルはすべて、統一されたアーキテクチャを持つ生成モデルです。このアーキテクチャには、次の図に示すように、埋め込みエンジンとエンコーダー/デコーダーという 2 つの主要な部分があります。

  • TCNモデルのエンコーダとデコーダは主に1D畳み込みネットワークである。
  • CRNN モデルのエンコーダーとデコーダーは、主に 1D 畳み込みネットワークと RNN ネットワークです。
  • インフォーマーモデルのエンコーダーとデコーダーは主にトランスフォーマーネットワークである。
  • DCNモデルのエンコーダとデコーダは主に2D畳み込みネットワークである。

② 埋め込みエンジンの設計

システム アーキテクチャの埋め込みエンジンには、主にトークン埋め込み、値埋め込み、位置埋め込み、時間埋め込みの 4 つの部分が含まれます。これらの 4 つの部分は、異なるデータまたは機能を対象としています。トークン埋め込みは属性変数を対象とし、時間埋め込みは時間関連の変数を対象とし、値埋め込みと位置埋め込みはその他の関連変数を対象とします。最後に、上記の 4 種類の埋め込みを重ね合わせて融合し、高密度の特徴ベクトルを取得します。

以下では、これら 4 種類の埋め込みについて詳しく紹介します。

  • トークンの埋め込み

トークン埋め込みは主にマルチシーケンス問題を解決するために使用されます。

トークンは自然言語処理でよく見られ、「単語」のデジタル表現です。ここでは、トークンは属性変数を表現するために使用されます。

具体的には、教師あり学習における変数 X と y のセットに対して、バッテリー交換ステーション A からのものかバッテリー交換ステーション B からのものかを示す属性変数を追加する必要があります。したがって、この問題を解決するにはトークン埋め込みが必要です。

主に使用する属性変数には、バッテリー交換ステーション自体の特性、バッテリー交換ステーションが属するエリア(都市部または都市間にある)、バッテリー交換ステーションの所在地(ショッピングモール、サービスエリア、観光地などに建てられている)、その他のビジネス関連および固有の属性が含まれます。

  • 価値の埋め込み

価値の埋め込みは主に競争と成長に関連する問題を解決するために使用されます。

バッテリー交換ステーションの近くに新しいステーションが建設されたり、ステーションがオフラインになったりすると、そのバッテリー交換ステーションの注文が突然変化することがよくあります。このような競争と成長は、見落とされがちな関連変数です。したがって、単一のシーケンス次元だけでなく、地域次元も包括的に考慮する必要があります。ユーザーの視点から見ると、車両やバッテリーの種類(標準航続距離または長距離航続距離)に応じてユーザーを区別し、地域内のバッテリー交換ステーションの数と注文量をカウントして集計し、Value Embeddingを形成します。

  • 位置埋め込み

位置埋め込みは主に複雑な季節の問題を解決するために使用されます。

たとえば、同じ建国記念日であっても、バッテリー交換ステーションによって順序の変更は大きく異なります。異なる変化位置を把握するためには、トランスフォーマーに似た位置埋め込み法を使用して、異なる季節性における異なるシーケンスの変化位置をマークする必要があります。

  • 時間的埋め込み

時間的埋め込みは主に 2 つの問題を解決するために使用されます。1 つは不安定な休日時間の問題であり、もう 1 つは事前時間の問題です。

不規則な休日という最初の問題については、私たちの休日には太陽暦の休日と太陰暦の休日の両方が含まれます。シーケンスの期間は、時間、日、週、月、年などの定期的な期間に分けることができます。休日時間の調整方法には、ハード調整とソフト調整があります。ハード アライメントは主に、シーケンスを週、月、年などでアライメントすることを指します。一方、ソフト アライメントは主に、シーケンスに対してフーリエ変換を実行し、シーケンスの主な周波数を見つけ、シーケンスの周波数領域情報を利用してアライメントすることを指します。

2 回目の事前問題では、下の図に示すように、予測時間データはわかっていますが、その他の関連する入力変数は不明であるため、入力データの次元に矛盾が生じます。

上記の問題に対して、他の未知変数を埋め込むことで入力データの次元を一致させ、位置マークに応じて既知変数と未知変数を区別することで、最終的に出力予測変数を得ることができます。

③畳み込みモジュール設計

DCN 部分の畳み込み層の設計では、まず次の考慮事項に直面します。入力シーケンスの長さが L に等しく、i 番目の畳み込み層の畳み込みカーネル サイズが 2i+1 に等しく、ステップ サイズが 1 に等しいと仮定すると、必要な畳み込み層の数はいくつでしょうか。

ここでは 2 つの概念が関係しています。

  • 因果畳み込み。
  • 時系列自体には因果関係があり、つまり、ある時点 t では過去の情報しか得られず、将来の情報は得られません。
  • 下の図に示す片側畳み込みを使用して、シーケンスの時間的因果関係を確認します。
  • 受容野。
  • 受容野とは、主に、特徴点を元の入力にマッピングすることによってカバーされる範囲を指します。
  • 畳み込みニューラル ネットワークが入力時系列の長さの範囲をカバーできることを確認する必要があります。
  • 受容野は以下の表を使用して計算できます。ここで、n は設定する必要がある畳み込み層の数です。

畳み込み層の数が決定され、畳み込み層はビルディング ブロックのような残差層サブモジュールを介して全体的なネットワーク モジュールに接続されます。

4. モデルの融合

モデル融合に関しては、検討する価値のある問題が 3 つあります。

  • 足し算か引き算か?
  • 減算には主に残差、GBDT、ショートカットなどが含まれます。
  • 加算には主に積み重ねなどの方法が含まれます。
  • 分類か回帰か?
  • 従来の予測は一般的に回帰問題です。
  • 分類問題には確率問題が含まれることが多く、投票を通じて特定の情報を得ることができます。
  • 上向き、下向き、それとも平らに横たわっていますか?
  • 予測用の基本モデルを使用すると、強化学習を使用して予測結果に関するフィードバックを提供できます。

5. 実用的な効果

モデル効果はMAEとMAPEを使用して評価されます。下の表に示すように、モデルの反復により、MAPE の改善は比較的限られており、理想的ではありません (理想的な誤差は 5% 以内ですが、チューニング後の実際の結果は約 23% です)。

次の図は、次の 30 ポイントのデータのマルチステップ予測の結果を示しています。縦軸はすべてのバッテリー交換ステーションの合計であり、線形変換が実行されます (結果の傾向には影響しません)。

上図の LGB 結果、DCN 結果、実際の値を比較すると、次のことがわかります。

  • LGB モデルは休日を過剰適合し、休日の予測には役立ちません。
  • Informer モデルは長いシーケンスの季節性に対してはパフォーマンスが悪くなりますが、DCN モデルは畳み込みチャネルを使用して時間によって変化する変数を調整できるため、休日の予測を処理するのに役立ちます。

最終結果が依然として 23% 程度で停滞し、ボトルネックに遭遇したという事実については、生成モデルについての考察が紹介されています。最近人気のGPTも生成モデルですが、本質的にはこのタイプのモデルには標準的な答えがなく、一種の「創造」として理解できます。時系列予測も生成モデルですが、このモデルには標準的な答えがあり、疫病や旅行など外部環境の多くの予測不可能な要因の影響を受け、モデルのトレーニングも過去のパフォーマンスパターンに過剰適合する傾向があります。

4. まとめと展望

今後の計画:

  • もっと早く

リアルタイム: データと結果がより迅速に更新されます。情報の非対称性は、モデルの予測効果を大きく左右します。私たちはこれまで、リアルタイム機能に関する多くの取り組みを行ってきました。今後は、より多くのオフライン機能をリアルタイム機能に変換し、できるだけ多くのリアルタイムデータを取得し、モデルの予測結果を継続的に更新していきます。

効率: 開発効率が向上します。統合アーキテクチャを改良してアルゴリズム ライブラリを形成し、ローコード開発とアルゴリズムの反復を実現します。

  • より良い

アルゴリズムの卓越性を垂直的に追求します。業界は急速に発展しており、私たちは他の優れた最先端の専門家の関連研究にも引き続き注目していきます。

機能的完璧さを水平に追求する。時系列には予測以外にもさまざまなタスクが含まれます。次に、1 つのアーキテクチャを使用してすべてのビジネス ニーズをカバーしてみます。

  • より価値あるもの

組織内で効率的な権限付与を実現します。同様のニーズを持つ他の部門に既存のツールを推進し、他のビジネスの迅速な発展を可能にします。

組織外でのオープンソースの共同作成を可能にします。適切なタイミングで、関連するエンジニアリング技術をオープンソース化し、予測アルゴリズムに新しいアイデアや方法を継続的に注入する可能性があります。

5. 質疑応答

Q1: 従来の機械学習モデルよりも効果を高めるには、ディープラーニング データのトレーニング セットをどの程度のサイズにする必要がありますか?

A1: 既存モデルで使用されるデータは、約 3 年間の履歴データです。まず、バッテリー交換ステーションの設置は段階的かつ累積的であり、異なるバッテリー交換ステーションでは「コールド スタート」などの問題が発生する可能性があります。この記事で紹介したアーキテクチャは、この「コールド スタート」問題を効果的に解決できます。ディープラーニングのトレーニング セットのサイズに関しては、主に経験に依存し、明確な境界を設けることは困難です。新しく建設されたバッテリー交換ステーションの場合、ディープラーニング モデルの効果は確かに理想的ではありませんが、2 ~ 3 年間運用されているバッテリー交換ステーションの場合、ディープラーニングの効果は機械学習の効果よりも大幅に優れています。

Q2: 自動運転が普及した後も、交通の流れを予測することは意味があるのでしょうか?

A2: 予測は確かに意味があります。休日、朝晩のラッシュアワー、重要な道路での交通量の急増を事前に知ることは、車両のインターネットのスケジュールにとって大きな意味を持ちます。ただし、自動運転の「一時的な調整」戦略のみを採用することは非効率的で遅れをとっています。

<<:  GPT-4はプロンプトインジェクション攻撃に対して脆弱であり、誤った情報につながる

>>:  サプライチェーン管理における AI イノベーションを活用するために従業員を再教育する方法

推薦する

機械学習の3つの時代におけるコンピューティングのトレンド

2010 年以前は、トレーニング コンピューティングの開発はムーアの法則に沿って 2 年ごとに 2 ...

パドルパドル中国ツアーは、中小企業のソフトウェアおよびハードウェア製品の革新の需要に応えるために深センに上陸しました

AI応用の時代において、人工知能技術は研究室から産業化へと移行しています。人工知能が徐々に製品応用市...

TensorFlowはディープラーニングに基づく画像補完を実装する

[[191845]]目次■ はじめに■ ステップ1: 画像を確率分布のサンプルとして理解する不足して...

大規模モデルのRLHFは必ずしも人間に依存するものではなく、Google:AIフィードバックも同様に効果的

今日の大規模モデルをトレーニングするための中核的な方法となると、RLHF は避けられないトピックです...

新しい消費者向け IoT と人工知能の開発を加速させる機会は何でしょうか?

近年、世界的な技術開発の加速化が進み、新世代の情報通信技術が次々と導入され、数多くの新たなビジネスモ...

...

AI はどのようにしてソフトウェアおよびハードウェア製品のイノベーションを実現するのでしょうか? Baidu Brain オープンデー 西安駅の暗号解読

6月25日、「AIによるソフトウェアとハ​​ードウェア製品のイノベーションの促進」をテーマにした西安...

...

なぜAlipayは携帯電話の闇市場に関与しないのでしょうか?公式回答: 犯罪者は顔認識を突破できない

「携帯電話1台で世界中を旅する」というのは、ほぼすべての人の現状です。アクセスカード、バスカード、鍵...

デジタルビジネスにおける AI の 6 つの設計原則

人工知能 (AI) は、現在人間が行っている意思決定やタスクを補強し、自動化する機能を備えているため...

機械学習に関する12の現実世界の真実

導入現実世界で働くときには、直面しなければならない事実がいくつかあります。この記事ではそれについて説...

金融業界がAI自動化を採用すべき理由

ガートナーによると、「ロボティック・プロセス・オートメーション(RPA)ソフトウェア市場は2020年...

AIエージェント、起動!復旦 NLP チームが 86 ページのレビューを発表: インテリジェント社会はすぐそこ

9 月 19 日、Jim Fan は Fudan NLP チームからの LLM ベースのエージェント...

予測 AI は顧客とのつながりをどのように変えるのでしょうか?

[[422098]]予測分析は、私たちが必ずしも気づいていないとしても、私たちの生活の多くの分野に...

研究者:大規模な言語モデルを微調整すると「セキュリティ」が弱まり、ハッカーによるバックドア攻撃に対して脆弱になる

10月16日、既存の大規模言語モデルをさまざまなユーザーニーズに合わせて修正することで、関連モデルの...