諺にもあるように、「時間と空間は予測不可能である」。自然界では、時間と空間が急速に変化するため、その正確なパターンを捉えることは難しい場合がよくあります。しかし、時間と空間は共に過去の存在の属性を記録します。それらを通じて、私たちは物事の存在の法則を発見し、将来の傾向を予測して、将来の状況に対応したり、将来の機会を事前につかんだりすることができます。 現代の科学技術の発展に伴い、測位技術はますます普及してきました。たとえば、GPRS や位置センサーなどのテクノロジーが広く応用されているため、宇宙関連のデータを収集することが非常に容易になっています。時空間データを収集した後、人々は当然、この情報の価値を活用し、意思決定のサポートを得るための重要な要素についての洞察を得たいと考えます。そして、適切なデータ分析方法が、有用な価値を引き出す鍵となります。 既存のデータ分析ツールでは、ほとんどのモデルが空間次元の役割のみを考慮しており、一般的に使用される時系列モデルでは、異なる場所で同時に発生する情報を関連付けることが困難な場合がよくあります。これらのモデルを不本意に使用すると、モデルの結論が不正確になることが多く、予測結果がさらに混乱を招きます。 そのため、IBM SPSS は時間と空間を組み合わせたデータ分析モデル (時空間予測、略して STP) を提供します。 STP モデルを開発する本来の目的は、時空間データに関連するビジネス上の問題を解決できるようにすることです。天気や環境の予測、インテリジェントな交通ソリューション、ネットワークアプリケーションやセキュリティ分析、建物や空間のエネルギー管理などに応用できます。モデリングと予測に STP を使用することで、管理者や企業は包括的な意思決定サポートを受けることができ、時間、コスト、リソースを節約できます。この記事では、主に時空間解析アルゴリズムの特徴とその応用例を説明し、その使用法と実用的な価値を理解してもらいます。 STPモデルの特徴 まず、STP モデルは、地理情報、3 次元空間座標など、2 次元と 3 次元の両方の空間シナリオをサポートします。したがって、STP モデルはさまざまな時空間アプリケーションで広く使用できます。 第二に、STP モデルは、限られたサンプル ポイントのみを使用してモデル化することで、空間内の将来の任意の場所のターゲット情報を予測できるため、強力な予測機能を備え、空間内の任意のポイントに情報を放射できます。 ***、STP モデルはパラメータの what-if 分析をサポートします。これにより、ユーザーは将来の意思決定をサポートされ、期待される目標に合わせてパラメータを調整できるようになり、将来の問題や悪影響を事前に防止または排除できるようになります。 図1. 時空間モデルの適用例 STPデータの特性 図2. STPモデルデータ形式 STPアルゴリズムの例 次の 2 つの例は、STP アルゴリズムがどのように適用され、ユーザーの問題を解決するかを示しています。
図3. STPモデルのデータ要件 * STP では、データに固定の位置情報で収集された同じ時系列のデータセットが含まれている必要があります。 STPモデリングプロセス 図4. STPの簡略フローチャート 時空間データの入力: 収集された元の時空間データを入力します。 時空間データ前処理 (STEMDP): STEMDP は、空間データを変換するために IBM SPSS によって開発されたツールです。 .shp ファイルを空間座標データに変換し、時間形式を時間インデックスに変換できます。データ自体を STEMDP で処理する必要がない場合は、この手順を省略できます。 時空間予測 (STP): STP は、STEMDP によって変換されたデータを使用してモデル化されます。共分散行列の使用方法は、モデリングプロセス中にスクリーニングされます。共分散行列は、パラメトリック (バリオグラム) またはノンパラメトリック (EOF) の 2 つの方法で表すことができます。デフォルトはパラメータ化モードです。パラメータ化モードが条件を満たさない場合は、非パラメータ化モードが適用されます。 出力 STPXML および StatXML: STP モデリングの結果は、STPXML と StatXML の 2 つのファイルに保存されます。 STPXML のモデル情報は将来のターゲット情報を予測するために使用され、StatXML の内容はモデルを視覚化するために使用されます。その中で、StatXML には場所のクラスターに関する情報も含まれています。空間次元が2次元モデルであり、最終的にノンパラメトリック法を適用すると、位置クラスター情報が出力されます。 STP 適用事例 データセンター温度制御ソリューション 2000年から現在に至るまで、インターネットを基盤としたIT技術は急速に発展し、多数のデータセンターが構築され、利用されるようになりました。連邦エネルギー管理システムがまとめた「米国データセンターエネルギー消費レポート」によると、2014年だけで米国のデータセンターの電力消費量は70億キロワット時で、米国の総電力消費量の約1.8%を占めています。 2000年から2005年にかけて、IT業界は初期の発展を遂げ、データセンターの電力消費量は90%以上増加しました。2005年から2010年にかけて、IT業界は急速な発展期を迎え、電力消費量は驚異的な24%増加しました。2010年から2014年にかけて、IT業界は徐々に安定期に入り、電力消費量は24%増加しました。今後5年間は、年間約4%の割合で着実に成長するでしょう。中国はIT産業の発展においてもいくつかの段階を経てきました。データセンター建設は急速な発展を維持し、エネルギー消費は高い水準を維持しています。 エネルギー消費はデータセンターの運用コストの約 70% を占めます。そのため、世界規模でデータセンターの電力消費量を削減し、エネルギー利用率を向上させるという課題が差し迫っています。 データセンターは電気代を大幅に節約したいと考えています。エネルギーを効率的に利用し、コストを節約し、国が提唱する環境保護政策に準拠するためには、ハードウェアや設備のアップグレードに加えて、より正確な温度制御と湿度管理も必要です。 データ センターでは、温度センサーと風速センサーを導入して、一定期間にわたって空間内のサンプル位置の温度と空気量の状態を収集し、STP アルゴリズムを使用してモデリングと予測を行い、エネルギー効率の向上に役立てています。 図 5. データセンター内の複数のサンプル ポイントに温度センサーと風速センサーが設置されています。 1. データ収集 図6. センサーやその他のデバイスから収集されたリアルタイムデータ STP モデル データ形式には、空間次元、時間次元、およびターゲット パラメータが含まれている必要があります。入力パラメータはオプションです。上記の表はデータセンターから収集されたデータであり、モデル作成のために STP モデルのデータ入力にマッピングされます。 空間次元は位置センサーの座標位置です。ここで、u、v、w はそれぞれ水平位置と高さを表します。 時間ディメンションは、データが収集される時間を表します。 STP を使用する前に、特定の時間を時間インデックスに変換する必要があります。ユーザーは STEMDP ツールを使用して変換することも、手動で変換することもできます。 入力パラメータ x1、x2、x3 はそれぞれ風速、ACU 機能、高度を表します。 x4 と x5 も影響を与える可能性のある要因ですが、STP モデルでは最終的に、それらの影響は非常に弱く、無視できることが証明されています。 ターゲット パラメータは、サンプル位置で実際に監視される温度です。 2. データモデリング 上記のデータを入力として使用し、以下に示すように STP でモデルを作成します。 図7. STPデータ入力 図8. STPモデルの結果 上記の結果から、パラメータ x4 と x5 の有意値は両方とも 0.05 より大きいことがわかります。これは、モデルへの寄与が小さく、有意性が低いことを示しています。したがって、結果を監視するときに、これら 2 つのデータの収集を省略できます。 x1、x2、x3 はすべてモデルに大きく寄与するため、これら 3 つのパラメータを収集して分析するだけで済みます。 一方、MSE、R 平方などの値は、STP モデルが小さな誤差で適切に機能することを示しています。 3. モデル予測 与えられた入力パラメータ(風速、ACU など)に基づいて、データセンター空間内の将来の温度が予測されます。オレンジ色の部分は、STP が将来予測する気温に関する情報を示しています。 $STP-y、$STPVAR-y、STPUCI-y、$STPLCI-y は、それぞれ予測温度、分散、予測上限および下限間隔を表します。実際の STP は、将来の連続した瞬間における任意の空間位置の温度を予測できます。次の散布ヒートマップは、この例の温度分布を示しています。 図9. サンプル採取場所の最新時点における温度分布 図10. 次の時点における異なる高度での3次元温度分布の予測 図11. 次の時点における異なる高度での飛行機の温度分布の予測 図12. 次の時点における空間全体の3次元温度分布の予測 STP はどこでもスコアを取れる機能を持っています。つまり、限られた場所のサンプルポイントを通じて空間全体の温度分布を予測することができます。上記の温度効果図から、高度が上がるにつれて、熱気は上向きに流れることがわかります。そのため、高度5.5メートルでは大量の熱が蓄積され、温度が高すぎます。この高度以上では、十分な換気、放熱、冷却を行うことができます。また、グラフの右上、高さ4.5メートルの局所的な温度が高すぎるため、この範囲内での機器の稼働を強化して温度を下げることが考えられます。 STP による空間全体の温度予測を通じて、ユーザーは今朝のデータセンター全体の温度分布を把握することができ、局所的な温度の上昇による機器の損傷や回復不能な損失を回避できます。 STP には、what-if 分析の機能もあります。ユーザーは、モデルに影響を与える制御可能なパラメータを調整して、目的の目標を達成できます。風量と ACU を調整した後、STP は温度を適切な範囲まで下げるのにかかる時間を予測できます。次の図は、同じ高度でパラメータを調整した後の温度変化を示しています。 図13. 将来の同一高度層における気温変化の予測 データセンターにおける STP ソリューションの適用は、温度予測に限定されず、湿度の変化や空間に関連するあらゆる要因を分析および予測することもできます。その結果、データセンターの自動管理がより高度かつ優れたものとなり、より効果的かつ確実にエネルギーを節約し、人的介入を削減できるようになります。現在のコンピュータ室が古く、機器のハードウェアを時間内にアップグレードできない場合でも、データセンターに環境に優しくインテリジェントな管理システムを構築できます。 銀行所在地決定支援プログラム ある銀行の幹部が、ある都市に新しい銀行支店を開設したいと考えています。国勢調査や調査データから、各地域の世帯収入やその地域にあるすべての銀行支店に関する情報を得ることができます。この情報を基に、彼は SPSS の STP モデルを使用して、潜在的な市場価値のある場所を予測することを検討しました。 彼は STP モデルを使用して 2 つのモデルを作成しました。1 つは各地域の所得情報を予測するモデル、もう 1 つは将来これらの地域にある銀行支店の数を予測するモデルです。そして、これら 2 つの予測結果を通じて、市内のすべてのエリアにおける潜在的な市場の分布が得られ、意思決定計画の実現可能性をサポートするために市場分析を迅速かつ効率的に完了するのに役立ちます。 図14. 将来の銀行供給の予測 図15. 将来の居住者の所得予測 図16. 将来の潜在的市場分布の予測 終わり オフィスワーカーなら、交通渋滞をどうしたら減らすことができるのか、公共の自転車資源をどう効率的に活用できるのか、ピーク時に適切な料金を素早く得るにはどうすればよいのか、とよく考えたことがあるのではないでしょうか。 事業者であれば、市場の選択に迷うことは多いのではないでしょうか。間違った拡大による計り知れない損失を招くことなく、ビジネスチャンスが最も高い場所を選択するにはどうすればよいでしょうか。ビッグデータ分析を応用して、企業のインテリジェント情報化の競争力を高め、コストを削減するにはどうすればよいでしょうか。 STP アルゴリズムの適用により、時空間の問題に対する最適なソリューションと予測サポートが提供されます。 SPSS は、ビジネス データで広く使用されているさまざまなアルゴリズムも提供しており、ビッグ データを分析し、最も包括的な方法でビジネス上の意思決定を行うのに役立ちます。 |
>>: プレーン AI: ディープラーニングを理解するのは本当に難しいのでしょうか?中学数学、たった10分
[[183558]]誰かがあなたにボールを投げてきたら、どうしますか? もちろん、すぐにキャッチす...
我が国の「デュアルカーボン」目標の提唱により、データセンターにおける省エネと消費削減が社会的に注目さ...
世界中の企業がモノのインターネット (IoT) を急速に活用して新しい製品やサービスを生み出し、新た...
論文アドレス: https://arxiv.org/abs/2307.09283コードアドレス: h...
Microsoft と Siemens は最近、製造業向けの Siemens Industry C...
[[264958]]将来、道を歩いていて急にお腹が空いたとき、今のように検索エンジンを使って検索する...
オープンソースの「ビッグコードモデル」が登場しました。 UIUC 清華大学の研究者チームは、70 億...
[51CTO.com クイック翻訳]ニューラルネットワークは人工知能の分野で非常に人気が高まっていま...
1. 背景検索シナリオでは、ユーザーの検索クエリと思い出された記事のタイトルとの関連性は、ユーザーの...
「最初のディープラーニングフレームワークをどのように選択するか」は、初心者にとって常に頭痛の種でし...
[[334476]] AI がますます多くの業界で採用されるようになるにつれ、AI のユーザーは、実...
[[415590]]ボストン・ダイナミクス社が開発したヒューマノイドロボット「アトラス」、ロボット...
[[420350]]ベイズの定理は確率モデルにおける最も有名な理論の 1 つであり、機械学習でも広...