現在、国民経済と生活のあらゆる分野でビッグデータの理論と応用が盛んに行われています。ビッグデータの基本的な概念や特徴については、すでに多くの人が理解しています。しかし、ビッグデータを取得、保存、検索、共有するだけでは十分ではありません。ビッグデータの中にある未知の価値ある情報や知識を、どのように見つけることができるのでしょうか。 知識発見 (KDD) は、ビッグ データから有効で、斬新で、潜在的に有用で、最終的には理解可能なパターンを識別するプロセスです。 知識発見のフローチャート データマイニングは、ビッグデータにおける知識発見(KDD)に欠かせない部分であり、ビッグデータの理論と応用において非常に重要な部分です。データ マイニングとは、大量の不完全でノイズが多く、あいまいでランダムなデータから、暗黙的で未知だが潜在的に有用な情報や知識を抽出するプロセスです。ほとんどの人は、ケーススタディを通じてデータマイニングについて学びました。これは、ウォルマートがデータ分析を通じて、男性顧客がベビー用おむつを購入する際に自分へのご褒美としてビールを数本買うことが多いことを発見したため、ビールとおむつを組み合わせたプロモーションを開始しようとしたためです。予想外に、この動きにより、実際におむつとビールの両方の売上が大幅に増加しました。この話はおそらく嘘ですが、多くの人にデータマイニングに興味を持ってもらうきっかけとなりました。 データマイニングの基本フレームワーク データマイニングで最も一般的に使用されるアルゴリズムは次のとおりです。 (1)予測モデリング:既存のデータとモデルを使用して未知の変数を予測する。
(2)クラスター分析:同じクラスターに属する観測値が、異なるクラスターに属する観測値と比較して可能な限り互いに類似するように、密接に関連する観測値のグループを見つける。 (3)関連分析(関係モデルとも呼ばれる):あるものと他のものの間の相互依存性と相関関係を反映します。データ内の強く相関した特徴を表すパターンを発見するために使用されます。 (4)異常検出:他のデータとは特性が著しく異なる観測値を識別する。 データ マイニングは、分類、回帰、クラスタリング、関連分析に分けられることがあります。 データマイニングの代表的な4つのアルゴリズム データマイニングと機械学習は異なりますが、関連もあり、今後の記事で紹介する予定です。 |
<<: ついに、データ、情報、アルゴリズム、統計、確率、データマイニングをわかりやすく説明した人がいました。
>>: 信頼できる AI ソリューション プロバイダー 5 社
[[234392]] [51CTO.com クイック翻訳] 人間は常に、自分たちに似たロボットや人工...
近年、機械翻訳 (MT) は大きな進歩を遂げ、満足のいく成果を達成しました。 MT は人工知能分野の...
AI を活用したストレージにより、企業はデータを迅速かつインテリジェントに分析し、ほぼ瞬時に洞察...
機械学習は基本的に、既存のデータを使用して新しいデータについて予測を行う人工知能のサブセットです。も...
新型コロナウイルスは間違いなく2020年で最もホットな話題であり、流行の防止はすべての国にとって最優...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
機械学習、ビッグデータ、自動化は世界の産業システムに革命をもたらしており、エネルギー業界も例外ではあ...
機械学習と人工知能に関しては、スキャンダルが後を絶ちません。過去数ヶ月、マイクロソフトのジャーナリス...
ディープラーニングアルゴリズムは、マシンビジョンにおける巧妙な受信機コンバーターのようなものです。柔...
知名度という点では、サウジアラビアのパスポートを持つソフィアは、間違いなくロボット工学界のトップスタ...
1. 要件の説明数字の文字列を入力し、その文字列を整数に変換して出力するプログラムを作成します。たと...
最近の調査によると、機械が仕事を奪っていくのを見ると、人間の従業員の士気が低下する可能性があることが...