データマイニングの基本概念と最も一般的に使用されるアルゴリズムについての簡単な説明

データマイニングの基本概念と最も一般的に使用されるアルゴリズムについての簡単な説明

現在、国民経済と生活のあらゆる分野でビッグデータの理論と応用が盛んに行われています。ビッグデータの基本的な概念や特徴については、すでに多くの人が理解しています。しかし、ビッグデータを取得、保存、検索、共有するだけでは十分ではありません。ビッグデータの中にある未知の価値ある情報や知識を、どのように見つけることができるのでしょうか。

知識発見 (KDD) は、ビッグデータから有効で、斬新で、潜在的に有用で、最終的には理解可能なパターンを識別するプロセスです。

知識発見のフローチャート

データマイニングは、ビッグデータにおける知識発見（KDD）に欠かせない部分であり、ビッグデータの理論と応用において非常に重要な部分です。データマイニングとは、大量の不完全でノイズが多く、あいまいでランダムなデータから、暗黙的で未知だが潜在的に有用な情報や知識を抽出するプロセスです。ほとんどの人は、ケーススタディを通じてデータマイニングについて学びました。これは、ウォルマートがデータ分析を通じて、男性顧客がベビー用おむつを購入する際に自分へのご褒美としてビールを数本買うことが多いことを発見したため、ビールとおむつを組み合わせたプロモーションを開始しようとしたためです。予想外に、この動きにより、実際におむつとビールの両方の売上が大幅に増加しました。この話はおそらく嘘ですが、多くの人にデータマイニングに興味を持ってもらうきっかけとなりました。

データマイニングの基本フレームワーク

データマイニングで最も一般的に使用されるアルゴリズムは次のとおりです。

（１）予測モデリング：既存のデータとモデルを使用して未知の変数を予測する。

分類は離散的なターゲット変数を予測するために使用される
連続的な目標変数を予測するための回帰

（２）クラスター分析：同じクラスターに属する観測値が、異なるクラスターに属する観測値と比較して可能な限り互いに類似するように、密接に関連する観測値のグループを見つける。

（３）関連分析（関係モデルとも呼ばれる）：あるものと他のものの間の相互依存性と相関関係を反映します。データ内の強く相関した特徴を表すパターンを発見するために使用されます。

（4）異常検出：他のデータとは特性が著しく異なる観測値を識別する。

データマイニングは、分類、回帰、クラスタリング、関連分析に分けられることがあります。

データマイニングの代表的な4つのアルゴリズム

データマイニングと機械学習は異なりますが、関連もあり、今後の記事で紹介する予定です。

<<: ついに、データ、情報、アルゴリズム、統計、確率、データマイニングをわかりやすく説明した人がいました。

>>: 信頼できる AI ソリューションプロバイダー 5 社

ボストン・ダイナミクスCEO：軍の命令は否定しないが、ロボット犬を粗雑に扱っていると思う

ボストン・ダイナミクスCEO：軍の命令は否定しないが、ロボット犬を粗雑に扱っていると思う

ブログ

ニューラルネットワークアルゴリズムを使用した C# での手書き数字認識

ニューラルネットワークアルゴリズムを使用した C# での手書き数字認識

ブログ

ブログ

データサイエンスと機械学習の違いは何ですか?

データサイエンスと機械学習の違いは何ですか?

ブログ

ワンクリックで細い毛を切り取る。これはAdobeの最新のAI切り抜きアルゴリズムで、近日公開予定

ワンクリックで細い毛を切り取る。これはAdobeの最新のAI切り抜きアルゴリズムで、近日公開予定

ブログ

将来、ロボットが私たちを支配するようになるのでしょうか？

将来、ロボットが私たちを支配するようになるのでしょうか？

ブログ

Llama-2+Mistral+MPT=? 複数の異種大規模モデルの融合が驚くべき結果を示す

Llama-2+Mistral+MPT=? 複数の異種大規模モデルの融合が驚くべき結果を示す

ブログ

Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

ブログ

ブログ

ブログ

推薦する

2018 年の 5 つの主要な AI トレンドとそのメリット

[[234392]] [51CTO.com クイック翻訳] 人間は常に、自分たちに似たロボットや人工...

機械翻訳：人工知能分野の重要な中核技術

近年、機械翻訳 (MT) は大きな進歩を遂げ、満足のいく成果を達成しました。 MT は人工知能分野の...

...

...

AIを活用したストレージ施設は、企業がデータを最大限に活用するのに役立ちます

AI を活用したストレージにより、企業はデータを迅速かつインテリジェントに分析し、ほぼ瞬時に洞察...

機械学習: Python による予測

機械学習は基本的に、既存のデータを使用して新しいデータについて予測を行う人工知能のサブセットです。も...

人工知能は伝染病との戦いにおいてどのような役割を果たすのでしょうか?

新型コロナウイルスは間違いなく2020年で最もホットな話題であり、流行の防止はすべての国にとって最優...

アカデミー会員焦力成: 進化最適化とディープラーニングに関する考察

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ビッグデータと機械学習は世界のエネルギー業界をどのように変えるのでしょうか?

機械学習、ビッグデータ、自動化は世界の産業システムに革命をもたらしており、エネルギー業界も例外ではあ...

多様性がAI戦略の成功の鍵となる理由

機械学習と人工知能に関しては、スキャンダルが後を絶ちません。過去数ヶ月、マイクロソフトのジャーナリス...

ディープラーニングアルゴリズム

ディープラーニングアルゴリズムは、マシンビジョンにおける巧妙な受信機コンバーターのようなものです。柔...

市長や市議会議員に立候補する際、ロボットは公務員として適しているでしょうか?

知名度という点では、サウジアラビアのパスポートを持つソフィアは、間違いなくロボット工学界のトップスタ...

...

[文字列処理アルゴリズム] 文字列を整数に変換するアルゴリズム設計とCコード実装

1. 要件の説明数字の文字列を入力し、その文字列を整数に変換して出力するプログラムを作成します。たと...

調査によると、経営幹部はAIが職務記述書を時代遅れにしていると考えている

最近の調査によると、機械が仕事を奪っていくのを見ると、人間の従業員の士気が低下する可能性があることが...