K-means クラスタリング アルゴリズム 中国語名は「K-means クラスタリング アルゴリズム」と呼ばれ、統計やデータ マイニングの分野でよく使用されるアルゴリズムです。 Wikipedia では次のように紹介されています: k 平均法クラスタリングは、n 個の観測値を k 個のクラスターに分割し、各観測値が最も近い平均値を持つクラスターに属するようにするクラスター分析の手法です (n 個の観測値を k 個のクラスに分割し、各クラスの観測値がそのクラスの平均に最も近くなり、他のクラスの平均から遠ざかるようにします)。 まず、最もシンプルで直感的な図を見てみましょう。 上の図にはたくさんの点があります。これを 3 つのクラスターに分割したいのですが、どうすればよいでしょうか。 人間であれば一目でわかりますが、コンピュータが分類するのはそれほど簡単ではありません。何らかのアルゴリズムを使用する必要がありますが、k-means はその 1 つです。 K-means は 2 次元空間でのクラスタリングだけでなく、n 次元ベクトル空間に拡張することもでき、文字、画像、音声なども扱うことができます。 上の図を例にとると、K-means アルゴリズムの基本的な手順は次のようになります。 ステップ 3. すべてのポイントの色が変化しなくなるまで、ステップ 2 を繰り返します。 上記の例は単純な2次元空間での例ですが、3次元空間に配置する場合は平均の計算方法を変更する必要があります。実際、多次元空間や文字、画像などの問題を扱う場合、問題によって計算式が異なります。この場合、mean の意味は「平均」ではない可能性があります。個体間の関係性を測るには、「類似性」と「相違点」を使用する方が良いかもしれません。詳細については、参考記事 1 を参照してください。 いつものように、私が書いた k-means アルゴリズムのコードを下に貼り付けるべきなのですが、残念ながらまだ Python の numpy ライブラリと matplotlib ライブラリを使って絵を描く方法を調べているところです。参考記事 2 に Python 言語のコードがあります。 ***この記事の写真はすべて彼のスライドから取ったものなので、データマイニングの講師である Devert Alexandre 氏に感謝したいと思います。 ^_^ 参考記事 1 参考記事 2Dベースk平均法 Wikipediaリンク ティーセン多角形法 Wikipediaリンク (ボロノイ図) オリジナルリンク: http://blog.nlogn.cn/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98-k-means-%E7%AE%97%E6%B3%95/ |
[[390945]] [51CTO.com 速訳]人工知能の普及は人々に大きな期待をもたらしました。...
[[422388]]画像ソース: https://pixabay.com/images/id-82...
2022年、デジタル化の東風が到来し、新たな技術・産業革命が本格化します。デジタル化の波に立ち、絶え...
2019年グローバルスマート博覧会は今年5月9日から11日まで蘇州工業園区で開催される予定だ。蘇州...
9月21日のニュース、水曜日、アマゾンは毎年恒例の新製品発表会で、生成型人工知能技術を統合した一連の...
人工知能の分野において、コンピューター ビジョンの 2 大巨頭は CLIP と DINOv2 です。...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ニューラル ネットワークの最適化は本質的に非凸ですが、単純な勾配ベースの方法は常にこのような問題を解...
私たちが住む世界では、炭素をベースとするほぼすべての生物は、遺伝子をその特異性の根拠として利用してい...
【51CTO.com 速訳】ディープラーニングの課題過去数年間で、ディープラーニング モデルの主要構...
天津の不動産管理会社は、コミュニティへの出入りの唯一の方法として顔認証を使用していたとして住民から訴...
人工知能 (AI) 技術を使用すると多くのメリットがもたらされますが、その 1 つは、社会問題を別の...