K_Means

聚类

* 定义：一种无监督式学习，将相似的对象归到同一簇中。簇中对象越相似，聚类效果越好；

* 区别：聚类和分类最大的不同在于，分类的目标事先已知，而聚类则不一样，其产生的结果与分类相同，
        只是类别没有预先定义。

k-均值聚类算法

* 定义：发现给定数据集中的k个簇的算法。簇的个数k由用户自定义，每个簇通过簇其质心，即簇中所有
       点的中心来描述；

* 基本思想：首先，随机确定k个初始点作为质心；然后将数据集中的每个点分配到同一簇中，具体来说，
            为每个点找距离最近的质心，并将其分配给该质心所对应的簇；完成之后，每个簇的质心
            更新为该簇所有点的平均值；

* 优点：容易实现；

* 缺点：可能收敛到局部最小值，在大规模数据集上收敛较慢

* 使用数据类型：数值型数据

二分k-均值聚类算法

* 基本思想：首先将所有点作为一个簇，然后将簇一分为二。之后选择其中一个簇继续进行划分，选择哪一个
            簇进行划分取决于对其划分是否可以最大程度降低SSE(误差平方和)的值，划分过程不断重复，
            直到得到用户指定的簇数目。

Name		Name	Last commit message	Last commit date
parent directory ..
datas		datas
extras_plotter		extras_plotter
main		main
__init__.py		__init__.py
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

readme.md

聚类

k-均值聚类算法

二分k-均值聚类算法

FilesExpand file tree

K_Means

Directory actions

More options

Directory actions

More options

Latest commit

History

K_Means

Folders and files

parent directory

readme.md

聚类

k-均值聚类算法

二分k-均值聚类算法