聚类: 将相似或满足条件的样本归类到同一类别中
DBSCAN
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)基于密度的聚类算法
聚类方式
- 以任一点开始, 判断当前点ep范围内点数是否大于minPts, 若大于则为核心点, 否则为噪点
- 然后以邻域内任一点重复步骤1, 将样本归类为不同簇
算法参数
ep: 邻域半径
minPts: 最少点数
点类别
- 核心点是指那些在邻域内具有足够多的点的对象(>minPts)
- 边界点则是那些邻近核心点但自身不是核心点的点
- 噪声点则既不是核心点也不是边界点