【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全-LMLPHP

【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全-LMLPHP


摘要: 本系列旨在普及那些深度学习路上必经的核心概念,文章内容都是博主用心学习收集所写,欢迎大家三联支持!本系列会一直更新,核心概念系列会一直更新!欢迎大家订阅

聚类算法

聚类算法是一种无监督学习的机器学习算法,用于将数据集中的样本划分为具有相特征的组或簇。其目标划分的原则是组内(内部)距离最小化,而组间(外部)距离最大化。在商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体,并且概括出每一类消费者的消费模式或消费习惯。同时,聚类分析也可以作为数据分析算法中其他分析算法的一个预处理步骤,如异常值识别、连续型特征离散化等。

以下是基于不同方法的算法类别表

以下是常用的聚类算法,

以下是常用的聚类中的距离度量算法及其介绍,以及相应的优缺点分析:

其中大部分算法都可以通过sklearn 库进行实现.

【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全-LMLPHP

						  🤞到这里,如果还有什么疑问🤞
					🎩欢迎私信博主问题哦,博主会尽自己能力为你解答疑惑的!🎩
					 	 🥳如果对你有帮助,你的赞是对博主最大的支持!!🥳
11-27 09:16