10. 聚类分析
# 简介
聚类分析是一种无监督学习技术,旨在根据相似性将数据点分组到不同的簇中。本笔记系统梳理了聚类分析中的关键概念、方法及其优缺点。
# 距离度量
在聚类分析中,距离度量是定义数据点或簇之间“相似性”或“不相似性”的核心。
# 点与点之间的距离
欧氏距离 (Euclidean Distance):最常见的距离度量,基于点在多维空间中的直线距离。
相关系数 (Correlation Coefficient):衡量两个变量之间的线性相关性,常用于高维数据。
Jaccard 距离 (Jaccard Distance):主要用于度量两个集合之间的不相似性。
汉明距离 (Hamming Distan
more...