机器学习中常用的距离度量汇总
距离的定义 在机器学习中,我们通过计算不同样本在特征空间中的距离来评估样本间的相似度,进而为其进行分类。根据样本特征空间的不同,我们需要选择合适的距离度量方法。一般而言,对于距离度量函数$d(x,y)$,其需要满足如下性质: 非负性:$d(x,y)\geq 0$ 同一性:$d(x,y)=0\Leftrightarrow x=y$ 对称性:$d(x,y)=d(y,x)$ 三角不等式:$d(x,y)\leq d(x,z)+d(z,y)$ 根据样本特征空间的不同,我们把度量的距离分为:空间距离、字符距离、集合距离、分布距离。 空间距离 欧几里得距离(Euc...