学习笔记5——距离度量(欧⽒距离、马⽒距离、闵⽒距离、
曼哈顿距离等)
参考:
描写思乡的诗句1.欧⽒距离
欧式距离并不是尺度不变的,因此所计算的距离可能会根据特征的单位发⽣倾斜。通常,在使⽤欧式距离度量之前,需要对数据进⾏归⼀化处理。 此外,随着数据维数的增加,欧⽒距离的作⽤也就越⼩。这与维数灾难(cue of dimensionality)有关。
激励自己的诗句
⽤例:当你拥有低维数据且向量的⼤⼩⾮常重要时,欧式距离的效果⾮常好。如果在低维数据上使⽤欧式距离,则如 k-NN 和 HDBS 之类的⽅法可达到开箱即⽤的效果。
妈妈的朋友迅雷下载2.曼哈顿距离(城市街区距离,不是两点之间的距离)
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离:
尽管曼哈顿距离在⾼维数据中似乎可以⼯作,但它⽐欧式距离直观性差,尤其是在⾼维数据中使⽤时。此外,由于它可能不是最短路径,有可能⽐欧⽒距离给出⼀个更⾼的距离值。 ⽤例:当数据集具有离散或⼆进制属性时,曼哈顿距离似乎⼯作得很好,因为它考虑了在这些属性的值中实际可以采⽤的路径。以欧式距离为例,它会在两个向量之间形成⼀条直线,但实际上这是不可能的。
细米粉3.切⽐雪夫距离(两点之间某⼀维度的最⼤值)
切⽐雪夫距离通常⽤于特定的⽤例,这使得它很难像欧⽒距离那样作为通⽤的距离度量。因此,在确定适合⽤例时才使⽤它。
⽤例:切⽐雪夫距离⽤于提取从⼀个⽅块移动到另⼀个⽅块所需的最⼩移动次数。此外,在允许⽆限制⼋向移动的游戏中,这可能是有⽤的⽅法。在实践中,切⽐雪夫距离经常⽤于仓库物流,因为它⾮
常类似于起重机移动⼀个物体的时间。
反抗型依恋4.闵可夫斯基距离(⼀组距离)
闵⽒距离与它们所代表的距离度量有相同的缺点,因此,对哈顿距离、欧⼏⾥得距离和切⽐雪夫距离等度量标准有个好的理解⾮常重要。此外,参数 p 的使⽤可能很⿇烦,因为根据⽤例,查找正确的 p 值在计算上效率低。
⽤例:p 的积极⼀⾯是可迭代,并找到最适合⽤例的距离度量。它允许在距离度量上有很⼤的灵活性。
害怕错过>吹风机英文
5.马⽒距离(与量纲⽆关)
马⽒距离⽤于度量两个坐标点之间的距离关系,表⽰数据的协⽅差距离。与欧⽒距离不同的是它考虑到各种特性之间的联系(例如:⼀条关于⾝⾼的信息会带来⼀条关于体重的信息,因为两者是有关联的)并且是尺度⽆关的(scale-invariant),即独⽴于测量尺度。
6.汉明距离
2个字符串之间⼀个字符串变为另⼀个字符串所需要做的最⼩字符替换次数,⽤来衡量编码的复杂程度。
例如:
1011101与1001001之间的汉明距离是2。
2143896与2233796之间的汉明距离是3。
钩虾