我有一个优化问题,其中我有一组提供者,P
销售不同类型的对象Op
,有不同的性能向量Pv=[p1, p2, p3, ..., pn]
,还有一组客户端请求R
,请求对象Or
具有预期的性能向量Er=[e1, e2, ..., en]
。
我想计算提供程序的对象是什么,这些对象与客户端请求的对象非常接近,给出了性能向量,我看了一些度量,比如:欧几里得平方距离,但是我不确定如何使用它,因为性能向量的单位是不同的,即p1是以秒为单位,p2是以美元度量的,等等……
有人能解释一下并提出一个方法吗?
发布于 2018-11-12 06:35:40
您应该尝试的第一个想法是在比较每个特性之前独立地扩展它们。
例如,获取所有p1
样本,计算平均值和标准差,然后将样本转换为(s - mean)/std
。对您的每个特性都这样做,除了那些已经是二进制的特性(0/1)。
然后,您可以使用欧几里得距离作为第一次测试,以分析,如果点是远或不远。
相似性度量是不同的,但也是相似的,您可以使用类似的e^(-distance(x, y))
来获得0和1之间的相似性,还有其他度量也可以尝试。您应该在缩放数据上使用这些,而不是原始数据。
https://stackoverflow.com/questions/53263960
复制相似问题