我有存在于高维空间中的二进制分类数据,但我有大量的选项,用于表示数据的精确子空间。如何计算给定高维空间中二进制数据集群的性能?
下面是一个特殊的高维表示的例子,用t-sne表示为2D (为了可视化目的,数据保存在高D空间中)。
我想用一种函数式的方法来表示“这个空间是x
,擅长分离True
和False
数据”,这样就可以将数据的空间表示与其他空间表示进行比较。
发布于 2020-08-27 08:45:09
还没有实现它,但我认为这是可行的:
abs(0.5 - numTrue/(numTrue+numFalse))*2
,以获得一个特定集群在分离True
和Flase
数据时的性能,Flase
数据H 110所有“标准化好”之和来标准化每个集群的所有“好”,这就是h 211f 212的好程度。
https://stackoverflow.com/questions/63620155
复制相似问题