在进行两个list的距离相似度验证时,遇到了一点小波折,在这里和大家分享下~
问题发现:
在分析对比结果badcase时,发现在传给pygetdisval.py两个list:[‘a’,’b’]和[‘c’...print Levenshtein.seqratio(a, b)
运行结果如下:
[@hbhly_56_129 levenshtein]# python pygetdisval.py "['a','b'...而levenshtein对于两个string的对比,levenshtein算法对于字符串是逐个字符,也就是[‘a’,’b’]和[‘c’,’d’]都会变成9个字符,而[ ] ’ ’ , 这些字符在两个字符串中都存在...']'] ['[', "'", 'c', "'", ',', "'", 'd', "'", ']']
0.777777777778
发现结果还是没变,而且虽然转成list,但是将每个字符转成list中的元素...重新调整了下:
1、传入的参数不再是两个list,而是以 , 分割的字符串:a,b和c,d
2、在py里面先将字符串转成list,再进行距离对比。
脚本调整如下:
#!