给定 2 个字符串 a, b. 编辑距离是将 a 转换为 b 的最少操作次数,操作只允许如下 3 种:
用分治的思想解决比较简单,将复杂的问题分解成相似的子问题
那么有如下递归规律( a[i] 和 b[j] 分别是字符串 a 和 b 的最后一位):
递归边界:
按照上面的思路将代码写下来
int edit_distance(char *a, char *b, int i, int j)
{
if (j == 0) {
return i;
} else if (i == 0) {
return j;
// 算法中 a, b 字符串下标从 1 开始,c 语言从 0 开始,所以 -1
} else if (a[i-1] == b[j-1]) {
return edit_distance(a, b, i - 1, j - 1);
} else {
return min_of_three(edit_distance(a, b, i - 1, j) + 1,
edit_distance(a, b, i, j - 1) + 1,
edit_distance(a, b, i - 1, j - 1) + 1);
}
}
edit_distance(stra, strb, strlen(stra), strlen(strb));
但是有个严重的问题,就是代码的性能很低下,时间复杂度是指数增长的
上面的代码中,很多相同的子问题其实是经过了多次求解,解决这类问题的办法是用动态规划思想优化时间复杂度
像以上解决思路,是从后往前算的,比如我想知道 edit_distance(a, b, i, j) 我可能需要知道 edit_distance(a, b, i-1, j-1) ,有一种想法不错,就是从前往后算,先算出各个子问题,然后根据子问题,计算出原问题, 对于这个问题性能不错,而且也挺容易理解,下面就来说一说 例如以字符串 a = “fxy”, b = “fab” 为例
现在的时间复杂度已到了可接受范围,为 O(mn)
代码如下:
function minDistance(s1, s2) {
const len1 = s1.length
const len2 = s2.length
let matrix = []
for (let i = 0; i <= len1; i++) {
// 构造二维数组
matrix[i] = new Array()
for (let j = 0; j <= len2; j++) {
// 初始化
if (i == 0) {
matrix[i][j] = j
} else if (j == 0) {
matrix[i][j] = i
} else {
// 进行最小值分析
let cost = 0
if (s1[i - 1] != s2[j - 1]) { // 相同为0,不同置1
cost = 1
}
const temp = matrix[i - 1][j - 1] + cost
matrix[i][j] = Math.min(matrix[i - 1][j] + 1, matrix[i][j - 1] + 1, temp)
}
}
}
return matrix[len1][len2] //返回右下角的值
}
minDistance('jary','jerry') // 2