首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python算法:如何解决回文索引问题

给定一个单词word和一个字符串S,找到S中的所有起始索引——word的回文。

例如,假设word是“ab”,并且S是“abxaba”,则返回0,3和4。

蛮力破解

对于这个问题野蛮的解决方案是遍历S中每个单词大小的窗口并检查它们是否是回文,如下所示:

from collections import Counter

def is_anagram(s1, s2):

return Counter(s1) == Counter(s2)

def anagram_indices(word, s):

result = []

for i in range(len(s) - len(word) + 1):

window = s[i:i + len(word)]

if is_anagram(window, word):

result.append(i)

return result

这将花费O(|W| * |S|)时间。有没有更快的方法呢?

试试哈希

解决这个问题可以使用的一种方法是Rabin-Karp算法。基本思想是我们可以对目标word做一个基于频率的散列,并检查s下的任何窗口是否散列为相同的值。也就是说,散列将是每个字符和其频率的char * prime_num ** char_freq之和。如果word和窗口的散列匹配,则我们可以对两个字符串手动加上== 。因为预计冲突很少,所以时间将是O(S)。但是,解决这个问题有一个更简单的方法:

计数差异

请注意,沿着窗口移动意味着当实际只有一小部分更新的时候,重新计算整个窗口的频率计数。这种见解引导我们采取以下策略:

制作目标单词的频率字典

当我们沿着字符串前进时,持续比较差异

当字典为空时,窗口和单词匹配

我们通过增加窗口中的新字符并删除旧的字符来区分我们的频率字典。

class FrequencyDict:

def __init__(self, s):

self.d = {}

for char in s:

self.increment(char)

def _create_if_not_exists(self, char):

if char not in self.d:

self.d[char] = 0

def _del_if_zero(self, char):

if self.d[char] == 0:

del self.d[char]

def is_empty(self):

return not self.d

def decrement(self, char):

self._create_if_not_exists(char)

self.d[char] -= 1

self._del_if_zero(char)

def increment(self, char):

self._create_if_not_exists(char)

self.d[char] += 1

self._del_if_zero(char)

def anagram_indices(word, s):

result = []

freq = FrequencyDict(word)

for char in s[:len(word)]:

freq.decrement(char)

if freq.is_empty():

result.append(0)

for i in range(len(word), len(s)):

start_char, end_char = s[i - len(word)], s[i]

freq.increment(start_char)

freq.decrement(end_char)

if freq.is_empty():

beginning_index = i - len(word) + 1

result.append(beginning_index)

return result

这应该在O(S)时间运行,欢迎继续探索其他有趣的编程问题。(小峰翻译)

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180406B1DZBF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券