高效算法可以大大提高某功能的性能。譬如常见的关键字匹配(基本上每个web系统都有脏字过滤),一般是用trie来实现,譬如aho-corasick,比这更快的有Commentz-Walter和Baeza-Yates(aho和Boyer-Moore结合体),比这更快是Wu Manber,i7第三代上跑我写的c井实现,234关键字,170字符文本,每秒680万匹配。
算法ppt:https://www.slideshare.net/mailund/wu-mamber-string-algorithms-2007
领取专属 10元无门槛券
私享最新 技术干货