Week_09

学习笔记

字符串匹配

Rabin-Karp 算法通过哈希算法对主串中的 n-m+1 个子串分别求哈希值，然后逐个与模式串的哈希值比较大小。如果某个子串的哈希值与模式串相等，那就说明对应的子串和模式串匹配了

BM（Boyer-Moore）算法 BM 算法包含两部分，分别是坏字符规则（bad character rule）和好后缀规则（good suffix shift）。

BM 算法核心思想是，利用模式串本身的特点，在模式串中某个字符与主串不能匹配的时候，将模式串往后多滑动几位，以此来减少不必要的字符比较，提高匹配的效率。

BM 算法构建的规则有两类，坏字符规则和好后缀规则。好后缀规则可以独立于坏字符规则使用。因为坏字符规则的实现比较耗内存，为了节省内存，我们可以只用好后缀规则来实现 BM 算法。

KMP 算法我们假设主串是 a，模式串是 b。在模式串与主串匹配的过程中，当遇到不可匹配的字符的时候，我们希望找到一些规律，可以将模式串往后多滑动几位，跳过那些肯定不会匹配的情况。

KMP 算法借鉴 BM 算法的思想，可以总结成好前缀规则。这里面最难懂的就是 next 数组的计算。如果用最笨的方法来计算，确实不难，但是效率会比较低。所以，我讲了一种类似动态规划的方法，按照下标 i 从小到大，依次计算 next[i]，并且 next[i]的计算通过前面已经计算出来的 next[0]，next[1]，……，next[i-1]来推导。

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
isMatch.py		isMatch.py
lengthOfLIS.py		lengthOfLIS.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

FilesExpand file tree

Week_09

Directory actions

More options

Directory actions

More options

Latest commit

History

Week_09

Folders and files

parent directory

README.md