# coding: utf-8 # file name: regular_expression.py # python version: 2.7 # author: wu ming ming # description: study of regular expression """ . 匹配任意字符(不包括换行符) ^ 匹配开始位置,多行模式下匹配每一行的开始 $ 匹配结束位置,多行模式下匹配每一行的结束 * 匹配前一个元字符0到多次 + 匹配前一个元字符1到多次 ? 匹配前一个元字符0到1次 {m,n} 匹配前一个元字符m到n次 \\ 转义字符,跟在其后的字符将失去作为特殊元字符的含义,例如\\.只能匹配.,不能再匹配任意字符 [] 字符集,一个字符的集合,可匹配其中任意一个字符 | 逻辑表达式 或 ,比如 a|b 代表可匹配 a 或者 b (...) 分组,默认为捕获,即被分组的内容可以被单独取出,默认每个分组有个索引,从 1 开始,按照"("的顺序决定索引值 (?iLmsux) 分组中可以设置模式,iLmsux之中的每个字符代表一个模式,用法参见 模式 I (?:...) 分组的不捕获模式,计算索引时会跳过这个分组 (?P...) 分组的命名模式,取此分组中的内容时可以使用索引也可以使用name (?P=name) 分组的引用模式,可在同一个正则表达式用引用前面命名过的正则 (?#...) 注释,不影响正则表达式其它部分,用法参见 模式 I (?=...) 顺序肯定环视,表示所在位置右侧能够匹配括号内正则 (?!...) 顺序否定环视,表示所在位置右侧不能匹配括号内正则 (?<=...) 逆序肯定环视,表示所在位置左侧能够匹配括号内正则 (?