新建正则表达式
- 方法一:直接量语法
var reg = /pattern/attribute;
- 创建RegExp对象的语法
var reg = new RegExp(pattern, attributes);参数说明:
- 参数 pattern 是一个字符串,指定了正则表达式的魔石或其他正则表达式
- 参数 attributes 是一个可选的字符串,包含属性 'g'、'i'和'm',分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则省略改参数。
两者的区别在于:
- 采用直接量语法新建的正则表达式对象在代码编辑时就会产生,是平常开发模式中常用的方式;
- 采用构造函数生成的正则对象要在代码运行时生成
正则表达式使用:
- 正则对象的方法是指这样使用的: RegExp对象.方法(字符串)
- 字符串对象的方法是这样使用: 字符串。方法(RegExp对象)
- ignoreCase 返回布尔值,表示RegExp对象是否具有标志 i
- global 返回布尔值,表示RegExp对象是否具有表示 g
- multiline 返回布尔值,表示RegExp对象是否具有表示 m
- lastIndex 一个整数,标识开始下一次匹配的字符位置
- soure 返回正则表达式的原文本 (不包括反斜杠)
- i 执行对大小写不敏感的匹配
- g 执行全局匹配 (查找所有匹配而非在找到第一个匹配后停止)
- m 执行多行匹配
由于验证时,通常需要在前后加上 ^ 和 $,以匹配整个待验证字符串;
搜索、替换时是否加上此限定规则更具搜索的需求而定,此外,也有可能在前后加上 \b 而不是 ^ 和 $
- [...]查找方括号之间的任何字符
- [^..]查找任何不在方括号之间的字符
- [a-z]查找任何从小写a到小写z的字符
- [A-Z]查找任何从大写A到大写Z的字符
- [A-z]查找任何从大写A到小写z的字符
- . 查找单个字符,除了换行和行结束符
- \w 查找单词字符,等价于 [a-zA-Z0-9]
- \W 查找非单词字符,等价于 [^a-zA-Z0-9]
- \s 查找空白字符
- \S 查找非空白字符
- \d 查找数字,等价于[0-9]
- \D 查找非数字字符,等价于[^0-9]
- \b 匹配单词边界
- \r 查找回车符
- \t 查找制表符
- \0 查找NULL字符
- \n 查找换行符
- {n,m}匹配前一项至少n次,但不能超过m次
- {n,}匹配前一项n次或更多次
- {n}匹配前一项n次
- n?匹配前一项0次或者1次,也就是说前一项是可选的,等价于{0,1}
- n+匹配前一项一次或多次,等价于{1,}
- n*匹配前一项0次或多次,等价于{0,}
- n$匹配任何结尾为n的字符串
- ^n匹配任何开头为n的字符串
- ?=n匹配任何其后紧接指定字符串n的字符串
- ?!n匹配任何其后没有紧接指定字符串n的字符串
- ^[1-9]\d*$ 匹配正整数
- ^-[1-9]\d*$ 匹配负整数
- ^-?[0-9]\d*$ 匹配整数
- ^[1-9]\d*|0$ 匹配非负整数(正整数 + 0)
- ^-[1-9]\d*|0$ 匹配非正整数(负整数 + 0)
- ^[1-9]\d*.\d*|0.\d*[1-9]\d*$ 匹配正浮点数
- ^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 匹配负浮点数
- ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$ 匹配浮点数
- ^[1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$ 匹配非负浮点数(正浮点数 + 0)
- ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$ 匹配非正浮点数(负浮点数 + 0)
- ^[A-Za-z]+$ 匹配由26个英文字母组成的字符串
- ^[A-Z]+$ 匹配由26个英文字母的大写组成的字符串
- ^[a-z]+$ 匹配由26个英文字母的小写组成的字符串
- ^[A-Za-z0-9]+$ 匹配由数字和26个英文字母组成的字符串
- ^\w+$ 匹配由数字、26个英文字母或者下划线组成的字符串
- 检索字符串中指定的值。返回true或者false
- 如果字符串string中含有与RegExpObject匹配的文本,则返回true,否则返回false
- 如果正则表达式带有g修饰符,则每一次test方法都从上一次匹配结束的位置开始匹配。
- 使用了g修饰符的正则表达式,表示要记录每一次搜索的位置,直接使用test方法,每次开始搜索的位置都是上一次匹配的最后一个位置。
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>test方法</title>
</head>
<body>
<script type="text/javascript">
var reg = /abc/g;
var str = "123abc456abc";
console.log(reg.lastIndex);//0
console.log(reg.test(str));//true
console.log(reg.lastIndex);//6
console.log(reg.test(str));//true
console.log(reg.lastIndex);//12
console.log(reg.test(str));//false
</script>
</body>
</html>
如果正则表达式使一个空字符串,则会匹配所有的字符串,但需要使用new RegExp()方式
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>test方法</title>
</head>
<body>
<script type="text/javascript">
console.log(new RegExp('').test('abc'));//true
console.log(/''/.test('abc'));//false
console.log(/''/.test("''"));//true
</script>
</body>
</html>
- exec() 方法用于检索字符串中的正则表达式的匹配
- 返回一个数组,其中存放匹配的结果。如果未找到,则返回值为null
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>exec方法</title>
</head>
<body>
<script type="text/javascript">
var str = "xyz";
var reg1 = /x/;
var reg2 = /a/;
var res1 = reg1.exec(str);
var res2 = reg2.exec(str);
console.log(res1);//["x", index: 0, input: "xyz"]
console.log(res2);//null
</script>
</body>
</html>
如果正则表达式包括圆括号,则返回的数组会包括多个元素。首先是整个匹配成功的结果,后面是圆括号匹配的结果,如果有多个圆括号,他们的匹配成功结果都会成为数组元素
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>exec方法2</title>
</head>
<body>
<script type="text/javascript">
var str = 'abcdabc';
var reg = /(a)b(c)/;
var res = reg.exec(str);
console.log(res);//["abc", "a", "c", index: 0, input: "abcdabc"]
</script>
</body>
</html>对于调用exec方法返回的数组具有以下两个属性
- input 整个原待匹配的字符串
- index 整个魔石匹配成功的开始位置
- search方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的字符串。
- 返回值: stringObject中第一个与regexp相匹配的子串的起始位置
- 注释: 如果没有找到任何匹配的子串,则返回 -1(和indexOf方法类似)
- search() 方法不执行全局匹配,它将忽略标志g。它同时忽略regexp 的 lastIndex属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>search方法</title>
</head>
<body>
<script type="text/javascript">
var str = "abcdcef";
console.log(str.search(/c/g));//2
</script>
</body>
</html>
- match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。改方法类似indexOf()和lastIndexOf(),凡是它返回指定的值,而不是字符串的位置。
- 字符串对象的match方法与正则对象的exec方法比较类似
- 但是如果正则表达式带有g修饰符,那么match方法与exec方法就有差别
- 可以看到match返回了所有成功匹配的结果,但是exec方法只返回了一个
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>match方法</title>
</head>
<body>
<script type="text/javascript">
var str = "abcd";
var reg1 = /a/;
var reg2 = /x/;
console.log(str.match(reg1));//["a", index: 0, input: "abcd"]
console.log(str.match(reg2));//null
var str = "abcdabc";
var reg = /a/g;
console.log(str.match(reg));//["a", "a"]
console.log(reg.exec(str));//["a", index: 0, input: "abcdabc"]
</script>
</body>
</html>
- replace() 方法用于在字符串中用一些替换另一些字符,或者换一个与正则表达式匹配的子串
- 返回值:一个新的字符串,使用replacement替换regexp的第一次匹配或所有匹配之后得到的
- 字符串stringObject 的 replace() 方法执行的查找替换的操作。它将在stringObject中查找与regexp相匹配的子字符串,然后用replacement来替换这些子串。如果regexp具有全局标志g,那么replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>replace方法</title>
</head>
<body>
<script type="text/javascript">
var str = "xxx";
console.log(str.replace('x','y'));//yxx
console.log(str.replace(/x/,'y'));//yxx
console.log(str.replace(/x/g,'y'));//yyy
</script>
</body>
</html>
| 字符 | 替换文本 |
| $1、$2、...、$99 | 与regexp中的第1到99个子表达式相匹配的文本 |
| $& | 与regexp相匹配的字串 |
| $` | 位于匹配子串左侧的文本 |
| $' | 位于匹配子串右侧的文本 |
| $$ | 直接量符号 |
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>replace中的特殊字符替换</title>
</head>
<body>
<script type="text/javascript">
//用子表达式替换:$1和$2
//正则表达式中()就是一个子表达式,$1对应是第一个表达式的内容,即java,$2为script
var str = "javascript";
console.log(str.replace(/(java)(script)/,'$2$1')); //输出:scriptjava
//$& 为正则表达式匹配的字符串
//正则表达式通过直接量java来匹配,匹配结果为java,则 $&的值为java,然后用字符串$&-来替换匹配的字符串
var str1 = "javascript";
console.log(str1.replace(/java/,'$&-')); //输出:java-script
var str2 = "javascript";
// $`为匹配子串ava的左侧文本,则为j
console.log(str2.replace(/ava/,"$`")); //输出:jjscript
// $'为匹配子串ava的右侧文本,则为script
console.log(str2.replace(/ava/,"$'")); //输出:jscriptscript
// $$为直接量符号,即插入一个$符号
console.log(str2.replace(/ava/,"$$"));//输出:j$script
</script>
</body>
</html>
- match为匹配整个字符串,即:xyz456789%$&^
- a1 为第一个子表达式,([^\d]*),匹配0个或多个非数字的字符,即:xyz
- a2 为第二个子表达式, (\d*),匹配0个或多个的数字,即:45678
- a3 为第三个子表达式, ([^\w]*),匹配0个或匹配任何非单词字符。等价于[^A-Za-z0-9_],即%$&^
- index 为魔石匹配出现的位置,从第一个字符已经匹配成功,则位置为0
- string为字符串本身,即: xyz45678%$&^
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>replace的参数replacement是函数</title>
</head>
<body>
<script type="text/javascript">
function replacer(match, a1, a2, a3, index, string) {
return [a1, a2, a3].join(' ~ ');
}
var str = 'xyz45678%$&^';
var reg = /([^\d]*)(\d*)([^\w]*)/
var res = str.replace(reg, replacer);
console.log(res);//xyz ~ 45678 ~ %$&^
</script>
</body>
</html>
##### split方法
split(‘字符串的分割正则’,返回数组的最大成员数);返回分割后各部分组成的数组
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>split方法</title>
</head>
<body>
<script type="text/javascript">
var str = 'a,b , c,d';
var res = str.split(",");//以逗号来分割字符串
console.log(res);//["a", "b ", " c", "d"];
var str1 = 'a,b , c,,d';
var res1 = str1.split(/,*/);//以0或多个逗号来分割字符串
console.log(res1);//["a", "b", " ", " ", "c", "d"];
var str2 = 'a, b,c, d';
var res2 = str2.split(/, */);//以0或对个逗号空格来分割字符串
console.log(res2);//["a", "b", "c", "d"];
var str3 = 'a, b,c, d';
var res3 = str3.split(/, */,2);//以0或对个逗号空格来分割字符串,同时限制返回数组中最多有两项
console.log(res3);//["a", "b"];
</script>
</body>
</html>
可以变换正则的匹配规则来分割字符串
下面真这个的匹配规则是以0或多个X来进行分割,如果加上括号则括号匹配的部分也就是分割规则也会成为数组成员返回、
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>split方法2</title>
</head>
<body>
<script type="text/javascript">
var str = "x@@xx@xx@@";
var res = str.split(/x*/);//以0或者对个x为分隔符
console.log(res);//["", "@", "@", "@", "@", "@"];
var res1 = str.split(/(x*)/);//如果加上括号则括号匹配的部分也就是分割规则也会作为数组成员返回
console.log(res1);//["", "x", "@", "", "@", "xx", "@", "xx", "@", "", "@"]
</script>
</body>
</html>
var re = /(\w)/1+/g;
(\w) 外面的圆括号表示分组,\1表示重复第一分组的内容, \1+表示\w匹配到的字符重复n次,后面的g表示执行全部替换
str.replace的第二个参数是函数,参数a表示真个匹配到的字符串,b表示第一捕获分组也就是出现重复的单个字符,将啊。length与记录过的最多重复num比较,如果a.length更大,就将它赋值给num,用value记录重复字符b,这个函数返回的是替换文本,但这里没有返回值,也就是说替换为空,每次替换这个函数都被执行
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>字符串中出现次数最多的字符</title>
</head>
<body>
<script type="text/javascript">
var str = 'mmmmmmmmaaammmmmmmmmbbbbsccc';
function most(str) {
var arr = str.split('');
str = arr.sort().join('');//将字符串按单个字符分割,然后排序组合,经过这一步,相同的字符就会排列到一起
var reg = /(\w)\1+/g;
var num = 0;
var value = '';
str.replace(reg, function (a,b) {
// console.log(a);
if (num<a.length) {
num = a.length;
value = b;
}
});
return '出现次数最多的字符是' + value + '出现了' + num + '次';
}
console.log(most(str));
</script>
</body>
</html>
var url = "http://www.abc.com";
var reg = /[^.]+/;//匹配除了.之外的其他字符
var res = reg.exec(url)[0].substr(7);
console.log(reg.exec(url));//["http://www", index: 0, input: "http://www.abc.com"]
console.log(res);//www
- 匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
- 匹配QQ号码:[1-9][0-9]{4,}
- 邮政编码:[1-9]\d5
- 身份证: /^(\d{14}|\d{17})(\d|[xX])$/
- 匹配ip地址:\d+.\d+.\d+.\d+
- 匹配账号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$表单验证时很实用
- 匹配中文字符: /[\u4E00-\u9FA5\uf900-ufasd]/
- 匹配Email地址:/^([a-zA-Z_0-9-])+@([a-zA-Z_0-9-])+(.[a-zA-Z_0-9-])+$/ (邮箱由三部分组成:1、一个或多个字母数字下划线和杠+@+一个或多个字母数字下划线和杠+。+一个或多个字母数字下划线和杠)
- 匹配网址url: [a-zA-z]+://[^\s]*
- 判断字符串是不是由数字组成: /^\d*$/
- 限制文本框只能输入数字和小数点(两位小数点):/^\d*.?\d{0,2}$/(说明:开头有0个或多个数字,(?表示匹配前一项0次或多次)中间有0个或者1个小数点,小数点后面有0个或者最多2个数字)
- 用户名正则: /^[\u4e00-\u9FA5\uf900-ufa2d-\ufa2d\w]{4,16}$/ (匹配规则:只能是中文,英文,数字,下划线,4-16个字符;匹配中文规则:/[\u4E00-\u9FA5\uf900-\ufa2d]/ , \w 是匹配英文,数字,下划线)
- 匹配英文地址:/^[a-zA-Z][.a-zA-Z\s,0-9]?[a-zA-Z]+ (/匹配规则:包含点,字母,逗号,数字,但是开头和结尾必须是字母;分析开头必须为字母可以这样写/[a-zA-Z]/)结尾必须是字母可以这样写:/[a-zA-Z]+/ 中间包含点,字母,空格,逗号,数字的正则:/[a-zA-Z\s,0-9]?/ 外面的*号是0个或者多个,后面的问号?代表可有可无,有就匹配,没有就不匹配
- 匹配价格: /^\d*(.\d{0,2})?$/ (匹配价格: 开头有0或者多个数字,中间可能有一个小数点,后面有可能有0-2位小数)
- 单词的首字母大写:/\b(\w)|\s(\w)/g
- 验证日期格式: /^\d{4}[-/]\d{1,2}[-/]\d{1,2}$/ (日起格式有两种yyyy-mm-dd或yyyy/mm/dd 分析:月份和天数可能有一位或两位)
- 断断续续敲了这么多,感觉还是晕晕的。(实际项目中,会用到的基本就是验证用户名手机号邮箱,获取地址栏地址参数...敲完开饭)。dd