正则表达式RegExp语法与用法详解

JavaScript/前端
374
0
0
2023-03-16
目录
  • 正则表达式的定义和用途
  • 创建正则表达式
  • 方式一:使用构造函数创建
  • 方式二:使用字面量创建
  • 正则表达式的语法
  • 匹配字符
  • 简写
  • 模式修正符
  • 贪婪匹配
  • 断言
  • 正则表达式的使用
  • 搜索第一个符合条件的字符串 search()
  • 搜索所有符合条件的字符串 match()
  • 字符串拆分成数组 split()
  •  字符串替换 replace()
  • 过滤HTML标签 
  • 去除空格
  • 常用正则表达式
  • 总结

正则表达式的定义和用途

正则表达式用于定义一些字符串的规则。计算机可以根据正则表达式,来检查一个字符串是否符合指定的规则,或者将字符串中符合规则的内容提取出来。

RegExp的意思是 Regular expression。使用typeof检查正则对象,会返回object。

创建正则表达式

方式一:使用构造函数创建

使用构造函数创建时,更加灵活,因为参数中还可以传递变量。

	var 变量 = new RegExp("正则表达式"); // 注意,参数是字符串
	var 变量 = new RegExp("正则表达式", "匹配模式"); // 注意,两个参数都是字符串

匹配模式作为第二个参数。这个参数可以是:

  • i 忽略大小写。这里的 i 指的是 ignore。
  • g 全局匹配模式。这里的 g 指的是 global。
var reg = new RegExp("a"); // 定义一个正则表达式:检查一个字符串中是否含有 a
 
var reg = new RegExp('A', 'i');
var str = 'qiangu';
 
console.log(reg.test(str)); // 打印结果:true

方式二:使用字面量创建

	var 变量 = /正则表达式/;  // 注意,这个语法里没有引号
 
	var 变量 = /正则表达式/匹配模式;  // 注意,这个语法里没有引号
	var reg = /A/i; // 定义正则表达式的规则:检查一个字符串中是否含有 a。忽略大小写。
	var str = "qiangu";
 
	console.log(typeof reg);  // 打印结果:object
	console.log(reg.test(str)); // 打印结果:true

正则表达式的语法

匹配字符

字符

描述

.

匹配任意单个字符除了换行符

[ ]

[ ] 内为字符集,匹配 [ ] 内任一字符

[^ ]

匹配除了方括号里的任意字符

*

匹配 >= 0 个 * 号前的字符。

+

匹配 >= 1 个+号前的字符。

?

匹配 0 或 1 个 ?号前的字符。

{n,m}

匹配n到m个大括号之前的字符或字符集

(xyz)

匹配与 xyz 完全相等的字符串

|

或运算符,匹配|符号前或后的字符

\s

匹配空格

\

转义字符,匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |

^

从开始行开始匹配

$

从末端开始匹配

  • /[ab]/ 等价于 /a|b/:检查一个字符串中是否包含 a或b
  • /[a-z]/:检查一个字符串那种是否包含任意小写字母
  • /[A-Z]/:任意大写字母
  • /[A-z]/:任意字母
  • /[0-9]/:任意数字
  • /a[bde]c/:检查一个字符串中是否包含 abc 或 adc 或 aec
  • [Tt]he 匹配 the 和 The
  • [^c]ar 匹配一个后面跟着ar的除了c的任意字符,如匹配par,不匹配car
  • [a-z]* 匹配一个行中所有以小写字母开头的字符串。
"[a-z]*" => The car parked in the garage

c.+t 匹配以首字母c开头以t结尾,中间跟着至少一个字符的字符串

"c.+t" => The fat cat sat on the mat
  • [T]?he 匹配字符串 he 和 The
  • [0-9]{2,3} 匹配最少 2 位最多 3 位 0~9 的数字
  • 可以省略第二个参数。 例如,[0-9]{2,} 匹配至少两位 0~9 的数字。
  • 逗号也省略掉则表示重复固定的次数。 例如,[0-9]{3} 匹配3位数字
  • (c|g|p)ar 匹配 car 或 gar 或 par
  • "(f|c|m)at\.?" => The fat cat sat on the mat.
  • "(T|t)he" => The car is parked in the garage.
  • "^(T|t)he" => The car is parked in the garage.

简写

简写

描述

\w

匹配所有字母数字,等同于 [a-zA-Z0-9_]

\W

匹配所有非字母数字,即符号,等同于: [^\w]

\d

匹配数字: [0-9]

\D

匹配非数字: [^\d]

\s

匹配所有空格字符,等同于: [\t\n\f\r\p{Z}]

\S

匹配所有非空格字符: [^\s]

\f

匹配一个换页符

\n

匹配一个换行符

\r

匹配一个回车符

\t

匹配一个制表符

\v

匹配一个垂直制表符

\p

匹配 CR/LF(等同于 \r\n),用来匹配 DOS 行终止符

模式修正符

标志

描述

i

忽略大小写。

g

全局搜索。

m

多行修饰符:锚点元字符 ^ $ 工作范围在每行的起始。

  • "/The/gi" => The fat cat sat on the mat.
  • "/.(at)/g" => The fat cat sat on the mat.
  • (^,$) 用于检查格式是否是在待检测字符串的开头或结尾。但我们如果想要它在每行的开头和结尾生效,我们需要用到多行修饰符 m。

贪婪匹配

正则表达式默认采用贪婪匹配模式,在该模式下意味着会匹配尽可能长的子串。

"/(.*at)/" => The fat cat sat on the mat.

惰性匹配

使用 ? 将贪婪匹配模式转化为惰性匹配模式。

"/(.*?at)/" => The fat cat sat on the mat.

断言

符号

描述

?=

正先行断言-存在

?!

负先行断言-排除

?<=

正后发断言-存在

?<!

负后发断言-排除

  • 定义一个正先行断言要使用 ()。在括号内部使用一个问号和等号: (?=...)。正先行断言的内容写在括号中的等号后面。 例如,表达式 (T|t)he(?=\sfat) 匹配 The 和 the,在括号中我们又定义了正先行断言 (?=\sfat) ,即 The 和 the 后面紧跟着 (空格)fat。
"(T|t)he(?=\sfat)" => The fat cat sat on the mat.
  • 负先行断言 ?! 用于筛选出其后不跟随断言中定义的格式。表达式 (T|t)he(?!\sfat) 匹配 The 和 the,且其后不跟着 (空格)fat。
"(T|t)he(?!\sfat)" => The fat cat sat on the mat.
  • 正后发断言 记作(?<=...) 用于筛选所有匹配结果,筛选条件为 其前跟随着断言中定义的格式。 例如,表达式 (?<=(T|t)he\s)(fat|mat) 匹配 fat 和 mat,且其前跟着 The 或 the。
"(?<=(T|t)he\s)(fat|mat)" => The fat cat sat on the mat.
  • 负后发断言 记作 (?<!...) 用于筛选所有匹配结果,筛选条件为 其前不跟随着断言中定义的格式。 例如,表达式 (?<!(T|t)he\s)(cat) 匹配 cat,且其前不跟着 The 或 the。
"(?<!(T|t)he\s)(cat)" => The cat sat on cat.

正则表达式的使用

判断字符串是否符合规则 test()

符合则返回true,否则返回false。

  var reg = /[^ab]/; // 规则:字符串中,除了a、b之外,还有没有其他的字符内容?
  var str = "acb";
 
  console.log(reg.test(str)); // 打印结果:true
	var reg = /[^0-9]/;  // 规则:字符串中,除了数字之外,还有没有其他的内容?
	var str1 = "1991";
	var str2 = "199a1";
 
	console.log(reg.test(str1)); // 打印结果:false (如果字符串是 纯数字,则返回 false)
	console.log(reg.test(str2)); // 打印结果:true

搜索第一个符合条件的字符串 search()

search()【只会查找第一个】——搜索字符串中是否含有指定内容。如果搜索到指定内容,则会返回第一次出现的索引;否则返回-1。

	var str = "hello abc hello aec afc";
	// 搜索字符串中是否含有abc 或 aec 或 afc
	result = str.search(/a[bef]c/);
	console.log(result); // 打印结果:6

搜索所有符合条件的字符串 match()

从一个字符串中将符合条件的内容提取出来,封装到一个数组中返回(即使只查询到一个结果)。

默认情况下,match()方法只会找到第一个符合要求的内容,设置正则表达式为全局匹配模式,这样就会匹配到所有的内容,并以数组的形式返回。

可以为一个正则表达式设置多个匹配模式,且匹配模式的顺序无所谓。

	var str = "1a2a3a4a5e6f7A8B9C";
 
	var result1 = str.match(/[a-z]/);   // 找到符合要求的第一个内容,然后返回
	var result2 = str.match(/[a-z]/g);  // 设置为“全局匹配”模式,匹配字符串中 所有的小写字母
	var result3 = str.match(/[a-z]/gi); // 设置多个匹配模式,匹配字符串中 所有的字母(忽略大小写)
 
	console.log(result1); // 打印结果:["a"]
	console.log(result2); // 打印结果:["a", "a", "a", "a", "e", "f"]
	console.log(result3); // 打印结果:["a", "a", "a", "a", "e", "f", "A", "B", "C"]

字符串拆分成数组 split()

	var str = "1a2b3c4d5e6f7g";
	var result = str.split(/[A-z]/); // 参数是一个正则表达式:表示所有字母
	console.log(result); //  ["1", "2", "3", "4", "5", "6", "7", ""]

 字符串替换 replace()

默认只会替换第一个,如果需要替换全部符合条件的内容,可以设置正则表达式为全局匹配模式。

let str1 = '2020/5/20'
console.log(str1.replace(/\//g,"-"));  //得到 2020-5-20
   
var str2 = "Today is fine day,today is fine day !!!"
console.log(str2.replace("today","tomorrow"));  //只能替换第一个today
console.log(str2.replace(/today/gi,"tomorrow")); //这里用到了正则,且为“全局匹配”模式,才能替换所有的today

过滤HTML标签 

str.replace(/<.*?>/g, "") 

去除空格

	str = str.replace(/^\s*/, ""); //去除开头的空格
 
	str = str.replace(/\s*$/, ""); //去除结尾的空格

常用正则表达式

常用正则表达式大全

最全的常用正则表达式大全——包括校验数字、字符、一些特殊的需求等等

非零数字(只能输入数字,但值不能为0,可以是00,01等)

/^([0]{2}|0[1-9]|[1-9])\d*$/

验证保留两位小数的正整数或0

/^([1-9]\d*|0)(\.\d{1,2})?$/

验证手机号码,如13908653654

/^(1[3|5|7|8][0-9]{9})$/

验证固定号码,如010-86551122或01086551122

/^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$/

 验证电话号码—手机号码或固定号码,如13908653654或010-86551122或01086551122

/(^(1[3|5|7|8][0-9]{9})$)|(^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$)/

验证一代身份证号码

/^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$/

验证二代身份证号码

/^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}[\dXx]$/

验证通用身份证号码

/(^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$)|(^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}(\d|X|x)$)/