SQL如何使用正则表达式对数据进行过滤

MySQL
407
0
0
2023-03-12
目录
  • 1、基本字符匹配
  • 2、进行OR匹配
  • 3、匹配几个字符之一
  • 4、匹配范围
  • 5、匹配特殊字符
  • 6、匹配字符类
  • 7、匹配多个实例
  • 8、定位符
  • 9、like语句与正则
  • 总结

1、基本字符匹配

数据库使用正则进行过滤,写法与like语句非常相似,只需将“like"关键字改为"regexp"即可。我们先来看一个最简单的正则匹配:

select *
from mostimes
where name regexp '666'

分析:这条sql语句表达是字段中包含"666"即为匹配对象。

正则也可以像like语句那样任意匹配一个字符:

select *
from mostimes
where name regexp '.66'

分析:这里使用了正则表达式" .66 “,” . "是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,566、666、766等都匹配且返回。

2、进行OR匹配

OR匹配与C语言的按位或很相似,使用" | "符号,表示符号两边任意一个串匹配了,即返回。用法如下所示:

select *
from mostimes
where name regexp '666|888'

分析:语句中使用了正则表达式"666|888"。" | "为正则表达式的OR操作符。它表示匹配其中之一,因此name字段为666和888都匹配并返回。

3、匹配几个字符之一

顾名思义,该方法是匹配多个字符中的其中一个,用法:

select *
from mostimes
where name regexp '[abc]mos'

分析:使用了正则表达式"[abc]mos"。[abc]定义一组字符,它的意思是匹配a或b或c,因此,amos、bmos和cmos都匹配且返回。

4、匹配范围

在第3个匹配方法中,我们可以对其进行简化,当我们需要匹配"[01234567]mos"时,我们还可以使用下面更简洁的方法:

select *
from mostimes
where name regexp '[0-7]mos'

分析:使用" - "可以简化这种连续字符类型的集合,此外,[a-z]也适用此方法。

5、匹配特殊字符

在前面的几种的匹配方式中,我们可以看到,正则表达式语言是由具有特定含义的特殊字符构成的,那如果我们想要匹配那些特殊字符的时候,就会出现sql注入问题,例如我们需要匹配" . “的时候,那么数据库就会将” . "当做一个任意通配符来匹配,达不到我们期望的值,这个时候我们就需要对其进行转义,例:

select *
from mostimes
where name regexp '\\.mos'

分析:可以看到,我们在‘.’符号的前面加了" \ “,加上双斜杆,数据库就会把” . "符号当做一个普通符号来匹配,其中还包括|、[]以及迄今为止使用过的其他特殊字符。

如果需要对‘\’进行转义时,那么我们就需要使用‘\\\’

6、匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类,具体可以看下表。

说明

[:alnum:]

任意字母和数字(同[a-zA-Z0-9])

[:alpha:]

任意字符(同[a-zA-Z])

[:blank:]

空格和制表(同[\t])

[:cntrl:]

ASCII控制字符(ASCII 0到31和127)

[:digit:]

任意数字(同[0-9])

[:graph:]

与[:print:]相同,但不包括空格

[:lower:]

任意小写字母(同[a-z])

[:print:]

任意可打印字符

[:punct:]

既不在[:alnum:]又不在[:cntrl:]中的任意字符

[:space:]

包括空格在内的任意空白字符(同[\f\n\r\t\v])

[:upper:]

任意大写字母(同[A-Z])

[:xdigit:]

任意十六进制数字(同[a-fA-F0-9])

例子:

select * 
from mostimes
where name REGEXP '[:alnum:]'

分析:表示匹配任意字母和数字,其他的大家可以试下。

7、匹配多个实例

在我们前面学习的几种正则表达式中,所有的匹配都是以单次出现进行匹配的。但有时候我们需要对匹配的次数进行更强的控制,这个时候我们就可以使用重复元字符来匹配。看下表:

元 字 符

说 明

*

0个或多个匹配

+

1个或多个匹配(等于{1,})

?

0个或1个匹配(等于{0,1})

{n}

指定数目的匹配

{n,}

不少于指定数目的匹配

{n,m}

匹配数目的范围(m不超过255)

例子:

select * 
from mostimes
where name REGEXP '[0-9]mostimes?'

分析:"[0-9]"表示匹配任意数字,"mostimes?"匹配mostime和mostimes(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),所以0mostime、1mostimes等都可以匹配。

8、定位符

现在有一个需求,就是需要在串中的指定位置匹配串,但是学的前面那几种都是在文本内任意位置查找匹配,那这个时候我们就可以使用定位符来解决。看下表:

元 字 符

说 明

^

文本的开始

$

文本的结尾

[[:<:]]

词的开始

[[:>:]]

词的结尾

例子:

select * 
from mostimes
where name REGEXP '^[0-9]mos'

分析:" ^ "表示匹配串的开始。所以该语句表示在串开头进行匹配,1mos、2mos、3mos等可以匹配,a1mos、aa1mos等不可以匹配。

9、like语句与正则

like语句与正则的相类似,但是它们的不同点就是like匹配的是整个串,而正则匹配的是子串,但是可以使用定位符“^”与“$”相结合,达到like语句的效果。