您当前的位置:首页 > 互联网教程

如何在sql语句中使用正则表达式

发布时间:2025-05-20 23:11:23    发布人:远客网络

如何在sql语句中使用正则表达式

一、如何在sql语句中使用正则表达式

sqlserver中,主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数。

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:

'c'说明在进行匹配时区分大小写(缺省值);

'i'说明在进行匹配时不区分大小写;

'n'(.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行、

'm'字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置、

select* from emp where regexp_like(ename,'^a[a-z]*n$');

可以查找ename中以a开头以n结尾的行.例如ename为arwen或arwin或anden.但Arwen不能被匹配.因为默认是区分大小写.如果是

select* from emp where regexp_like(ename,'^a[a-z]*n$','i')

则可以查找ename为Arwen的行记录。

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关:

'start'开始查找的位置;

'occurrence'说明应该返回第几次出现pattern的位置;

'return_option'说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后的字符的位置;

'match_option'修改默认的匹配设置.与regexp_like里面的相同.

SELECT REGEXP_INSTR('hello world','o',1,1,0) INTO V_RESULT

DBMS_OUTPUT.PUT_LINE(V_RESULT);

结果为5,即字母o第一个次出现的位置。

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数。比如1,3。则结果为6.表示第一次出现字母o的后面一个字符的位置。

如果regexp_instr('hello world','o',1,2,0)则结果为9.表示第二次出现字母o的位置.

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数

SELECT REGEXP_REPLACE('hello world','o','x',1,1) INTO V_RESULT

DBMS_OUTPUT.PUT_LINE(V_RESULT);

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.

如果 REGEXP_REPLACE('hello world','o','x',1,2)则结果为hello wxrld.

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.

SELECT REGEXP_SUBSTR('hello world','l{2}') INTO V_RESULT

DBMS_OUTPUT.PUT_LINE(V_RESULT);

查询到匹配的字符串才返回匹配的字符.没查到就返回空。

二、SQL 常用正则表达式

以下是SQL中常用的正则表达式片段,它们用于匹配不同类型的数据:

这个表达式用于验证字符串是否只包含数字,例如电话号码的一部分。

适用于限制特定长度的数字,如邮政编码或社保号中的部分数字。

3.匹配全汉字: ^[\\u4e00-\\u9fa5]{0,}$

用于验证字符串是否只包含中文字符,如中文姓名。

4.匹配英文和数字: ^[A-Za-z0-9]+$

适用于验证电子邮件地址或简短的文本,如用户名。

用于限定字符串中只包含小写字母,如专有名词或单词。

6.匹配Email地址:\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*$

这是一种通用的Email地址格式验证模式。

7.匹配域名: [a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?

用于验证URL中的二级域名或顶级域名部分。

8.匹配手机号码: ^(13[0-9]|14[5|7]|15[0-9]|18[0-9])\d{8}$

确保输入的是中国的手机号码格式。

9.匹配身份证号:(\\d{15}$)|(\\d{18}$)|(\\d{17}(\\d|X|x))$

验证中国大陆的15位、18位身份证号码或部分格式。

10.匹配日期格式:\\d{4}-\\d{1,2}-\\d{1,2}

适用于验证日期,如YYYY-MM-DD格式。

这些正则表达式在SQL查询中帮助我们验证和过滤输入数据,确保数据的准确性和一致性。

三、sql 实现正则表达式

1、确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配。然而,可使用字符串的任意片段匹配通配符。与使用=和!=字符串比较运算符相比,使用通配符可使 LIKE运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft® SQL Server™会将其转换成字符串数据类型(如果可能)。

2、match_expression [ NOT ] LIKE pattern [ ESCAPE escape_character ]

3、match_expression任何字符串数据类型的有效 SQL Server表达式。

4、patternmatch_expression中的搜索模式,可以包含下列有效 SQL Server通配符

5、1%包含零个或更多字符的任意字符串

6、示例:WHERE title LIKE'%computer%'将查找处于书名任意位置的包含单词 computer的所有书名。

7、示例:WHERE au_fname LIKE'_ean'将查找以 ean结尾的所有 4个字母的名字(Dean、Sean等)。

8、示例:WHERE au_lname LIKE'[C-P]arsen'将查找以arsen结尾且以介于 C与 P之间的任何单个字符开始的作者姓氏,例如,Carsen、Larsen、Karsen等

9、4 [^]不属于指定范围中的任何单个字符,与 []相反

10、示例:WHERE au_lname LIKE'de[^l]%'将查找以 de开始且其后的字母不为 l的所有作者的姓氏。

11、在搜索Datetime类型时,建议使用like.

12、LIKE支持 ASCII模式匹配和 Unicode模式匹配。当所有参数,包括 match_expression、pattern和 escape_character(如果有)都是 ASCII字符数据类型时,将执行 ASCII模式匹配。如果其中任何参数属于 Unicode数据类型,则所有参数将被转换为 Unicode并执行 Unicode模式匹配。当对 Unicode数据(nchar或 nvarchar数据类型)使用 LIKE时,尾随空格是有意义的。但是对于非 Unicode数据,尾随空格没有意义。Unicode LIKE与 SQL-92标准兼容。ASCII LIKE与 SQL Server的早期版本兼容

13、例如,此查询将显示数据库中所有的系统表,因为它们都以字母 sys开始:

14、FROM INFORMATION_SCHEMA.TABLES

15、WHERE TABLE_NAME LIKE'sys%'

16、若要查阅非系统表的所有对象,请使用 NOT LIKE'sys%'。如果共有 32个对象且 LIKE找到 13个与模式匹配的名称,则 NOT LIKE将找到 19个与 LIKE模式不匹配的对象

17、可搜索包含一个或多个特殊通配符的字符串。例如,customers数据库中的 discounts表可能存储含百分号(%)的折扣值。若要搜索作为字符而不是通配符的百分号,必须提供 ESCAPE关键字和转义符。例如,一个样本数据库包含名为 comment的列,该列含文本 30%。若要搜索在 comment列中的任何位置包含字符串 30%的任何行,请指定由 WHERE comment LIKE'%30!%%' ESCAPE'!'组成的 WHERE子句。如果不指定 ESCAPE和转义符,SQL Server将返回所有含字符串 30的行。

18、下例使用 ESCAPE子句和转义符查找 mytbl2表的 c1列中的精确字符串 10-15%

19、IF EXISTS(SELECT TABLE_NAME FROM INFORMATION_SCHEMA.TABLES

20、 WHERE TABLE_NAME='mytbl2')

21、INSERT mytbl2 VALUES('Discount is 10-15% off')

22、INSERT mytbl2 VALUES('Discount is.10-.15 off')

23、WHERE c1 LIKE'%10-15!% off%' ESCAPE'!'

24、下例查找姓为 Carson、Carsen、Karson或 Karsen的作者所在的行。

25、SELECT au_lname, au_fname, phone

26、WHERE au_lname LIKE'[CK]ars[eo]n'

27、ORDER BY au_lname ASC, au_fname ASC