您当前的位置:首页 > 互联网教程

求一条php做的正则表达式

发布时间:2025-05-23 14:59:04    发布人:远客网络

求一条php做的正则表达式

一、求一条php做的正则表达式

1、PHP被大量的应用于Web的后台CGI开发,通常是在用户数据数据之后得出某种结果,但是如果用户输入的数据不正确,就会出现问题,比如说某人的生日是”2月30日”!那应该怎么样来检验暑假是否正确呢?在PHP中加入了正则表达式的支持,让我们可以十分方便的进行数据匹配。

2、简单的说,正则表达式是一种可以用于模式匹配和替换的强大工具。在几乎所有的基于UNIX/LINUX系统的软件工具中找到正则表达式的痕迹,例如:Perl或PHP脚本语言。此外,JavaScript这种客户端的脚本语言也提供了对正则表达式的支持,现在正则表达式已经成为了一个通用的概念和工具,被各类技术人员所广泛使用。

3、在某个Linux网站上面有这样的话:”如果你问一下Linux爱好者最喜欢什么,他可能会回答正则表达式;如果你问他最害怕什么,除了繁琐的安装配置外他肯定会说正则表达式。”

4、正如上面说的,正则表达式看起来非常复杂,让人害怕,大多数的PHP初学者都会跳过这里,继续下面的学习,但是PHP中的正则表达式有着可以利用模式匹配找到符合条件的字符串、判断字符串是否合乎条件或者用指定的字符串来替代符合条件的字符串等强大的功能,不学实在太可惜了……

5、一个正则表达式,分为三个部分:分隔符,表达式和修饰符。

6、分隔符可以是除了特殊字符以外的任何字符(比如”/!”等等),常用的分隔符是”/”。表达式由一些特殊字符(特殊字符详见下面)和非特殊的字符串组成,比如”[a-z0-9_-]+@[a-z0-9_-.]+”可以匹配一个简单的电子邮件字符串。修饰符是用来开启或者关闭某种功能/模式。下面就是一个完整的正则表达式的例子:

7、上面的正则表达式”/”就是分隔符,两个”/”之间的就是表达式,第二个”/”后面的字符串”is”就是修饰符。

8、在表达式中如果含有分隔符,那么就需要使用转义符号”",比如”/hello.+?/hello/is”。转义符号除了用于分隔符外还可以执行特殊字符,全部由字母构成的特殊字符都需要”"来转义,比如”d”代表全体数字。

9、正则表达式中的特殊字符分为元字符、定位字符等等。

10、元字符是正则表达式中一类有特殊意义的字符,用来描述其前导字符(即元字符前面的字符)在被匹配的对象中出现的方式。元字符本身是一个个单一的字符,但是不同或者相同的元字符组合起来可以构成大的元字符。

11、大括号:大括号用来精确指定匹配元字符出现的次数,例如”/pre{1,5}/”表示匹配的对象可以是”pre”、”pree”、”preeeee”这样在”pr”后面出现1个到5个”e”的字符串。或者”/pre{,5}/”代表pre出现0此到5次之间。

12、加号:”+”字符用来匹配元字符前的字符出现一次或者多次。例如”/ac+/”表示被匹配的对象可以是”act”、”account”、”acccc”等在”a”后面出现一个或者多个”c”的字符串。”+”相当于”{1,}”。

13、星号:”*”字符用来匹配元字符前的字符出现零次或者多次。例如”/ac*/”表示被匹配的对象可以是”app”、”acp”、”accp”等在”a”后面出现零个或者多个”c”的字符串。”*”相当于”{0,}”。

14、问号:”?”字符用来匹配元字符前的字符出现零次或者1次。例如”/ac?/”表示匹配的对象可以是”a”、”acp”、”acwp”这样在”a”后面出现零个或者1个”c”的字符串。”?”在正则表达式中还有一个非常重要的作用,即”贪婪模式”。

15、还有两个很重要的特殊字符就是”[ ]“。他们可以匹配”[]“之中出现过的字符,比如”/[az]/”可以匹配单个字符”a”或者”z”;如果把上面的表达式改成这样”/[a-z]/”,就可以匹配任何单个小写字母,比如”a”、”b”等等。

16、如果在”[]“中出现了”^”,代表本表达式不匹配”[]“内出现的字符,比如”/[^a-z]/”不匹配任何小写字母!并且正则表达式给出了几种”[]“的默认值:

17、[:xdigit:]:匹配任何16进制数字

18、另外下面这些特殊字符在转义符号”"转义后代表的含义如下:

19、S:用于匹配除单个空格符之外的所有字符。

20、d:用于匹配从0到9的数字,相当于”/[0-9]/”。

21、w:用于匹配字母,数字或下划线字符,相当于”/[a-zA-Z0-9_]/”。

22、W:用于匹配所有与w不匹配的字符,相当于”/[^a-zA-Z0-9_]/”。

23、D:用于匹配任何非10进制的数字字符。

24、.:用于匹配除换行符之外的所有字符,如果经过修饰符”s”的修饰,”.”可以代表任意字符。

25、利用上面的特殊字符可以很方便的表达一些比较繁琐的模式匹配。例如”/d0000/”利用上面的正则表达式可以匹配万以上,十万一下的整数字符串。

26、定位字符是正则表达式中又一类非常重要的字符,它的主要作用是用于对字符在匹配对象中的位置进行描述。

27、^:表示匹配的模式出现在匹配对象的开头(和在”[]“里面不同)

28、$:表示匹配的模式出现在匹配对象的末尾

29、空格:表示匹配的模式出现在开始和结尾的两个边界之一

30、“/^he/”:可以匹配以”he”字符开头的字符串,比如hello、height等等;

31、“/he$/”:可以匹配以”he”字符结尾的字符串即she等;

32、“/ he/”:空格开头,和^的作用一样,匹配以he开头的字符串;

33、“/he/”:空格结束,和$的作用一样,匹配以he结尾的字符串;

34、“/^he$/”:表示只和字符串”he”匹配。

35、正则表达式除了可以用户匹配,还可以用括号”()”来记录需要的信息,储存起来,给后面的表达式读取。比如:

36、/^([a-zA-Z0-9_-]+)@([a-zA-Z0-9_-]+)(.[a-zA-Z0-9_-])$/

37、就是记录邮件地址的用户名,和邮件地址的服务器地址(形式为username@server.com之类的),在后面如果想要读取记录下来的字符串,只是需要用”转义符+记录的次序”来读取。比如”1〃就相当于第一个”[a-zA-Z0-9_-]+”,”2〃相当于第二个([a-zA-Z0-9_-]+),”3〃就是第三个(.[a-zA-Z0-9_-])。但是在PHP中,”"是一个特殊的字符,需要转义,所以”"到了PHP的表达式中就应该写成”1〃。

38、“|”:或符号”|”和PHP里面的或一样,不过是一个”|”,而不是PHP的两个”||”!意思就是可以是某个字符或者另一个字符串,比如”/abcd|dcba/”可能匹配”abcd”或者”dcba”。

39、前面在元字符中提到过”?”还有一个重要的作用,即”贪婪模式”,什么是

二、求PHP 的正则表达式 大全

匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\r评注:可以用来删除空白行匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*?/>评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为匹配首尾空白字符的正则表达式:^\s*|\s*$评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*评注:表单验证时很实用匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*评注:网上流传的版本功能很有限,上面这个基本可以满足需求匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$评注:表单验证时很实用匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}评注:匹配形式如 0511-4405222或 021-87888822匹配腾讯QQ号:[1-9][0-9]{4,}评注:腾讯QQ号从10000开始匹配中国邮政编码:[1-9]\d{5}(?!\d)评注:中国邮政编码为6位数字匹配身份证:\d{15}|\d{18}评注:中国的身份证为15位或18位匹配ip地址:\d+\.\d+\.\d+\.\d+评注:提取ip地址时有用匹配特定数字: ^[1-9]\d*$//匹配正整数 ^-[1-9]\d*$//匹配负整数 ^-?[1-9]\d*$//匹配整数 ^[1-9]\d*|0$//匹配非负整数(正整数+ 0) ^-[1-9]\d*|0$//匹配非正整数(负整数+ 0) ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$//匹配正浮点数 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$//匹配负浮点数 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$//匹配浮点数 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$//匹配非负浮点数(正浮点数+ 0) ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$//匹配非正浮点数(负浮点数+ 0)评注:处理大量数据时有用,具体应用时注意修正匹配特定字符串: ^[A-Za-z]+$//匹配由26个英文字母组成的字符串 ^[A-Z]+$//匹配由26个英文字母的大写组成的字符串 ^[a-z]+$//匹配由26个英文字母的小写组成的字符串 ^[A-Za-z0-9]+$//匹配由数字和26个英文字母组成的字符串 ^\w+$//匹配由数字、26个英文字母或者下划线组成的字符串/http:\/\/(.*)\//i//匹配外部链接地址

三、邮箱正则表达式+正则基本知识点

1、今天来搞几个邮箱正则表达式,匹配多级域名,包括中文域名

2、从上图可以得出,除去“.”号,域名既有英文(最多是6个字符),也有中文(最多是3个汉字)

3、而现在有很多影子邮箱/百变邮箱,是使用二级域名或者三级域名,所以,我们先列举如下几个邮箱,然后写一个正则表达式,去匹配、判断

4、不管是什么邮箱,确定会有的字符是“@”和至少一个“.”(这里特指最后一个),那么我们就以这两个确定的符号为分界点,将每个邮箱拆分成3段,对每一段进行正则匹配,最终组成整个邮箱的正则匹配。当然进入下一步之前,先理一理基本知识点。

5、定义:一个正则可以匹配的字符串的长度不是固定的,使用量词可以达到这种目的。

6、量词:比如{m, n}:表示连续出现最少 m次,最多 n次;跟在一个字符的后面就表示对该字符的限定。

7、比如邮箱的校验:/^\w+@[a-z0-9]+.[a-z]{2,4}$/,写在了[a-z]后面,表示可以有2到4位的字母

8、又比如手机号的校验:/^1[3456789]\d{9}$/,跟在了\d后面,表示需要出现9个数字

9、定义:正则匹配的字符串对于某一位置上的字符来说,它可以有多种可能,不局限于某一类型,使用字符组可以达到这种目的。

10、字符组:比如[abc],表示该字符是可以字符"a"、"b"、"c"中的任何一个。对于这一位置来说,我们可以有3种可能性。

11、比如手机号的校验:/^1[3456789]\d{9}$/,它在第二个位置,根据一般手机运营商来说,提供手机第二位的数字可以是3到9的任意一个,才符合规范。

12、如果字符组里表示的字符特别多,可以使用范围表示法,用连字符-来省略和缩写。

13、比如邮箱的校验:/^\w+@[a-z0-9]+.[a-z]{2,4}$/,它跟在@后面,根据我们邮箱的规范可知,@后面的 [a-z0-9]+表示:数字0到9和字母a-z中的至少一个字符

14、对于js正则:([a-z]{2,6}|[\u2E80-\u9FFF]{2,3})

15、 js正则的中文汉字正则表达式来源于手册:

16、对于php正则:([a-z]{2,6}|[\x7f-\xff]{6,9})

17、在utf-8编码中,用ASCII码表中的第128~255编码中的3个编码表示一个汉字,这里用十六进制表示

18、当然,php正则匹配邮箱,还可以这样子

19、原理与/^\w+@([\da-z\.-]+)\.([a-z]{2,6}|[\x7f-\xff]{6,9})/类似。

20、最后,上面的几个正则表达式是居于当前市面上现存的域名进行匹配的,下面提供几个更加宽松的邮箱正则匹配

21、原理都相似,可以对照理解下。如有误,欢迎留言区批评指正。