php 时间正则式的表示

发布时间:2025-05-21 11:50:27 发布人:远客网络

php 时间正则式的表示

一、php 时间正则式的表示

最简单的正则如:\d{4}-\d{2}-\d{2}

但是实际情况却不是那么简单,,要考虑,有效性和闰年等问题.....

对于日期的有效范围，不同的应用场景会有所不同。MSDN中定义的DateTime对象的有效范围是：0001-01-01 00:00:00到9999-12-31 23:59:59。

UNIX时间戳的0按照ISO 8601规范为：1970-01-01T00:00:00Z。

先考虑与年份无关的前三条规则，年份可统一写作

1.包括平年在内的所有年份的月份都包含1-28日

(0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])

2.包括平年在内的所有年份除2月外都包含29和30日

3.包括平年在内的所有年份1、3、5、7、8、10、12月都包含31日

合起来就是除闰年的2月29日外的其它所有日期

(?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)

([0-9]{2}(0[48]|[2468][048]|[13579][26])

(0[48]|[2468][048]|[13579][26])00

([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)

四条规则都已实现，且互相间没有影响，合起来就是所有符合DateTime范围的日期的正则

^((?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)|([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)$

考虑到这个正则表达式仅仅是用作验证，所以捕获组没有意义，只会占用资源，影响匹配效率，所以可以使用非捕获组来进行优化。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

二、告别正则表达式,这个Python库可以快M倍

FlashText算法是由 Vikash Singh于2017年发表的大规模关键词替换算法，这个算法的时间复杂度仅由文本长度（N）决定，算法时间复杂度为O（N）。

而对于正则表达式的替换，算法时间复杂度还需要考虑被替换的关键词数量（M），因此时间复杂度为O（MxN）。

简而言之，基于FlashText算法的字符串替换比正则表达式替换快M倍以上，这个M是需要替换的关键词数量，关键词越多，FlashText算法的优势就越明显。

下面就给大家介绍如何在 Python中基于 flashtext模块使用 FlashText算法进行字符串查找和替换，如果觉得对你的项目团队很有帮助，请记得帮作者转发一下哦。

开始之前，你要确保Python和pip已经成功安装在电脑上，如果没有，可以访问这篇文章：超详细Python安装指南进行安装。

(可选1)如果你用Python的目的是数据分析，可以直接安装Anaconda：Python数据分析与挖掘好帮手—Anaconda，它内置了Python和pip.

(可选2)此外，推荐大家用VSCode编辑器，它有许多的优点：Python编程的最好搭档—VSCode详细指南。

请选择以下任一种方式输入命令安装依赖：

1. Windows环境打开 Cmd(开始-运行-CMD)。

2. MacOS环境打开 Terminal(command+空格输入Terminal)。

3.如果你用的是 VSCode编辑器或 Pycharm，可以直接使用界面下方的Terminal.

一个最基本的提取关键词的例子如下：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

keyword_processor.add_keyword('Big Apple','New York')

keyword_processor.add_keyword('Bay Area')

# 3.处理目标句子并提取相应关键词

keywords_found= keyword_processor.extract_keywords('I love Big Apple and Bay Area.')

其中 add_keyword的第一个参数代表需要被查找的关键词，第二个参数是给这个关键词一个别名，如果找到了则以别名显示。

如果你想要替换关键词，只需要调用处理器的 replace_keywords函数：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

keyword_processor.add_keyword('New Delhi','NCR region')

new_sentence= keyword_processor.replace_keywords('I love Big Apple and new delhi.')

#'I love New York and NCR region.'

如果你需要精确提取，识别大小写字母，那么你可以在处理器初始化的时候设定 sensitive参数:

from flashtext import KeywordProcessor

# 1.初始化关键字处理器,注意设置大小写敏感(case_sensitive)为TRUE

keyword_processor= KeywordProcessor(case_sensitive= True)

keyword_processor.add_keyword('Big Apple','New York')

keyword_processor.add_keyword('Bay Area')

# 3.处理目标句子并提取相应关键词

keywords_found= keyword_processor.extract_keywords('I love big Apple and Bay Area.')

如果你需要获取关键词在句子中的位置，在 extract_keywords的时候添加 span_info=True参数即可：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

keyword_processor.add_keyword('Big Apple','New York')

keyword_processor.add_keyword('Bay Area')

# 3.处理目标句子并提取相应关键词,并标记关键词的起始、终止位置

keywords_found= keyword_processor.extract_keywords('I love big Apple and Bay Area.', span_info= True)

# [('New York', 7, 16),('Bay Area', 21, 29)]

如果你需要获取当前已经添加的所有关键词，只需要调用处理器的 get_all_keywords函数：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

keyword_processor.add_keyword('j2ee','Java')

keyword_processor.add_keyword('colour','color')

keyword_processor.get_all_keywords()

# output:{'colour':'color','j2ee':'Java'}

批量添加关键词有两种方法，一种是通过词典，一种是通过数组：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

# 2.（第一种）通过字典批量添加关键词

"java": ["java_2e","java programing" ],

"product management": ["PM","product manager" ]

keyword_processor.add_keywords_from_dict(keyword_dict)

# 2.（第二种）通过数组批量添加关键词

keyword_processor.add_keywords_from_list(["java","python" ])

keyword_processor.extract_keywords('I am a product manager for a java_2e platform')

# output ['product management','java']

删除关键词也非常简单，和添加类似：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

"java": ["java_2e","java programing" ],

"product management": ["PM","product manager" ]

keyword_processor.add_keywords_from_dict(keyword_dict)

print(keyword_processor.extract_keywords('I am a product manager for a java_2e platform'))

# ['product management','java']

keyword_processor.remove_keyword('java_2e')

# 5.批量删除关键词，也是可以通过词典或者数组的形式

keyword_processor.remove_keywords_from_dict({"product management": ["PM" ]})

keyword_processor.remove_keywords_from_list(["java programing" ])

# 6.删除了java programing关键词后的效果如下

keyword_processor.extract_keywords('I am a product manager for a java_2e platform')

前面提到在添加关键词的时候第二个参数为其别名，其实你不仅可以指示别名，还可以将额外信息放到第二个参数中：

from flashtext import KeywordProcessor

kp.add_keyword('Taj Mahal',('Monument','Taj Mahal'))

kp.add_keyword('Delhi',('Location','Delhi'))

kp.extract_keywords('Taj Mahal is in Delhi.')

# [('Monument','Taj Mahal'),('Location','Delhi')]

这样，在提取关键词的时候，你还能拿到其他一些你想要在得到此关键词时输出的信息。

Flashtext检测的单词边界一般局限于 w [A-Za-z0-9_]外的任意字符，但是如果你想添加某些特殊字符作为单词的一部分也是可以实现的：

from flashtext import KeywordProcessor

keyword_processor= KeywordProcessor()

keyword_processor.add_keyword('Big Apple')

print(keyword_processor.extract_keywords('I love Big Apple/Bay Area.'))

keyword_processor.add_non_word_boundary('/')

print(keyword_processor.extract_keywords('I love Big Apple/Bay Area.'))

个人认为这个模块已经满足我们的基本使用了，如果你有一些该模块提供的功能之外的使用需求，可以给 flashtext贡献代码：

附 FlashText与正则相比查询关键词所花费的时间之比：

附 FlashText与正则相比替换关键词所花费的时间之比：

这篇文章如果对你有帮助的话，记得转发一下哦。

三、正则表达式匹配HTML标签之间的内容

1、(?<=>)[^<>]+(?=<)

2、String a="<style type=\"text/css\"> div \n"+

3、"{ margin: 0; padding: 0; outline: 0;}</style>";

4、我如何把这一句取出来呢，包括标签。

5、用正则表达式：<style([\\s\\S]*)</style>

6、var str='<p class="odd" id="odd">123</p>';

7、var pattern=/<\/?[a-zA-Z]+(\s+[a-zA-Z]+=".*")*>/g;

8、console.log(str.match(pattern));

9、var str='<p class="odd" id="odd">123</p>';

10、var pattern=/<[^>]+>/g;

11、console.log(str.match(pattern));

12、var str='<input type="text" value=">" name="username"/>';

13、var pattern=/<(?:[^"'>]|"[^"]*"|'[^']*')*>/g;

14、console.log(str.match(pattern));

15、说明：()表示捕获分组，()会把每个分组里的匹配的值保存起来，使用$n(n是一个数字，表示第n个捕获组的内容)

16、(?:)表示非捕获分组，和捕获分组唯一的区别在于，非捕获分组匹配的值不会保存起来

17、没有引用的需求的话，采用非捕获性分组，更为简洁；

18、var str='<input type="text" value=">" name="username"/>';

19、var pattern=/<(?:[^"'>]|(["'])[^"']*\1)*>/g;

20、console.log(str.match(pattern));

php 时间正则式的表示

一、php 时间正则式的表示

二、告别正则表达式,这个Python库可以快M倍

三、正则表达式匹配HTML标签之间的内容

相关内容FAQs：

SEO关键词优化方式有哪些

java关键词及用法

C语言的32个关键词

C语言中分支结构的关键词有哪些

C语言关键词是什么有什么用

数据库定义的重要关键词解析

vue三级路由配置使用哪些关键词

数据库中关键词的含义解析

数据库关键词的作用与优化策略探讨

数据库关键词检索算法的定义与应用