如何理解正则表达式中的非贪婪匹配
“如何理解正则表达式中的非贪婪匹配”相关的资料有哪些?“如何理解正则表达式中的非贪婪匹配”相关的范文有哪些?怎么写?下面是小编为您精心整理的“如何理解正则表达式中的非贪婪匹配”相关范文大全或资料大全,欢迎大家分享。
正则表达式--递归匹配与非贪婪匹配
递归匹配与非贪婪匹配
正则表达式话题
引言
本文将逐步讨论一些正则表达式的使用话题。本文为本站基础篇之后的扩展,在阅读本文之前,建议先阅读正则表达式参考文档一文。
--------------------------------------------------------------------------------
1. 表达式的递归匹配
有时候,我们需要用正则表达式来分析一个计算式中的括号配对情况。比如,使用表达式 "\( [^)]* \)" 或者 "\( .*? \)" 可以匹配一对小括号。但是如果括号 内还嵌有一层括号的话 ,如 "( ( ) )",则这种写法将不能够匹配正确,得到的结果是 "( ( )" 。类似情况的还有 HTML 中支持嵌套的标签如 "<font> </font>" 等。本节将要讨论的是,想办法把有嵌套的的成对括号或者成对标签匹配出来。
匹配未知层次的嵌套:
有的正则表达式引擎,专门针对这种嵌套提供了支持。并且在栈空间允许的情况下,能够支持任意未知层次的嵌套:比如 Perl,PHP,GRETA 等。在
正则表达式大全
正则表达式学习资料大全,作为编程人员手边随时翻阅的资料很不错
正则表达式30分钟入门教程 版本:v2.21 (2007-8-3) 作者:deerchao 来源:unibetter大学生社区 转载请注明来源
目录
1. 本文目标
2. 如何使用本教程
3. 正则表达式到底是什么?
4. 入门
5. 测试正则表达式
6. 元字符
7. 字符转义
8. 重复
9. 字符类
10.反义
11.替换
12.分组
13.后向引用
14.零宽断言
15.负向零宽断言
16.注释
17.贪婪与懒惰
18.处理选项
19.平衡组/递归匹配
20.还有些什么东西没提到
21.联系作者
22.一些我认为你可能已经知道的术语的参考
23.网上的资源及本文参考文献
24.更新说明
本文目标
30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。
如何使用本教程
正则表达式学习资料大全,作为编程人员手边随时翻阅的资料很不错
最重要的是——请给我30分钟,如果你没有使用正则表达式的经验,请不要试图在30秒内入门。当然,如果你是超人,那自然得另当别论。
别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实并没有你想像中的那么困难。当然,如果你看完了这篇教程之后,发现自己明白
正则表达式语法
正则表达式示例
表达式 /^\\s*$/ /\\d{2}-\\d{5}/ 匹配 匹配空行。 验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。 /<\\s*(\\S+)(\\s[^>]*)?>[\\s\\S]*<\\s*\\/\\1\\s*>/ 匹配 HTML 标记。 下表包含了元字符的完整列表以及它们在正则表达式上下文中的行为:
字符 \\ 说明 将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\\n”匹配换行符。序列“\\\\”匹配“\\”,“\\(”匹配“(”。 ^ 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与“\\n”或“\\r”之后的位置匹配。 $ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与“\\n”或“\\r”之前的位置匹配。 * + 零次或多次匹配前面的字符或子表达式。例如,zo* 匹配“z”和“zoo”。* 等效于 {0,}。 一次或多次匹配前面的字符或子表达式。例如,“zo+”与“zo”和“zoo”匹配,但与“z”不匹配。+ 等效于 {1,}。 ? 零次或一次匹配前
常用的正则表达式
常用正则表达式 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,
常用的正则表达式
常用正则表达式 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,
深入入门正则表达式
1.字符缩略表示法
\\a[\\b]\\e\\f\\n\\r\\t\\0octal\\x##\%u####\\cchar---\%u####只运行4位16进制数字;\\0octal要求开头是0,后面接1至3为10进制数字;\\cchar是区分大小写的,直接对后面字符的十进制编码进行异或操作。
2.字符组及相关结构
字符组:[...],[^...],可包含运算符
几乎任何字符:点号(根据模式不同,含义不同)
字符组缩略表示法:\\w\\d\\s\\W\\D\\S---\\w\\W只能识别ASCII字符
3.锚点及其他零长断言
行/字符串起始位置:^\\A
行/字符串结束位置:$\\z\\Z
当前匹配的起始位置:\\G
单词分解符:\\b\\B---能够识别Unicode字符
环视结构:(?=...)(?!...)(?<=...)(?
4.注释及修饰模式
模式修饰符:(?mods-mods)允许出现的模式:xdsmiu
模式修饰范围:(?mods-mods:...)
注释:从#到行末(只有在启动时有效)---只有在使用/
Java正则表达式详解
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。
许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达式实现高级“搜索-替换”功能。那么Java又怎样呢?本文写作时,一个包含了用正则表达式进行文本处理的Java规范需求(Specification Request)已经得到认可,你可以期待在JDK的下一版本中看到它。
然而,如果现在就需要使用正则表达式,又该怎么办呢?你可以从下载源代码开放的Jakarta-ORO库。本文接下来的内容先简要地介绍正则表达式的入门知识,然后以Jakarta-ORO API为例介绍如何使用正则表达式。
一、正则表达式基础知识
我们先从简单的开始。假设你要搜索一个包含字符“cat”的字符串,搜索用的正则表达式就是“cat”。如果搜索对大小写不敏感,单词“catalog”、“Catherine”、“sophisticated”都可以匹配。也就是说:
正则表达式基础入门
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 专题报告—— 王敏
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 判断字符串str是否是电话号码?
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 找出一段文本中所有电话号码?(a)调用函数 isPhoneNum(); (b)13800138000——忽略; (c)13800138,00138000——找到的字符 串前后都不是数字字符。
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式
概念释义 历史起源 举例应用 匹配原理
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例
例1.判断字符ch是否数字字符 原来的程序:
Python:是一种面向对象、直译式计算机程 序设计语言。
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例
运用正则表达式:
正则表达式的 应用
Def:定义函数关键字 re.search(): 正则表达式的运算函数 [0-9]:从0到9之间的任意字符
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例 Def:定义函数关键字 re.search(): 正则表达式的运算
常用的正则表达式大全
最全的常用正则表达式大全分享
一、校验数字的表达式
1 数字:^[0-9]*$
2 n位的数字:^\\d{n}$
3 至少n位的数字:^\\d{n,}$ 4 m-n位的数字:^\\d{m,n}$
5 零和非零开头的数字:^(0|[1-9][0-9]*)$
6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数:^(\\-)?\\d+(\\.\\d{1,2})?$ 8 正数、负数、和小数:^(\\-|\\+)?\\d+(\\.\\d+)?$ 9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数:^[1-9]\\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\\+?[1-9][0-9]*$ 12 非零的负整数:^\\-[1-9][]0-9\或 ^-[1-9]\\d*$ 13 非负整数:^\\d+$ 或 ^[1-9]\\d*|0$
14 非正整数:^-[1-9]\\d*|0$ 或 ^((-\\d+)|(0+))$
15 非负浮点数:
正则表达式的DFA算法
正则表达式
1 正则表达式的定义
正则表达式(Regular Expression)是一种强大的,便捷的,高效的文本处理工具,它可以表示比单字符、字符串集合等更加复杂的搜索模式。下面首先给出正则表达式和它所表达语言的形式化定义。
一个正则表达式RE是符号集合Σ { ε, |,·, *, (, ) }上的一个字符串,它可以递归定义如下:
空字符ε是正则表达式。 任意字符α∈Σ是正则表达式。
如果RE1和RE2都是正则表达式,则(RE1),(RE1·RE2),(RE1 | RE2)和(RE1*)亦是正则表达式。
通常(RE1·RE2)可以简写为RE1RE2。符号“·”,“*”,“|”称为操作符,可以通过为每个操作符赋予优先级来消除更多的括号。为了方便起见,这里使用了额外的后缀操作符“+”,它的含义是RE+=RE·RE*。其他所使用的操作符如”?”,字符组,”.”等实际上都可以用上面的方式来表达。下面定义正则表达式所表达的语言。
正则表达式RE所表达的语言是Σ上的一个字符串集合。根据RE的结构,可以将它递归的定义如下:
如果RE是ε,则L(RE)={ε},即空串。 如果RE是α∈Σ,则L(RE)={α},即包含一个字符的单串。 如果RE是(RE1)