小说章节排版正则表达式
“小说章节排版正则表达式”相关的资料有哪些?“小说章节排版正则表达式”相关的范文有哪些?怎么写?下面是小编为您精心整理的“小说章节排版正则表达式”相关范文大全或资料大全,欢迎大家分享。
正则表达式大全
正则表达式学习资料大全,作为编程人员手边随时翻阅的资料很不错
正则表达式30分钟入门教程 版本:v2.21 (2007-8-3) 作者:deerchao 来源:unibetter大学生社区 转载请注明来源
目录
1. 本文目标
2. 如何使用本教程
3. 正则表达式到底是什么?
4. 入门
5. 测试正则表达式
6. 元字符
7. 字符转义
8. 重复
9. 字符类
10.反义
11.替换
12.分组
13.后向引用
14.零宽断言
15.负向零宽断言
16.注释
17.贪婪与懒惰
18.处理选项
19.平衡组/递归匹配
20.还有些什么东西没提到
21.联系作者
22.一些我认为你可能已经知道的术语的参考
23.网上的资源及本文参考文献
24.更新说明
本文目标
30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。
如何使用本教程
正则表达式学习资料大全,作为编程人员手边随时翻阅的资料很不错
最重要的是——请给我30分钟,如果你没有使用正则表达式的经验,请不要试图在30秒内入门。当然,如果你是超人,那自然得另当别论。
别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实并没有你想像中的那么困难。当然,如果你看完了这篇教程之后,发现自己明白
用正则表达式实现排版助手
用正则表达式实现排版助手
用正则表达式实现排版助手(GIDOT TYPESETTER)的部分排版功能
2009年08月06日 星期四 上午 08:42
副标题:用正则表达式实现段首缩进、修正换行、修正非段落换行、删除行尾空格、删除空行
相信使用过排版助手的人应该都觉得这是一个好软件吧?不过,我对其中的“删除非段落换行”有一个不满的地方
[/gevolution90/blog/item/34cabb7fc2b8710128388ada.html]。于是才引发出这一篇文章。
*如果你还未有在windows下的正则表达式批量替换工具的话,推荐使用TextForever[/stronghorse/software/index.htm#TextForever],很强大的文本整理工具
1.段首缩进:
可以把每行(段)的前面格式化成指定的字符串,比如2个全角空格。 正则:^[ ]*(?=[^\s])
你可以替换成2个全角空格或4个半角空格或你自己喜欢的任何字符串。
2.修正换行:
有些文章一行紧接着一行,看起来有点不舒服,可以把每段内容段(有文字的段)之间的换行格式化成指定数量的换行比如双换行(两段之间空一行空行)。 正则:[\r\n]+
你可以替换成2个回车。
3.修正
正则表达式语法
正则表达式示例
表达式 /^\\s*$/ /\\d{2}-\\d{5}/ 匹配 匹配空行。 验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。 /<\\s*(\\S+)(\\s[^>]*)?>[\\s\\S]*<\\s*\\/\\1\\s*>/ 匹配 HTML 标记。 下表包含了元字符的完整列表以及它们在正则表达式上下文中的行为:
字符 \\ 说明 将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\\n”匹配换行符。序列“\\\\”匹配“\\”,“\\(”匹配“(”。 ^ 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与“\\n”或“\\r”之后的位置匹配。 $ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与“\\n”或“\\r”之前的位置匹配。 * + 零次或多次匹配前面的字符或子表达式。例如,zo* 匹配“z”和“zoo”。* 等效于 {0,}。 一次或多次匹配前面的字符或子表达式。例如,“zo+”与“zo”和“zoo”匹配,但与“z”不匹配。+ 等效于 {1,}。 ? 零次或一次匹配前
深入入门正则表达式
1.字符缩略表示法
\\a[\\b]\\e\\f\\n\\r\\t\\0octal\\x##\%u####\\cchar---\%u####只运行4位16进制数字;\\0octal要求开头是0,后面接1至3为10进制数字;\\cchar是区分大小写的,直接对后面字符的十进制编码进行异或操作。
2.字符组及相关结构
字符组:[...],[^...],可包含运算符
几乎任何字符:点号(根据模式不同,含义不同)
字符组缩略表示法:\\w\\d\\s\\W\\D\\S---\\w\\W只能识别ASCII字符
3.锚点及其他零长断言
行/字符串起始位置:^\\A
行/字符串结束位置:$\\z\\Z
当前匹配的起始位置:\\G
单词分解符:\\b\\B---能够识别Unicode字符
环视结构:(?=...)(?!...)(?<=...)(?
4.注释及修饰模式
模式修饰符:(?mods-mods)允许出现的模式:xdsmiu
模式修饰范围:(?mods-mods:...)
注释:从#到行末(只有在启动时有效)---只有在使用/
常用的正则表达式
常用正则表达式 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,
Java正则表达式详解
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。
许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达式实现高级“搜索-替换”功能。那么Java又怎样呢?本文写作时,一个包含了用正则表达式进行文本处理的Java规范需求(Specification Request)已经得到认可,你可以期待在JDK的下一版本中看到它。
然而,如果现在就需要使用正则表达式,又该怎么办呢?你可以从下载源代码开放的Jakarta-ORO库。本文接下来的内容先简要地介绍正则表达式的入门知识,然后以Jakarta-ORO API为例介绍如何使用正则表达式。
一、正则表达式基础知识
我们先从简单的开始。假设你要搜索一个包含字符“cat”的字符串,搜索用的正则表达式就是“cat”。如果搜索对大小写不敏感,单词“catalog”、“Catherine”、“sophisticated”都可以匹配。也就是说:
常用的正则表达式
常用正则表达式 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,
正则表达式基础入门
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 专题报告—— 王敏
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 判断字符串str是否是电话号码?
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式 找出一段文本中所有电话号码?(a)调用函数 isPhoneNum(); (b)13800138000——忽略; (c)13800138,00138000——找到的字符 串前后都不是数字字符。
正则表达式的引入,用途,用法,基本原理。
正则文法与正则表达式
概念释义 历史起源 举例应用 匹配原理
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例
例1.判断字符ch是否数字字符 原来的程序:
Python:是一种面向对象、直译式计算机程 序设计语言。
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例
运用正则表达式:
正则表达式的 应用
Def:定义函数关键字 re.search(): 正则表达式的运算函数 [0-9]:从0到9之间的任意字符
正则表达式的引入,用途,用法,基本原理。
概念释义——应用举例 Def:定义函数关键字 re.search(): 正则表达式的运算
日期正则表达式(很实用)
日期正则表达式:
2009-03-29 19:17
一、简单的
日期判断(YYYY/MM/DD):^\d{4}(\-|\/|\.) \d{1,2}\1\d{1,2}$
二、演化的日期判断(YYYY/MM/DD|
YY/MM/DD):
^(^(\d{4}|\d{2})(\-|\/|\.)\d{1,2}\3\d{1,2}
$)|(^\d{4}年\d{1,2}月\d{1,2}日$)$
三、加入闰年的判断的:
实例:
^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1
[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9] \d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|
[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?
[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|
[2468][048]|[13579][26])|((16|[2468][048]|
[3579][26])00))-0?2-29-))$
分析:
1、什么是合法的日期范围?对于不同的应用场 景,这个问题有不同的解释。这里采纳MSDN中
的约定
常用的正则表达式大全
最全的常用正则表达式大全分享
一、校验数字的表达式
1 数字:^[0-9]*$
2 n位的数字:^\\d{n}$
3 至少n位的数字:^\\d{n,}$ 4 m-n位的数字:^\\d{m,n}$
5 零和非零开头的数字:^(0|[1-9][0-9]*)$
6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数:^(\\-)?\\d+(\\.\\d{1,2})?$ 8 正数、负数、和小数:^(\\-|\\+)?\\d+(\\.\\d+)?$ 9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数:^[1-9]\\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\\+?[1-9][0-9]*$ 12 非零的负整数:^\\-[1-9][]0-9\或 ^-[1-9]\\d*$ 13 非负整数:^\\d+$ 或 ^[1-9]\\d*|0$
14 非正整数:^-[1-9]\\d*|0$ 或 ^((-\\d+)|(0+))$
15 非负浮点数: