正则表达式 RegEx
正则表达式是一种用于匹配和操作文本的,由一系列字符和特殊字符组成的模式
表达式示例:
<[^>]+>
查找全部的 html 标签(?<!a)hh
查找前面不是 a 的 hhhh(?!a)
查找后面不是 a 的 hh
语法字符 | 说明 |
---|---|
\p{P} | Unicode 标准定义的标点符号 |
\r | 回车符 |
\n | 换行符 |
\t | 制表符 |
\s | 匹配所有空白字符 |
\d | 任意数字 |
\w | 字母、数字、下划线 |
^ | 行首,表达式的非 |
$ | 行末 |
+ | 前一个字符一或多个 |
? | 前一个字符零或一个,非贪婪限定符 |
* | 前一个字符零或多个 |
| | 或者 |
. | 任意字符 |
{0,3} | 前一个字符出现零或三个 |
[A-Z] | 大写字母 |
[abc] | 字符 a、b、c |
[\x00-\x7F] | ASCII 字符 |
[^\x00-\x7F] | 非 ASCII 字符 |
\u3000 | 全角空格 |
() | 标记内容 |
$1 | 替换时,等于被标记的内容 |
?! | 捕获时取非 |