正则表达式是一种用来描述、匹配和操作文本模式的工具。它是由特定的语法规则构成的字符串,可以用于在字符串中查找、替换、提取符合特定模式的文本。
正则表达式的语法相对复杂,但它可以提供很强大的匹配和搜索功能。以下是一些常见的正则表达式元字符和用法:
- 字符匹配:
- .:匹配任意单个字符。
- [abc]:匹配任意一个字符,可以是a、b或c。
- [^abc]:匹配任意一个字符,排除a、b和c。
- 重复匹配:
- *:匹配前一个元素零次或多次。
- +:匹配前一个元素一次或多次。
- ?:匹配前一个元素零次或一次。
- {n}:匹配前一个元素恰好n次。
- {n,}:匹配前一个元素至少n次。
- 锚点和边界:
- ^:匹配字符串的开头。
- $:匹配字符串的结尾。
- \b:匹配单词边界。
- \B:匹配非单词边界。
- 分组和引用:
- (pattern):将pattern作为一个分组。
- (?:pattern):将pattern作为一个非捕获分组。
- \n:引用前面的第n个分组匹配的内容。
- 特殊字符:
- \d:匹配任意一个数字。
- \w:匹配任意一个字母、数字或下划线。
- \s:匹配任意一个空白字符。