正则表达式学习记录

正则表达式（Regular Expression）是一种用于匹配字符串的特殊文本模式。它由普通字符和特殊字符（称为元字符）组成，可以用来验证、提取或替换文本。

正则表达式的语法

正则表达式是一种用于匹配字符串的工具，它由普通字符和特殊字符（称为元字符）组成，可以用来验证、提取或替换文本。

一个普通字符代表它本身。例如，a 表示字母 a，1 表示数字 1。除了部分特殊字符外，正则表达式中的大多数字符都是普通字符。

元字符是具有特殊含义的字符，用于匹配多个字符或一类字符。下面是常见的元字符及其含义：

下面是一些具有特殊含义的字符：

模式修饰符是可选标志，用于改变匹配模式的行为。常见的模式修饰符包括：

分组用于将多个元素组合在一起，并为这些元素指定共同的量词或其它操作。

()：表示分组。例如，(abc)+ 可以匹配连续出现的 abc，例如abc、abcabc 等等。
(?:)：非捕获型分组。与普通分组类似，但不会被记入捕获组，也就是说，不能在后续的正则表达式中引用它。例如，(?:abc)+ 可以匹配连续出现的 abc，但无法从匹配结果中提取这些 abc。

以下是一些常见的正则表达式及其应用场景：

匹配电子邮件地址：^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$。这个正则表达式可以匹配大部分常见的电子邮件地址。
匹配 URL：^(http|https)://[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(/\S*)?$。这个正则表达式可以匹配绝大多数网站的 URL。
匹配日期格式：^\d{4}-\d{1,2}-\d{1,2}$。这个正则表达式可以匹配 yyyy-MM-dd 格式的日期。
匹配手机号码：^1[3456789]\d{9}$。这个正则表达式可以匹配中国大陆的手机号码。
匹配身份证号码：^\d{17}(\d|X|x)$。这个正则表达式可以匹配大陆居民身份证号码。
匹配 IP 地址：\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b。这个正则表达式可以匹配IPv4地址。
匹配 HTML 标签：<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)。这个正则表达式可以匹配HTML标签以及其中的内容。