Java正则表达式，如何忽略大小写 & 常用匹配的模式(Pattern flags)

作者：AlbertWen 添加时间：2019-01-26 21:30:38 修改时间：2026-05-14 16:55:04 分类：08.Java基础编辑

Java正则表达式：

(?i)abc 表示abc都忽略大小写
a(?i)bc 表示bc忽略大小写
a((?i)b)c 表示只有b忽略大小写

也可以用 Pattern.compile(rexp, Pattern.CASE_INSENSITIVE) 表示整体都忽略大小写

匹配的模式(Pattern flags)

compile() 方法还有一个版本，它需要一个控制正则表达式的匹配行为的参数：

Pattern Pattern.compile(String regex, int flag)

flag的取值范围如下：

编译标志	效果
Pattern.CANON_EQ	当且仅当两个字符的"正规分解（canonical decomposition）"都完全相同的情况下，才认定匹配。比如用了这个标志之后，表达式"a\u030A"会匹配"?"。默认情况下，不考虑"规范相等性（canonical equivalence）"。
Pattern.CASE_INSENSITIVE (?i)	默认情况下，大小写不明感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹配，只要将UNICODE_CASE与这个标志合起来就行了。（相关文章：Java正则表达式，如何忽略大小写）
Pattern.COMMENTS (?x)	在这种模式下，匹配时会忽略（正则表达式里的）空格字符（注：不是指表达式里的"\\s"，而是指表达式里的空格、tab、回车之类）。注释从#开始，一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。
Pattern.DOTALL (?s)	在这种模式下，表达式'.'可以匹配任意字符，包括表示一行的结束符。默认情况下，表达式'.'不匹配行的结束符。（行结束符：Windows下 `\r\n`，Linux下 `\n`，Mac下 `\r`）
Pattern.MULTILINE (?m)	在这种模式下，'^'和'$'分别一行一行地匹配一行的开始和结束。此外，'^'仍然匹配一行字符串的开始，'$'也匹配一行字符串的结束。默认情况下，这两个表达式仅仅匹配字符串的开始和结束。
Pattern.UNICODE_CASE (?u)	在这个模式下，如果你还启用了CASE_INSENSITIVE标志，那么它会对Unicode字符进行大小写不明感的匹配。默认情况下，大小写不明感的匹配只适用于US-ASCII字符集。
Pattern.UNIX_LINES (?d)	在这个模式下，只有'\n'才被认作一行的中止，并且与'.'，'^'，以及'$'进行匹配。

在这些标志里面，Pattern.CASE_INSENSITIVE，Pattern.MULTILINE，以及Pattern.COMMENTS是最有用的（其中Pattern.COMMENTS还能帮我们把思路理清楚，并且\或者做文档）。

注意：你可以用在表达式里插记号的方式来启用绝大多数的模式。这些记号就在上面那张表的各个标志的下面。你希望模式从哪里开始启动，就在哪里插记号。

可以用 "OR" ('|') 运算符把这些标志组合使用：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ReFlags {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^java",
                Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
        Matcher m = p.matcher(
                "java has regex\nJava has regex\n" +
                        "JAVA has pretty good regular expressions\n" +
                        "Regular expressions are in Java");
        while (m.find()) {
            System.out.println(m.group());
        }
    }
}

输出：

java
Java
JAVA

这样创建出来的正则表达式就能匹配以"java"，"Java"，"JAVA"...开头的字符串了。此外，如果字符串分好几行，那它还会对每一行做匹配（匹配始于字符序列的开始，终于字符序列当中的行结束符）。

注意：group()方法仅返回匹配的部分。

不灭的焱

革命尚未成功，同志仍须努力下载Java21

匹配的模式(Pattern flags)

可以用 "OR" ('|') 运算符把这些标志组合使用：

不灭的焱

革命尚未成功，同志仍须努力 下载Java21

匹配的模式(Pattern flags)

可以用 "OR" ('|') 运算符把这些标志组合使用：

革命尚未成功，同志仍须努力下载Java21