10. 正则表达式匹配

10. 正则表达式匹配

Scroll Down

正则表达式匹配

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖整个字符串s的,而不是部分字符串。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 .*

示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

思路

没有头绪,学习一下。

动态规划的方法

dp[i][j]表示s的前i个字符于p的前j个字符是否能够匹配

  • 如果p的第j个字符是一个字符,则必须在s中匹配一个相同的字符
  • 如果p的第j个字符是.,那么p[j]一定匹配在s中的一个字符
  • 如果p的第j个字符是*,那么
    • 匹配s末尾的一个字符,将该字符扔掉,而该组合还可以继续进行匹配
    • 不匹配字符,将该组合扔掉,不再进行匹配

得到状态转移方程:
$$
dp[i][j] =
\begin

if\ (p[j]\ !=\ '') =
\begin

dp[i-1][j-1],\quad matches(s[i],\ p[j]
false, \quad otherwise
\end) \

\
if\ (p[j]\ == \ '
') =
\begin

dp[i - 1][j]\ or\ dp[i][j - 2],\quad matches(s[i], p[j-1])\
dp[i][j - 2], \quad otherwise
\end

\end

$$

解答

class Solution {
    public boolean isMatch(String s, String p) {
        int m = s.length();
        int n = p.length();

        boolean[][] dp = new boolean[m + 1][n + 1];
        dp[0][0] = true;

        for (int i = 0; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                if (p.charAt(j - 1) == '*') {
                    dp[i][j] = dp[i][j - 2];
                    if (matches(s, p, i, j - 1)) dp[i][j] = dp[i][j] || dp[i - 1][j];
                } else {
                    if (matches(s, p, i, j)) dp[i][j] = dp[i - 1][j - 1];
                }
            }
        }

        return dp[m][n];
    }

    private boolean matches(String s, String p, int i, int j) {
        if (i == 0) return false;
        if (p.charAt(j - 1) == '.') return true;
        return s.charAt(i - 1) == p.charAt(j - 1);
    }
}