微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

53 - 正则表达式匹配

题目:

请实现一个函数用来匹配包含‘.’和‘*’的正则表达式。
模式中的字符’.’表示任意一个字符,而‘*’表示它前面的字符可以出现任意次(含0次)。
本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串“aaa”与模式“a.a”和“ab*ac*a”匹配,但与“aa.a”及“ab*a”均不匹配。

解析:
字符串 str = “aaa”; 模式字符串 pattern = “.b*ac*a”
每次分别在str 和pattern中取一个字符进行匹配,如果匹配,则匹配下一个字符,否则,返回不匹配。
设匹配递归函数 match(str,pattern)。

如果模式匹配字符的一个字符是‘*’:

  • 如果pttern当前字符和str的当前字符匹配,:有以下三种可能情况
    • pttern当前字符能匹配 str 中的 0 个字符:match(str,pattern+2)
    • pttern当前字符能匹配 str 中的 1 个字符:match(str+1,pattern+2)
    • pttern当前字符能匹配 str 中的 多 个字符:match(str+1,pattern)
  • 如果pttern当前字符和和str的当前字符不匹配
    • pttern当前字符能匹配 str 中的 0 个字符:(str,pattern+2)

如果模式匹配字符的一个字符不是‘*’,进行逐字符匹配。

对于 ‘.’ 的情况比较简单,’.’ 和一个字符匹配 match(str+1,pattern+1)
另外需要注意的是:空字符串”” 和 “.*” 是匹配的

bool MatchCore(const char* str,const char* pattern) {
    if (*str == '\0' && *pattern == '\0')
        return true;
    // if (*str == '\0' && *pattern != '\0') return false : 不成立,如str = "",pattern=".*"
    if (*str != '\0' && *pattern == '\0' )
        return false;

    if (*(pattern+1) == '*') {
        if (*pattern == *str || *pattern == '.' && *str != '\0') {
            //三种情况:*之前的字符出现 0 次,出现一次,出现多次. pattern+2表示跳过当前字符和‘*’
            return MatchCore(str,pattern+2) || MatchCore(str+1,pattern);
        } else {
            // 没有匹配,出现 0 次(包括str=“”,pattern=“.*”)
            return MatchCore(str,pattern+2);
        }
    }
    if (*str == *pattern || *pattern == '.' && *str != '\0')
        return MatchCore(str+1,pattern+1);
    return false;
}
bool Match(const char* str,const char* pattern) {
    if (pattern == NULL || str == NULL)
        return false;
    return MatchCore(str,pattern);
}

测试案例:
From:剑指offer源码 GitHub

// ==================== Test Code ====================

void Test(char* testName,char* string,char* pattern,bool expected)
{
    if(testName != NULL)
        printf("%s begins: ",testName);

    if(Match(string,pattern) == expected)
        printf("Passed.\n");
    else
        printf("Failed.\n");
}

int main(int argc,char* argv[])
{
    Test("Test01","",true);
    Test("Test02",".*",true);
    Test("Test03",".",false);
    Test("Test04","c*",true);
    Test("Test05","a",true);
    Test("Test06","a.",false);
    Test("Test07",false);
    Test("Test08",true);
    Test("Test09","ab*",true);
    Test("Test10","ab*a",false);
    Test("Test11","aa",true);
    Test("Test12","a*",true);
    Test("Test13",true);
    Test("Test14",false);
    Test("Test15","ab",true);
    Test("Test16",true);
    Test("Test17","aaa","aa*",true);
    Test("Test18","aa.a",false);
    Test("Test19","a.a",true);
    Test("Test20",".a",false);
    Test("Test21","a*a",true);
    Test("Test22",false);
    Test("Test23","ab*ac*a",true);
    Test("Test24","ab*a*c*a",true);
    Test("Test25",true);
    Test("Test26","aab","c*a*b",true);
    Test("Test27","aaca",true);
    Test("Test28","aaba",false);
    Test("Test29","bbbba",".*a*a",true);
    Test("Test30","bcbbabab",false);

    return 0;
}

原文地址:https://www.jb51.cc/regex/360107.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐