KMP算法(字符串匹配问题)

一、暴力匹配

package com.monster.kmp;

/**
 * @author Monster
 * @version v1.0
 * @time 05-09-2021 14:06:06
 * @description:
 */
public class ViolenceMatch {
    public static void main(String[] args) {
        String str1 = "我爱你我我我爱我爱你啊*我我爱我爱爱你我我爱你啊*";
        String str2 = "我爱你啊*";

        int index = violenceMatch(str1, str2);
        System.out.println("index = " + index);
    }

    // 暴力匹配字符串,并返回第一次匹配得到的下标
    public static int violenceMatch(String str1, String str2) {
        char[] chars1 = str1.toCharArray();
        char[] chars2 = str2.toCharArray();

        int i = 0; // 用于记录数组 chars1 的下标
        int j = 0; // 用于记录数组 chars2 的下标

        while (i < str1.length() && j < str2.length()) {  // 匹配到一个就停止
            if (chars1[i] == chars2[j]) {
                i++;
                j++;
            }else {
                i = i - j + 1;
                j = 0;
            }
        }

        if(j == str2.length()) {
            return i - j;
        }else {
            return -1;
        }
    }
}

二、kmp算法

package com.monster.kmp;

import java.util.Arrays;

/**
 * @author Monster
 * @version v1.0
 * @time 05-09-2021 15:11:52
 * @description:
 */
public class KMPAlgorithm {
    public static void main(String[] args) {
        String str1 = "BBC ABCDAB ABCDABCDABDE";
        String str2 = "ABCDABD";
        int[] kmpNext = kmpNext(str2);
        System.out.println("kmpNext = " + Arrays.toString(kmpNext));
        int search = kmpSearch(str1, str2, kmpNext);
        System.out.println("search = " + search);
    }

    /**
     *
     * @param str1 带匹配的字符串
     * @param str2 要查找的子字符串
     * @param next 部分匹配值表
     * @return 如果找到,返回对应索引,没有找到返回 -1
     */
    public static int kmpSearch(String str1, String str2, int[] next) {

        for (int i = 0, j = 0; i < str1.length(); i++) {

            // 当str1.charAt(i) != str2.charAt(j) 时,调整 j 的大小,核心
            while (j > 0 && str1.charAt(i) != str2.charAt(j)) {
                j = next[j - 1];
            }

            if(str1.charAt(i) == str2.charAt(j)) {
                j++;
            }
            if(j == str2.length()) {
                return i - j + 1;
            }
        }
        return -1;
    }

    // 获取一个字符串的部分匹配值表
    public static int[] kmpNext(String dest) {

        int[] next = new int[dest.length()];
        next[0] = 0; // 当字符串的长度为 1时部分匹配值就是 0

        // i表示字符串的索引,j 表示部分匹配值,
        for (int i = 1, j = 0; i < dest.length(); i++) {

            //当dest.charAt(i) != dest.charAt(j),我们需要从 next[j-1]获取新的j
            // 直到我们发现有dest.charAt(i) == dest.charAt(j)成立才退出,这时kmp算法的核心点
            while (j > 0 && dest.charAt(i) != dest.charAt(j)) {
                j = next[j - 1];
            }
            // 当满足条件时,部分匹配值 +1
            if(dest.charAt(i) == dest.charAt(j)) {
                j++;
            }
            next[i] = j;
        }
        return next;
    }
}

上一篇:JavaScript中的基本字符串与字符串对象的区别


下一篇:字符串