结合数据结构来看看Java的String类

数据结构中定义字符串是由零个或多个字符组成的有限序列,有限,指出字符串的长度是一个有限的数值;所谓的序列,说明串的相邻字符之间具有前驱和后继的关系。字符串一般记为s="a1a2...an"(n>=0),其中s是字符串的名称,用双引号括起来的字符序列是串的值,注意引号不属于串的内容。字符ai可以由字母,数字或其他字符组成,i(1≤i≤n)就是该字符在串中的位置。

在Java语言中将字符串作为对象来处理,可以通过访问Java API帮助文档java.lang包下的String类来看看字符串的相关方法。

首先看看String继承的超类和实现的接口有哪些?

结合数据结构来看看Java的String类

1.字符串的常用方法

1.1 常用的构造方法底层实现

//1.由字符串original复制得到新的字符串
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
//2.得到值等于value的字符串
public String(char[] value) {
this.value = Arrays.copyOf(value, value.length);
}
//3.返回字符串从第i个位置起的前j个字符
public String(char[] value, int offset, int count) {
    //判断索引i是否合法
    if (offset < 0) {
        throw new StringIndexOutOfBoundsException(offset);
    }
    //判断计数值是否合法
    if (count <= 0) {
        if (count < 0) {
            throw new StringIndexOutOfBoundsException(count);
        }
        //如果计数值等于0,返回的是空字符
        if (offset <= value.length) {
            this.value = "".value;
            return;
        }
    }
    //索引值>字符串长度-计数值,抛异常
    if (offset > value.length - count) {
        throw new StringIndexOutOfBoundsException(offset + count);
    }
    //其余情况返回要求值
    this.value = Arrays.copyOfRange(value, offset, offset+count);
}

1.2 equals方法

String中的equals()方法用来判断字符串的内容是否相等。String类中的equals方法是对父类Object类中的equals方法的覆盖,先来看下Object类的equals方法怎么写的:

public boolean equals(Object obj) {
return (this == obj);
}

这里的this哪个对象调用该方法,this就指代哪个对象。

String中的equals()方法底层源码:

public boolean equals(Object anObject) {
//调用该方法的对象与比较的参数相等,则返回true
if (this == anObject) {
return true;
}
//instanceof 运算符是用来在运行时指出对象是否是特定类的一个实例
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
//首先比较两个字符串实例长度是否相等
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
//比较两个字符串对应位置的字符是否相等
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}

也就是说,使用equals()方法是用来比较两个字符串的内容是否相等,它通过以下方法实现:

  • 首先判断两个字符串实例是否是同一个对象,如果是,那么它们的内容相等,返回true;
  • 如果不是同一个对象,判断该对象是否是String类的实例,如果是,将该对象实例强转为String类,判断二者的长度是否相等;
  • 若满足长度相等,再一一比较两个字符串对应位置的字符是否相等;

提到equals方法,就得结合“==”操作符来看了。“==”操作符用来比较操作数的值之间的关系,对于基本数据类型,变量存储的是值本身,而对于引用数据类型,变量存储的是对象的地址,比较的是两个对象的内存地址是否相等。

String类代表字符串,Java程序中的所有字符串文字比如“abc”都被实现为此类的实例。字符串一经创建后,它的值是不可以改变的,也就是说“abc”不可以再变成“abcd”。这就要求我们使用String的时候应该注意:尽量不要做字符串频繁的拼接操作。因为字符串一旦创建不可改变,只要频繁拼接,就会在字符串常量池中创建大量的字符串对象,给垃圾回收带来问题。

为了提升字符串的访问效率,在程序中使用了缓冲技术,所有被双引号括起来的字符串都会在JVM运行时数据区的字符串常量池中新建一份,(字符串常量池存储在方法区中)。如果程序中用到“abc”,会先在字符串常量池中查找有没有该字符串,如果找到直接拿来用,找不到就在字符串常量池中新建一个"abc"。

如下的代码,判断两个字符串是否相等:

String A="a";
String B="a";
System.out.println(A==B); //true

前面提到过“==”是用来比较值相等。程序中第一次出现"a"时,先在字符串常量池中新建一个字符串"a"对象,A指向该对象,当程序中再次出现"a"时,会先在字符串常量池中查找,发现已经创建了"a",于是直接拿来用了,使用B指向,也就是A,B引用指向的是同一对象,所以打印输出true。

再来看看String中的构造方法:

结合数据结构来看看Java的String类

这个方法是初始化新创建的String对象,使其表示与参数相同的字符序列,换句话说,新创建的字符串时参数字符串的副本。

看下面代码,判断是否相等:
String C=new String("a");
String D=new String("a");
System.out.println(C==D); //false

参数字符串“a”对象,创建之前先在字符串常量池中查找有没有该对象,没有则创建;然后构造方法String(String original)以"a"为参数,new出两个对象存在堆中,C和D引用分别指向这两个对象,很明显C和D引用指向的是两个不同的对象,即上面这两行代码创建了三个不同的对象,方法区中一个,堆中两个。

2.字符串的模式匹配

子串在主串中的定位操作称为串的模式匹配,串的模式匹配应该算串的重要操作之一。来看看朴素的模式匹配算法。

根据要求从主串的第i个位置开始遍历。子串从第0个位置开始,如果相应位置的字符相等,则主串子串各向后移动一位判断下一位字符,如果不等,主串回到匹配位置的下一位,子串从0位开始,循环遍历,直到找到子串,最后返回子串在主串中的索引。简单地说,就是对主串的每一个字符作为子串开头,与要匹配的字符串进行匹配,这种匹配方式称为朴素的模式匹配算法。实现代码如下:

package com.java.String;
/*
* 串的模式匹配
* */
public class IndexTest {
public static void main(String[] args){
int s=indexSearch("eateqweapple","app",8);
System.out.println(s);
}
//朴素的模式匹配算法,返回子串T在主串S中第pos个字符之后的位置
public static int indexSearch(String S,String T,int pos){
//默认值规定为0
int index=0;
int Slen=S.length();
int Tlen=T.length();
//S位置下标
int i=pos;
//T位置下标
int j=0;
while((i<Slen)&&(j<Tlen)){
char s=S.charAt(i);
char t=T.charAt(j);
if(s==t){
//如果当前位置的相等,都各加1比较下一位置
i=i+1;
j=j+1;
}else{
//否则回到主串S匹配的下一位置,子串从头开始
i=i+1;
j=0;
}
if(j>Tlen-1){
index=i-Tlen;
}
}
return index;
}
}

算法复杂度分析:

最好的情况,一开始就匹配成功,算法复杂度为O(1); 稍微差一些,每次匹配都是首字母不匹配,但遍历到主串的最后位置匹配成功,算法复杂度为O(n+m);最坏的情况,每次匹配不成功都是发生在子串的最后一个字符,时间复杂度为O((n-m+1)*m)。

朴素的模式匹配算法算很简单的解决子串定位问题的算法了。想一想Java底层那些封装好的方法,我们真是站在了巨人的肩膀上。

上一篇:黑马程序员——String类


下一篇:go中的接口