03 从JDK源码看String类(1)


Java 语言使用 String 类用来代表字符串,实际上 String 对象的值是一个常量,一旦创建后不能被改变。正式因为其不可变,所以它是线程安全地,可以多个线程共享。

相信对于 String 的使用大家都再熟悉不过的了,这里就了解下 JDK 中怎么实现 String 类的。


public final class String implements java.io.Serializable, Comparable<String>, CharSequence 

/** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0

    /** use serialVersionUID from JDK 1.0.2 for interoperability */
    private static final long serialVersionUID = -6849794470754667710L;

     * Class String is special cased within the Serialization Stream Protocol.
     * A String instance is written into an ObjectOutputStream according to
     * <a href="{@docRoot}/../platform/serialization/spec/output.html">
     * Object Serialization Specification, Section 6.2, "Stream Elements"</a>
    private static final ObjectStreamField[] serialPersistentFields =
        new ObjectStreamField[0];

    public static final Comparator<String> CASE_INSENSITIVE_ORDER
                                         = new CaseInsensitiveComparator();


  • value 用于存储字符串对象的值。
  • hash 为字符串对象的哈希值,默认值为0。


该内部类主要是提供排序的比较器,实现了Comparator接口和compare方法,另外一个readResolve方法用于替换反序列化时的对象。compare核心方法的逻辑是,根据两者编码是否相同做处理,如果相同则分 Latin1 或 UTF16 两种情况比较,类似地,如果两者编码不同,则需要用 Latin1 编码与 UTF16 编码比较,而 UTF16 则要与 Latin1 比较。

private static class CaseInsensitiveComparator
            implements Comparator<String>, java.io.Serializable {
        private static final long serialVersionUID = 8575799808933029326L;

        public int compare(String s1, String s2) {
            byte v1[] = s1.value;
            byte v2[] = s2.value;
            if (s1.coder() == s2.coder()) {
                return s1.isLatin1() ? StringLatin1.compareToCI(v1, v2)
                                     : StringUTF16.compareToCI(v1, v2);
            return s1.isLatin1() ? StringLatin1.compareToCI_UTF16(v1, v2)
                                 : StringUTF16.compareToCI_Latin1(v1, v2);
        private Object readResolve() { return CASE_INSENSITIVE_ORDER; }


有很多种构造方法,看主要的几个。没有参数的构造方法直接将空字符串的 value 进行赋值。

03 从JDK源码看String类(1)


    public String() {
        this.value = new char[0];


public String(String original) {
        this.value = original.value;
        this.hash = original.hash;

构造方法传入 char 数组时的源码如下:

public String(char value[]) {
    this.value = Arrays.copyOf(value, value.length);

public String(char value[], int offset, int count) {
    if (offset < 0) {
        throw new StringIndexOutOfBoundsException(offset);
    if (count < 0) {
        throw new StringIndexOutOfBoundsException(count);
    // Note: offset or count might be near -1>>>1.
    if (offset > value.length - count) {
        throw new StringIndexOutOfBoundsException(offset + count);
    this.value = Arrays.copyOfRange(value, offset, offset+count);


构造方法传入 byte 数组,源码如下:

public String(byte bytes[], int offset, int length, Charset charset) {
    if (charset == null)
        throw new NullPointerException("charset");
    checkBounds(bytes, offset, length);
    this.value =  StringCoding.decode(charset, bytes, offset, length);





    public int length() {
        return value.length;


通过判断 byte 数组长度是否为0来判断字符串对象是否为空。

    public boolean isEmpty() {
        return value.length == 0;



public char charAt(int index) {
    if ((index < 0) || (index >= value.length)) {
        throw new StringIndexOutOfBoundsException(index);
    return value[index];


获取字符串对应索引的 Unicode 代码点,根据编码做不同处理。

public int codePointAt(int index) {
    if ((index < 0) || (index >= value.length)) {
        throw new StringIndexOutOfBoundsException(index);
    return Character.codePointAtImpl(value, index, value.length);