Java编译器对于String常量表达式的优化

  首先把问题摆出来,先看这个代码
  String a="ab";
  String b="a"+"b";
  System.out.println((a==b));
  打印结果会是什么?类似这样的问题,有人考过我,我也拿来考过别人(蛮好玩的,大家也可以拿来问人玩),一般答案会是以下几种:
  1.true
  "a"+"b"的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
  一般java新人如是答。
  2.false
  "a"+"a"会生成新的对象"aa",但是这个对象和String a="ab";不同,(a==b)是比较对象引用,因此不相等,结果false
  对java的String有一定了解的通常这样回答。
  3.true
  String a="ab";创建了新的对象"ab";再执行String b="a"+"b";结果b="ab",这里没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true.
  能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。
  很遗憾,这个答案,是不够准确的。或者说,根本没有运行时计算b="a"+"b";这个操作.实际上运行时只有String b="ab";
  3的观点适合解释以下情况:
  String a="ab";
  String b="ab";
  System.out.println((a==b));
  如果String b="a"+"b";是在运行期执行,则3的观点是无法解释的。运行期的两个string相加,会产生新的对象的。(本文后面对此有解释)
  4.true
  下面是我的回答:编译优化+3的处理方式=最后的true
  String b="a"+"b";编译器将这个"a"+"b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
  String a="ab";
  String b="ab";
  System.out.println((a==b));
  然后根据3的解释,得到结果true
  这里有一个疑问就是String不是基本类型,像
  int secondsOfDay=24*60*60;
  这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a"+"b"这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗?
  下面简单证明我的推断,首先编译这个类:
  public class Test{
  private String a="aa";
  }
  复制class文件备用,然后修改为
  public class Test{
  private String a="a"+"a";
  }
  再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差.
  ok,真相大白了.根本不存在运行期的处理String b="a"+"b";这样的代码的问题,编译时就直接优化掉了。
  下面进一步探讨,什么样的string+表达式会被编译器当成常量表达式?
  String b="a"+"b";
  这个String+String被正式是ok的,那么string+基本类型呢?
  String a="a1";
  String b="a"+1;
  System.out.println((a==b));//result=true
  String a="atrue";
  String b="a"+true;
  System.out.println((a==b));//result=true
  String a="a3.4";
  String b="a"+3.4;
  System.out.println((a==b));//result=true
  可见编译器对string+基本类型是当成常量表达式直接求值来优化的。
  再注意看这里的string都是"**"这样的,我们换成变量来试试:
  String a="ab";
  String bb="b";
  String b="a"+bb;
  System.out.println((a==b));//result=false
  这个好理解,"a"+bb中的bb是变量,不能进行优化。这里很很好的解释了为什么3的观点不正确,如果String+String的操作是在运行时进行的,则会产生新的对象,而不是直接从jvm的string池中获取。
  再修改一下,把bb作为常量变量:
  String a="ab";
  final String bb="b";
  String b="a"+bb;
  System.out.println((a==b));//result=true
  竟然又是true,编译器的优化好厉害啊,呵呵,考虑下面这种情况:
  String a="ab";
  final String bb=getBB();
  String b="a"+bb;
  System.out.println((a==b));//result=false
  private static String getBB(){
  return"b";
  }
  看来java(包括编译器和jvm)对string的优化,真的是到了极点了,string这个所谓的"对象",完全不可以看成一般的对象,java对string的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。
  另外感叹一下,string的+号处理,算是java语言里面唯一的一个"运算符重载"(接触过c++的人对这个不会陌生)吧?