String转换成Integer源码分析

2024年03月07日

　　我们经常为用到Integer.valueOf(String str)这个方法,如果字符串格式不对,这个方法会抛出一个系统异常NumberFormatException
　　这里我们就要分析一下这个方法,其中Byte,Short也是调用了Ingeter中的方法.
　　在Integer类中的定义如下:
　　public static Integer valueOf(String s)throws NumberFormatException
　　{
　　return new Integer(parseInt(s,10));
　　}
　　这里因为parseInt方法返回的int型的,这里调用了一个构造函数产生了一个新的Integer实例.
　　这里关心的是parseInt方法,该方法代码如下:
　　public static int parseInt(String s,int radix)
　　throws NumberFormatException
　　{
　　if(s==null){
　　throw new NumberFormatException("null");
　　}
　　if(radix<Character.MIN_RADIX){
　　throw new NumberFormatException("radix"+radix+
　　"less than Character.MIN_RADIX");
　　}
　　if(radix>Character.MAX_RADIX){
　　throw new NumberFormatException("radix"+radix+
　　"greater than Character.MAX_RADIX");
　　}
　　int result=0;
　　boolean negative=false;
　　int i=0,max=s.length();
　　int limit;
　　int multmin;
　　int digit;
　　if(max>0){
　　if(s.charAt(0)=='-'){
　　negative=true;
　　limit=Integer.MIN_VALUE;
　　i++;
　　}else{
　　limit=-Integer.MAX_VALUE;
　　}
　　if(i<max){
　　digit=Character.digit(s.charAt(i++),radix);
　　if(digit<0){
　　throw NumberFormatException.forInputString(s);
　　}else{
　　result=-digit;
　　}
　　}
　　while(i<max){
　　//Accumulating negatively avoids surprises near MAX_VALUE
　　digit=Character.digit(s.charAt(i++),radix);
　　if(digit<0){
　　throw NumberFormatException.forInputString(s);
　　}
　　if(result<multmin){
　　throw NumberFormatException.forInputString(s);异常1
　　}
　　result*=radix;
　　if(result<limit+digit){
　　throw NumberFormatException.forInputString(s);异常2
　　}
　　result-=digit;
　　}
　　}else{
　　throw NumberFormatException.forInputString(s);
　　}
　　if(negative){
　　if(i>1){
　　return result;
　　}else{/*Only got"-"*/
　　throw NumberFormatException.forInputString(s);
　　}
　　}else{
　　return-result;
　　}
　　}
　　很显然,该方法的第二个参数表示是基数(最常用的是十进制,还有十六机制,八进制等等).
　　如果字符串是空指针,直接抛出异常.
　　如果基础小于2或者大于36的话,抛出异常(这种情况一般不会出现,因为我们用的最多就是十进制的了).
　　如果是空字符串,也抛出异常,也就是max=0的情况了.
　　我们来关注下面的转换过程:
　　这里使用了Character中的静态方法digit,这个方法比较复杂,这里先说明它的功能:对于给定的基数,如果是合法的字符(可以转化为数字),返回该数字值,否则返回-1.比如digit('3',10)返回3,digit('a',10)返回-1.
　　这段程序看起来很简单,其实还真不容易看懂,这里先说明几个局部变量的含义吧:
　　result:记录返回值
　　negative:符号标志
　　i:字符串位置
　　s:字符串长度
　　limit:界限
　　multmin:也是一个界限
　　digit:当前字符表示的数字
　　先看第一个字符是否是'-'号,设定符号标志negative和极限值limit.
　　注意到limit一定是一个负值.
　　处理最高位,这里result保存的是负值,这样就可以对正负数统一处理.
　　关键就是这个while循环了,第一个if不用解释了,肯定是因为非法字符.
　　第二个if语句的含义:如果result小于multmin,会产生什么结果呢?
　　是不是一定会溢出呢?假设不会溢出,就是说结果必须>=limit.
　　result小于multmin,result至少应该位multmin-1,后面有result=result*radix=(multmin-1)*radix=multmin*radix-radix
　　该值肯定小于limit,其中multmin=limit/radix,注意这里都是负数.
　　所以假设不成里,如果result小于multmin的话,后面一定会溢出.
　　如果这里没有判断的话,溢出就麻烦了,正数也会变负数了.
　　第三个if语句的含义:在这条语句以前肯定没有溢出,但是有可能加上最后一位digit就溢出了,所以这个判断也是必要的.
　　后面的就比较好理解了,else是表示空字符串"".
　　如果是负数的还要看是否长度是1,就只是一个'-'号的情况.
　　如果是正数的话返回相反数就可以了.
　　这里有好多地方都有可能抛出异常,只要看明白了程序就知道这个异常是那条语句抛出的了,这里考虑溢出异常:异常1和异常2.
　　Ingeter.Max_VALUE=2147483647
　　下面的两条语句在不同的地方抛出异常.
　　Ingeter.valueOf("2147483648");这个在异常2抛出的.
　　Ingeter.valueOf("21474836471");这个在异常1抛出的.
　　这里简单的分析了String转化为Ingeter的过程,其实整个Ingeter类也就主要是这个方法了,Byte和Short都是调用这个方法的.
　　看看Byte的代码:
　　public static byte parseByte(String s,int radix)
　　throws NumberFormatException{
　　int i=Integer.parseInt(s,radix);
　　if(i<MIN_VALUE||i>MAX_VALUE)
　　throw new NumberFormatException(
　　"Value out of range.Value:\""+s+"\"Radix:"+radix);
　　return(byte)i;
　　}
　　了解这个方法后就再也不会为Integer.valueOf()产生的异常感到意外了,特别是在JSP中,因为参数都是String型的,转换的时候动不动就出现异常,你该知道怎么回事了吧.