String转换成Integer源码分析
2024年03月07日
我们经常为用到Integer.valueOf(String str)这个方法,如果字符串格式不对,这个方法会抛出一个系统异常NumberFormatException这里我们就要分析一下这个方法,其中Byte,Short也是调用了Ingeter中的方法.
在Integer类中的定义如下:
public static Integer valueOf(String s)throws NumberFormatException
{
return new Integer(parseInt(s,10));
}
这里因为parseInt方法返回的int型的,这里调用了一个构造函数产生了一个新的Integer实例.
这里关心的是parseInt方法,该方法代码如下:
public static int parseInt(String s,int radix)
throws NumberFormatException
{
if(s==null){
throw new NumberFormatException("null");
}
if(radix<Character.MIN_RADIX){
throw new NumberFormatException("radix"+radix+
"less than Character.MIN_RADIX");
}
if(radix>Character.MAX_RADIX){
throw new NumberFormatException("radix"+radix+
"greater than Character.MAX_RADIX");
}
int result=0;
boolean negative=false;
int i=0,max=s.length();
int limit;
int multmin;
int digit;
if(max>0){
if(s.charAt(0)=='-'){
negative=true;
limit=Integer.MIN_VALUE;
i++;
}else{
limit=-Integer.MAX_VALUE;
}
if(i<max){
digit=Character.digit(s.charAt(i++),radix);
if(digit<0){
throw NumberFormatException.forInputString(s);
}else{
result=-digit;
}
}
while(i<max){
//Accumulating negatively avoids surprises near MAX_VALUE
digit=Character.digit(s.charAt(i++),radix);
if(digit<0){
throw NumberFormatException.forInputString(s);
}
if(result<multmin){
throw NumberFormatException.forInputString(s);异常1
}
result*=radix;
if(result<limit+digit){
throw NumberFormatException.forInputString(s);异常2
}
result-=digit;
}
}else{
throw NumberFormatException.forInputString(s);
}
if(negative){
if(i>1){
return result;
}else{/*Only got"-"*/
throw NumberFormatException.forInputString(s);
}
}else{
return-result;
}
}
很显然,该方法的第二个参数表示是基数(最常用的是十进制,还有十六机制,八进制等等).
如果字符串是空指针,直接抛出异常.
如果基础小于2或者大于36的话,抛出异常(这种情况一般不会出现,因为我们用的最多就是十进制的了).
如果是空字符串,也抛出异常,也就是max=0的情况了.
我们来关注下面的转换过程:
这里使用了Character中的静态方法digit,这个方法比较复杂,这里先说明它的功能:对于给定的基数,如果是合法的字符(可以转化为数字),返回该数字值,否则返回-1.比如digit('3',10)返回3,digit('a',10)返回-1.
这段程序看起来很简单,其实还真不容易看懂,这里先说明几个局部变量的含义吧:
result:记录返回值
negative:符号标志
i:字符串位置
s:字符串长度
limit:界限
multmin:也是一个界限
digit:当前字符表示的数字
先看第一个字符是否是'-'号,设定符号标志negative和极限值limit.
注意到limit一定是一个负值.
处理最高位,这里result保存的是负值,这样就可以对正负数统一处理.
关键就是这个while循环了,第一个if不用解释了,肯定是因为非法字符.
第二个if语句的含义:如果result小于multmin,会产生什么结果呢?
是不是一定会溢出呢?假设不会溢出,就是说结果必须>=limit.
result小于multmin,result至少应该位multmin-1,后面有result=result*radix=(multmin-1)*radix=multmin*radix-radix
该值肯定小于limit,其中multmin=limit/radix,注意这里都是负数.
所以假设不成里,如果result小于multmin的话,后面一定会溢出.
如果这里没有判断的话,溢出就麻烦了,正数也会变负数了.
第三个if语句的含义:在这条语句以前肯定没有溢出,但是有可能加上最后一位digit就溢出了,所以这个判断也是必要的.
后面的就比较好理解了,else是表示空字符串"".
如果是负数的还要看是否长度是1,就只是一个'-'号的情况.
如果是正数的话返回相反数就可以了.
这里有好多地方都有可能抛出异常,只要看明白了程序就知道这个异常是那条语句抛出的了,这里考虑溢出异常:异常1和异常2.
Ingeter.Max_VALUE=2147483647
下面的两条语句在不同的地方抛出异常.
Ingeter.valueOf("2147483648");这个在异常2抛出的.
Ingeter.valueOf("21474836471");这个在异常1抛出的.
这里简单的分析了String转化为Ingeter的过程,其实整个Ingeter类也就主要是这个方法了,Byte和Short都是调用这个方法的.
看看Byte的代码:
public static byte parseByte(String s,int radix)
throws NumberFormatException{
int i=Integer.parseInt(s,radix);
if(i<MIN_VALUE||i>MAX_VALUE)
throw new NumberFormatException(
"Value out of range.Value:\""+s+"\"Radix:"+radix);
return(byte)i;
}
了解这个方法后就再也不会为Integer.valueOf()产生的异常感到意外了,特别是在JSP中,因为参数都是String型的,转换的时候动不动就出现异常,你该知道怎么回事了吧.