Java 表达式之谜:为什么 index 增加了两次?

>>强大,10k+点赞的 SpringBoot 后台管理系统竟然出了详细教程!

(给ImportNew加星标,提高Java技能)

编译:ImportNew/唐尤华


Code Golf中的一位挑战者在比赛中写了下面这段代码:(译注:Code Golf是一个编程挑战比赛,提交的代码越短越好)


import java.util.*;
public class Main {
public static void main(String[] args) {
int size = 3;
String[] array = new String[size];
Arrays.fill(array, "");
for(int i = 0; i <= 100; ) {
array[i++%size] += i + " ";
}
for(String element: array) {
System.out.println(element);
}
}
}


在Java 8中运行代码,得到结果如下:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 
2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101
3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99


在Java 10中运行代码,得到结果如下:


2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100


在Java 10中编号似乎完全失效了。这中间发生了什么?这是Java 10的bug吗?


来自评论区的讨论:


用Java 9或更高版本编译会出现问题(我们在Java 10中找到了问题)。在Java 8上编译这段代码,然后在Java 9或更高版本(包括Java 11 EA)中运行,可以得到预期结果。


虽然这种代码不标准,但符合Java规范。Kevin Cruijssen在一个Code Golf挑战中发现了这个问题,看起来结果很奇怪。


Didier L发现可以用更短、更容易理解的代码重现该问题:

class Main {
public static void main(String[] args) {
String[] array = { "" };
array[test()] += "a";
}
static int test() {
System.out.println("evaluated");
return 0;
}
}


用Java 8编译,运行结果:


evaluated


用Java 9和10编译,运行结果


evaluated
evaluated


问题似乎与字符串连接操作和赋值运算符(+=)有关,当作为左操作符时会出现副作用,例如array[test()]+="a"array[ix++]+="a"test()[index]+="a"test().field+="a"。字符串连接要求至少有一边的对象类型为String。其他类型或结构无法复现该错误。


答案


这是JDK 9开始引入的一个javac bug(疑似在字符串拼接过程中进行了修改),已由javac团队确认,bug id  JDK-8204322。查看该行对应的字节码:

array[i++%size] += i + " ";


字节码:


  21: aload_2
22: iload_3
23: iinc 3, 1
26: iload_1
27: irem
28: aload_2
29: iload_3
30: iinc 3, 1
33: iload_1
34: irem
35: aaload
36: iload_3
37: invokedynamic #5, 0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
42: aastore


最后的aaload从数组中实际加载数据。但是,下面这段

  21: aload_2             // load 数组引用
22: iload_3 // load 'i'
23: iinc 3, 1 // 'i' 加1 (不影响已加载的数组值)
26: iload_1 // load 'size'
27: irem // 计算余数


基本上能与array[i++%size]表达式对应(去掉实际的load和store),问题是这里出现了两次。按照jls-15.26.2规范中的描述,这是不正确的:


复合表达式E1 op= E2E1 = (T) ((E1) op (E2))等价,其中T的类型是E1,除了E1应该只执行一次。


因此,表达式array[i++%size] += i + " ";array[i++%size]应该只计算一次。但是这里会计算两次(load一次,store一次)。


可以确认,这是一个bug。


更新:


该bug已在JDK 11中修复,并且对应更新到JDK 10(但JDK 9不会修复,因为它不再进行public updates)。


Aleksey ShipilevJBS 页面上提到(@DidierL在此进行了评论):


解决方法:使用-XDstringConcat=inline编译。


这样会使用StringBuilder进行字符串连接,不会出现该bug。


推荐阅读

(点击标题可跳转阅读)

Java 8 - Stream 集合操作快速上手

JDK/Java 14 可能带来什么新特性?

使用 Stream API 优化代码


看完本文有收获?请转发分享给更多人

关注「ImportNew」,提升Java技能

好文章,我在看❤️

原文始发于微信公众号(ImportNew):Java 表达式之谜:为什么 index 增加了两次?