看到一篇博客https://blog.youkuaiyun.com/u013256816/article/details/105525284; 里面提到一个面试题。
如下两代码块,哪个运行速度快。
int LEN = 10000;
int[][] arr = new int[LEN][LEN];
for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[i][j] = 1; //差别在这里
}
}
int LEN = 10000;
int[][] arr = new int[LEN][LEN];
for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[j][i] = 1; //差别在这里
}
}
Java下的答案是:arr[i][j]会比arr[j][i]快很多。
这篇博客对该问题的分析应该是套错了理论。根本没分析到点上。下面详细分析一下这个问题。
C/C++的多维数组内存分布
首先看下C/C++中,内存是怎么存储的,这在学校里都有教过,比较简单。
C/C++中多维数组也是连续分布的, 比如a[3][3]的内存分布如下:
从语言层面来说访问a[i][j] 与访问a[j][i]的速度是一样的,a[i][j]就是把指针移到a + i * len + j位置,而a[i][j]就是把指针移到a + j * len + i位置。
不过a[i][j]与a[i][j+1]内存空间是连在一起的,所以访问完a[i][j],a[i][j+1]一般就在cache中,所以a[i][j]这种方式实际运行时是会快很多。
Java中的多维数组的实现
Java中,Java中单维数组跟C/C++差不多,是在Heap中分配数组。不过多维数组情况就跟C/C++完全不一样了。从实现原理来说,可以认为Java就没有多维数组,Java的多维数组是采用单维数组来构成的。比如int[5][2]的内存分布如下图,它是1个int[5]单维数组, 5个int [2]单维数组构成的,int[5]单维数组存放5个int[2]数组的引用。由于它们的内存不是连续的,所以要访问A[3][2], 就必须向得到A[3]这个数组,然后对A[3]这个数组取第2个元素。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QZpcJelE-1595062868709)(https://i.loli.net/2020/07/18/l256Q1FGqNIDydc.png)]
对于这点,用QTrace分析Java/Android的内存也可以看出:
左边显示的是所有int[][]类型的实例,右边显示的是所有int[]类型的实例。
id=12664的两维数组中,包含一个id=12748的一维数组; 然后在所有int[]类型的列表中,也发现了id=12748的一维数组. 这正说明了,二维数组中包含的一维数组是独立的。
a[i][j]为什么速度快
看到如上的分析,估计有些同学会认为找到答案了:
for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[i][j] = 1; //在这个循环里,arr[i]不用重新取
arr[j][i] = 1; //在这个循环里,arr[j]需要重新取
}
}
不过这个分析是错的,arr[i][j]在执行的时候,也是每次要从arr数组中取arr第i个元素出来的。实际上问题并不出在arr[i],arr[j]上。
原因在于:
for (int j = 0; j < LEN; j++) {
arr[i][j] = 1;
/*执行完arr[i][0]后,会缓存arr[i][0]附近的内存,
执行arr[i][1]可以执行从缓存中取数据,
在这个循环里基本大部分数据都可以从缓存取的*/
}
for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[j][i] = 1;
/*
执行完arr[0][i]后,缓存了arr[0]数组。
下一条执行arr[1][i],没有缓存可用,执行arr[2][i]也没有缓存可用,
实际上这个循环里都没有缓存可用的。
*/
}
}