python和fortran哪个更快_为什么Numpy比我的Fortran程序快得多？

最新推荐文章于 2024-10-31 07:48:16 发布

weixin_39640520

最新推荐文章于 2024-10-31 07:48:16 发布

阅读量847

点赞数

文章标签： python和fortran哪个更快

本文探讨了为什么Numpy在处理数组计算时比Fortran程序更快，并提供了一个优化后的Fortran代码示例，通过使用数组操作和LAPACK库，实现了与Numpy相当的性能。优化主要包括避免混合I/O和计算，利用向量/矩阵操作，并使用LAPACK的SLANGE函数计算1-范数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

您的Fortran实现有两个主要缺点：您可以混合IO和计算(并按条目从文件条目读取)。

您不使用向量/矩阵操作。

此实现确实执行与您的实现相同的操作，并且在我的机器上比您的执行速度快20倍：program test

integer gridsize,unit

real mini,maxi,mean

real, allocatable :: tmp (:,:,:)

gridsize=512

unit=40

allocate( tmp(gridsize, gridsize, gridsize))

open(unit=unit,file='T.out',status='old',access='stream',&

form='unformatted',action='read')

read(unit=unit) tmp

close(unit=unit)

mini = minval(tmp)

maxi = maxval(tmp)

mean = sum(tmp)/gridsize**3

print *, mini, maxi, mean

end program

这样做的目的是将整个文件读入一个数组中。tmp一步一步。然后，我可以使用这些函数MAXVAL，MINVAL，和SUM直接在数组上。

对于精度问题：只需使用双精度值，并执行动态转换，如mean = sum(real(tmp, kind=kind(1.d0)))/real(gridsize**3, kind=kind(1.d0))

只略微增加计算时间。我试着按元素的顺序和切片执行操作，但这只会增加默认优化级别所需的时间。

在-O3，元素级加法比数组运算执行约3%的运算。下面是使用LAPACK的一个非常快速的实现：program test

integer gridsize,unit, i, j

real mini,maxi

integer :: t1, t2, rate

real, allocatable :: tmp (:,:,:)

real, allocatable :: work(:)

! double precision :: mean

real :: mean

real :: slange

call system_clock(count_rate=rate)

call system_clock(t1)

gridsize=512

unit=40

allocate( tmp(gridsize, gridsize, gridsize), work(gridsize))

open(unit=unit,file='T.out',status='old',access='stream',&

form='unformatted',action='read')

read(unit=unit) tmp

close(unit=unit)

mini = minval(tmp)

maxi = maxval(tmp)

! mean = sum(tmp)/gridsize**3

! mean = sum(real(tmp, kind=kind(1.d0)))/real(gridsize**3, kind=kind(1.d0))

mean = 0.d0

do j=1,gridsize

do i=1,gridsize

mean = mean + slange('1', gridsize, 1, tmp(:,i,j),gridsize, work)

enddo !i

enddo !j

mean = mean / gridsize**3

print *, mini, maxi, mean

call system_clock(t2)

print *,real(t2-t1)/real(rate)

end program

这使用单精度矩阵1-范数。SLANGE在矩阵列上。运行时甚至比使用单精度数组函数的方法还要快，并且没有显示精度问题。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。