已注册的开发者可以到
http://partners.nvidia.com 或
http://nvdeveloper.nvidia.com上下载
主要更新:
cusparse一个GPU加速的稀疏矩阵库
curand一个GPU加速的随机数生成库,支持 Sobol quasi-random 枚 XORWOW 伪随机数
cusparse一个GPU加速的稀疏矩阵库
curand一个GPU加速的随机数生成库,支持 Sobol quasi-random 枚 XORWOW 伪随机数
设备端代码和主机端代码:
cufft为在费米架构上基数是3,5,7的转换尺寸做了优化
对于费米架构的GPU,cublas中矩阵相乘和转置性能提升了50%-300%
以前SDK提供的H.264编/解码现在是cuda工具包的一部分
cufft为在费米架构上基数是3,5,7的转换尺寸做了优化
对于费米架构的GPU,cublas中矩阵相乘和转置性能提升了50%-300%
以前SDK提供的H.264编/解码现在是cuda工具包的一部分
cuda驱动和运行时:
支持6GB的显存
支持显存超过4GB的GPU的调试
标准的windows驱动包集成了TCC(特斯拉计算集群)支持
其它:
支持内核中的malloc()和free()
英伟达系统管理接口(nvidia-smi)支持报告工作GPU的百分比和许多性能计数器
支持6GB的显存
支持显存超过4GB的GPU的调试
标准的windows驱动包集成了TCC(特斯拉计算集群)支持
其它:
支持内核中的malloc()和free()
英伟达系统管理接口(nvidia-smi)支持报告工作GPU的百分比和许多性能计数器
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22785983/viewspace-674252/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22785983/viewspace-674252/