并行计算
Eloudy
规律即本质、算法即工具;作为一个个体,吃喝玩乐思作,多折腾折腾,经验中发现的规律应该会更多吧。一切计算动力来自于体系结构创新;一切算法并行/并发优化都应该在编译器的优化 pass 中;一切数学皆为算法优化提供理论基础;一个提速体系结构优化的工具,一个适于编译器优化的体系结构,一个适于算法优化的体系结构;一个适于体系结构的算法;人类的想象力空间是无限的,AI 的本质是A,遥远有多远,AI 能走多远;
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ubuntu 安装 多版本 cuda 11.4 11.8
ubuntu 多版本cuda sdk原创 2023-03-01 13:12:45 · 4454 阅读 · 0 评论 -
注释分析一个cusolver的官方示例:cuSolverDn_LinearSolver
cuSolverDn_LinearSolver 注释原创 2023-02-16 11:12:26 · 957 阅读 · 0 评论 -
magma build system 分析 —— Makefile 篇 02 记
编译 magm原创 2023-02-13 18:46:02 · 305 阅读 · 0 评论 -
magma build system 分析 —— Makefile 篇 01 记
magma的构建系统分析,makefile系统原创 2023-02-13 17:59:43 · 374 阅读 · 0 评论 -
cuda C++ cmake makefile
cuda c++ cmake makefile原创 2022-12-15 11:29:29 · 303 阅读 · 0 评论 -
3次 int 关系运算 比较两个非负 float 变量的大小
三次 unsigned 关系运算,比较两个float的大小原创 2022-09-11 04:20:45 · 209 阅读 · 0 评论 -
通过int 关系运算符来 比较两个 float 变量的大小
compare two float variables by twice integer relation operations >原创 2022-09-11 03:35:01 · 693 阅读 · 0 评论 -
怎样学习ocaml
函数式编程语言 Ocaml原创 2022-08-07 00:18:46 · 300 阅读 · 0 评论 -
常用 c++ github 项目汇总
GitHub - fmtlib/fmt: A modern formatting library原创 2022-05-27 15:58:14 · 833 阅读 · 0 评论 -
rust 程序设计第一节 Linux 环境搭建与小案例
1.安装$ curl https://sh.rustup.rs -sSf | sh2.更新 $ rustup update3.卸载 $ rustup update 4.设置环境变量 $ export PATH=$PATH:/home/opencl/.cargo/bin 或将export PATH=$PATH:/home/opencl/.cargo/bin添加为 /etc/profile or ~/.pr...原创 2022-05-18 18:49:22 · 393 阅读 · 0 评论 -
详解llvm的cmake构建系统
Building LLVM with CMake — LLVM 15.0.0git documentationhttps://llvm.org/docs/CMake.html原创 2022-05-03 14:51:29 · 763 阅读 · 0 评论 -
借 __attribute__ 引入 The GNU C Reference Manual
__attribute__ 是 GNU C 规范的一个编译期关键字;话题文档主页:The GNU C Reference Manual - GNU Project - Free Software Foundation在一般的Linux中,在文件 /usr/include/crt/host_defines.h的70多行处有这么一个定义:#define __align__(n) \ __attribute__((aligned(n)))在这个文件的前面几行有如下信息:原创 2022-02-20 17:56:45 · 699 阅读 · 0 评论 -
Linux ubuntu gtest googletest download compile apply TEST TEST_F TEST_P
1. download:$ cd /home/maymay/ex/gtest/$ wget https://github.com/google/googletest/archive/refs/tags/release-1.10.0.tar.gz$ tar zxf release-1.10.0.tar.gz$ cd ./googletest-release-1.10.0/$ pwdshows: /home/maymay/ex/gtest/googletest-release-1....原创 2022-02-13 02:31:48 · 991 阅读 · 1 评论 -
精通SuiteSparse应用与架构01 compile and install
精通SuiteSparse应用与架构01原创 2021-08-23 00:37:25 · 487 阅读 · 0 评论 -
摩尔的预言 唯有CUDA才是终极的CPU
作者:小熊在线-宁道奇 .标题:一二三四五六七八九十一二三四五六七八九十标题:摩尔的预言 唯有CUDA才是终极的CPU作者:小熊在线-宁道奇关键词:Intel AMD CPU GPU CUDA Pentium 处理器 摩尔 out-of-order 乱序执行 GeForceFX GPGPU Dirichlet Voronoi Shader BrookGPU GFLOPS s转载 2015-03-05 10:23:59 · 1924 阅读 · 0 评论 -
这个cuda教程不错,一个链接
http://supercomputingblog.com/cuda-tutorials/原创 2015-03-24 10:57:05 · 648 阅读 · 0 评论 -
能通过一张照片(2D)得到3D的模型吗?
很好奇其实如果将人眼所看到的画面保存下来(拍照),人类是可以感知照片内的各个物体。是不是可以理解成这是一种2D到3D认知的转换?作者:知乎用户链接:https://www.zhihu.com/question/52934069/answer/132784366来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明转载 2017-05-11 16:18:48 · 17362 阅读 · 1 评论 -
THE MNIST DATABASE of handwritten digits
http://yann.lecun.com/exdb/mnist/转载 2018-05-10 17:05:22 · 1569 阅读 · 0 评论 -
Vulkan 提高路径——用VulkanSDK中的Sample及其Documents和 闻名遐迩的VSG为资料,win10 64位 VS2019 community
Vulkan确实很牛,这毋庸置疑。需要质疑的是我们能够多大程度上驾驭Vulkan。第一步. 下载升级安装自己机器的相关显卡的驱动,intel和amd的集显,或者nvidia和amd的独显,只要显卡不太太老,安装图形卡最新驱动。第二步. 本链接下载lunarg的VulkanSDK,用的是win10的64位版本。有另外三种版本可选 。可能有的浏览器显示不全页面内容,遇此的话,更换...原创 2019-06-26 14:41:09 · 1907 阅读 · 0 评论 -
面试题创作0009,请问Linux kernel中的spinlock_t 是如何实现互斥访问同一数据的?
面试题创作0007,请问Linux kernel中的spinlock_t 是如何实现互斥访问同一数据的?在单核多线程,多核多线程,多cpu多线程中,spinlock_t实现互斥的机制有区别么?分别是什么呢?进一步列举一些使用spinlock_t的情况和组件。比如wait queues(kernelcoderoot/include/linux/wait.h)需要spinlock_t么?...原创 2019-07-19 15:44:25 · 280 阅读 · 0 评论 -
cudaStreamSynchronize vs CudaDeviceSynchronize vs cudaThreadSynchronize CUDA中的屏障同步
cudaStreamSynchronize vs CudaDeviceSynchronize vs cudaThreadSynchronizeThese are all barriers. Barriers prevent code execution beyond the barrier until some condition is met.cudaDevi转载 2015-03-04 18:43:52 · 2227 阅读 · 0 评论
分享