- 博客(21)
- 资源 (2)
- 收藏
- 关注
原创 python flash_attn安装
摘要 本文介绍了两种安装flash_attn库的方法。第一种是手动下载与当前环境匹配的预编译wheel文件(需匹配Python、Torch和CUDA版本),通过判断GLIBCXX_USE_CXX11_ABI值选择TRUE/FALSE版本。第二种提供了自动生成所需wheel文件名的Python脚本,该脚本会检测系统环境参数(CUDA版本、Torch版本、Python版本、ABI标志和平台信息)并生成对应的文件名,用户只需在GitHub releases页面下载对应文件即可安装。两种方法都避免了直接pip安装可
2025-12-13 16:37:45
264
原创 查看 onnxruntime 依赖的 numpy 版本
本文介绍了6种查看onnxruntime依赖的numpy版本要求的方法:1)pip show查看包信息;2)grep过滤依赖项;3)dry-run模拟安装;4)查询PyPI元数据;5)直接查看包元数据文件;6)使用pipdeptree生成依赖树。示例显示onnxruntime依赖numpy但通常不指定具体版本号,建议使用numpy 1.21-1.24版本以保持最佳兼容性。可通过pip show numpy或pip list查看当前安装的具体版本。
2025-11-16 14:57:12
247
原创 nodejs 安装 pnpm
本文介绍了pnpm的安装与使用指南。主要内容包括:通过npm全局安装pnpm的步骤、验证安装的方法;可选配置镜像源以提升下载速度;基本使用命令如初始化依赖和添加单个包;注意事项部分涵盖权限要求、环境变量配置、硬链接机制以及避免混用包管理器;最后提供了卸载pnpm的方法。全文简明扼要地指导用户完成pnpm从安装到使用的完整流程。
2025-11-11 22:41:48
639
原创 ubuntu 20.04 安装xrdp远程桌面访问
本文介绍了Ubuntu系统安装桌面环境和远程访问xrdp服务的方法。首先通过apt命令安装ubuntu-desktop桌面环境,然后安装xrdp服务并配置用户权限。为确保远程访问,需要开放3389端口防火墙规则,文中提供了两种方式:允许特定IP范围或完全开放该端口。完成这些步骤后,用户即可通过远程桌面连接访问Ubuntu系统。
2025-10-25 13:58:57
277
原创 DeepEP InterNode
当前显卡(假设是0-1)的token要分发到256个专家的 8个专家上, 假设其中三个专家是 72, 82, 92 , 这些专家分别位于节点2的显卡2(2-2),4(2-4),7(2-7)上。rdma通讯组, 8台机器,显卡编号为0是一个rdma通讯组, (0-0, 1-0, 2-0, ... 7-0), 显卡编号1是一个rdma通讯组(0-1, 1-1, 2-1, ... 7-1), 编号为7是一个rdma通讯组(0-7, 1-7, 2-7, ... 7-7), 一共有8个通讯组。
2025-10-20 19:01:58
717
原创 Ubuntu gdb attach 权限问题
Ubuntu中使用GDB附加进程的权限问题及解决方法 常见ptrace权限错误可通过以下方式解决: 临时/永久修改ptrace_scope值为0(0-3分别代表不同权限级别) 使用sudo运行GDB 确保进程所有者与当前用户一致 安全建议: 生产环境慎用ptrace_scope=0 优先考虑gdbserver远程调试 使用核心转储文件分析 替代方案包括gdbserver远程调试和核心转储分析,可根据安全需求选择适合的方法。
2025-09-24 15:00:28
452
原创 C++ atomic与内存顺序 【转】
转自原子操作是比互斥锁还要low-level的同步模型,我第一次听到原子操作这个概念,是在操作系统课上,即互斥锁的加锁和解锁是原子操作。其实加锁、解锁就是在维护一个flag,该flag是原子类型,++、–要么不执行,要么一口气执行。以最简单的i++为例,cpu在执行时不是一步到位的,而是被编译成三步:load、add、store。最后i的结果为1,为此不可打断的原子操作很重要。下面先来讲一下原子操作的底层实现。
2025-07-25 18:31:36
813
原创 ubuntu本地部署deepseek r1
本指南详细介绍了如何在本地通过 Ollama 部署 DeepSeek-R1 模型,并集成 Open WebUI 进行交互。首先,确保硬件(如 GPU、内存)和软件(如操作系统、依赖项)满足要求。接着,安装 Ollama 并部署 DeepSeek-R1 模型,随后安装 Open WebUI 并配置与 Ollama 的连接。最后,提供了优化显存和网络加速的建议,帮助用户更好地使用和调试系统。
2025-05-13 00:33:03
1715
原创 IOMMU介绍
IOMMU作为计算机系统中重要的硬件组件,通过有效管理外设对内存的访问,实现数据传输的安全性和有效性。它在现代计算机架构中,尤其是在虚拟化环境中发挥了至关重要的作用。如果你对IOMMU有更多具体问题或者希望了解更多细节,请随时提问!
2024-11-28 10:21:24
1344
原创 深入了解linux proc文件系统
Linux 操作系统中的/proc文件系统是一个特殊的虚拟文件系统,它提供了一种机制来访问内核的数据结构。它包含了系统运行时的信息,如系统内存使用情况、进程信息、已加载的模块等。/proc文件系统是一个只读的文件系统,它在内存中而不是在磁盘上,这意味着访问/proc文件系统的速度非常快。
2024-11-20 21:33:47
847
1
原创 Linux内存屏障
内存屏障(Memory Barriers)是一种同步机制,用于控制存储器操作的执行顺序。它们确保在屏障之前的读写操作在屏障之后的读写操作之前完成。内存屏障并不直接对数据进行操作,而是影响编译器和处理器的行为。在多核心处理器架构中,由于处理器可以进行乱序执行(out-of-order execution)和缓存(caching)机制,需要内存屏障来确保内存访问按照程序的顺序进行,从而防止数据的不一致性。内存屏障是保证多处理器系统中数据一致性和操作顺序的重要机制。
2024-11-15 20:34:44
888
原创 linux prctl和pthread_setname_np区别
则更适用于设置单个线程的名称。在编写跨平台代码时,建议使用。来设置线程名称,因为它是 POSIX 标准的一部分,而。更适用于设置整个进程的名称,而。是 Linux 特有的。
2024-05-18 12:08:05
458
1
原创 ubuntu 18.04 VMware NAT模式看不到网卡
ubuntu 18.04 VMware NAT模式看不到网卡ubuntu 18.04 VMware NAT模式看不到网卡ubuntu 18.04 VMware NAT模式看不到网卡VMware NAT Service 没有启动,需要启动VMware NAT Service :WIN+R - services.msc 打开 服务 ,并设置VMware NAT Service自动启动:...
2019-01-30 22:05:29
1945
原创 C++ std::thread使用
std::thread 正常调用:#include <thread>#include <unistd.h>#include <iostream>using namespace std;void *std_thread_call(){ int i = 0; for(i = 0; i < 5; i++){ cout << "h...
2018-04-13 09:18:52
2387
转载 个人理财有哪些基本原理和方法?
Interpretation from 李东旭~现金为王:不超额消费,不使用信用卡,不负债(房贷除外)信贷消费已经成为主流的今天,强调使用现金似乎与时代格格不入。而对于信贷消费的依赖,常常来自于下面几个看起来十分有力的观点: 1.信贷消费可以积累个人信用 2.手上的现钱可以用来投资,比当下就花掉要合算 3.消费积分可以换礼物 但是实际上,以上
2017-08-10 23:56:59
357
翻译 Backpropagation Algorithm
Backpropagation Algorithm"Backpropagation" is neural-network terminology for minimizing our cost function, just like what we were doing with gradient descent in logistic and linear regression. Our g
2017-07-13 22:56:10
352
转载 浅谈Linux内存管理机制
经常遇到一些刚接触Linux的新手会问内存占用怎么那么多?在Linux中经常发现空闲内存很少,似乎所有的内存都被系统占用了,表面感觉是内存不够用了,其实不然。这是Linux内存管理的一个优秀特性,在这方面,区别于Windows的内存管理。主要特点是,无论物理内存有多大,Linux 都将其充份利用,将一些程序调用过的硬盘数据读入内存,利用内存读写的高速特性来提高Linux系统的数据访问性能。
2014-09-11 10:53:08
640
转载 Matrix Factorization, Algorithms, Applications, and Avaliable packages
来源:http://www.cvchina.info/2011/09/05/matrix-factorization-jungle/美帝的有心人士收集了市面上的矩阵分解的几乎所有算法和应用,由于源地址在某神秘物质之外,特转载过来,源地址Matrix Decompositions has a long history and generally c
2014-08-09 00:16:33
776
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅