- 博客(31)
- 资源 (7)
- 收藏
- 关注
原创 解决 Microsoft Edge 浏览器开启 clash verge 网页翻译失败、无法搜索栏搜索问题
打开面板-设置-系统代理-代理绕过设置-添加。
2025-03-06 10:26:52
903
3
原创 DeepSeek开源周,第六弹再次来袭,DeepSeek-V3/R1推理系统总结
DeepSeek-V3/R1 推理系统通过跨节点 EP、计算-通信重叠和负载均衡技术,实现了高吞吐量和低延迟,同时通过动态资源分配优化了成本和性能。
2025-03-01 18:33:42
617
原创 DeepSeek开源周,第五弹再次来袭,3FS
在 180 个存储节点(每个节点配备 2×200Gbps InfiniBand NIC 和 16 个 14TiB NVMe SSD)的集群中,通过 500+ 客户端节点进行读压力测试,实现了约 6.6 TiB/s 的聚合读吞吐量。其出色的性能表现(如 6.6 TiB/s 的读吞吐量)和多样化工作负载支持,使其成为大规模 AI 应用的理想选择。在 25 个存储节点和 50 个计算节点的集群中,对 110.5 TiB 数据进行排序,耗时 30 分 14 秒,平均吞吐量为 3.66 TiB/min。
2025-02-28 09:41:37
653
原创 DeepSeek开源周,第四弹再次来袭,优化并行策略
DeepSeek - V3论文中采用冗余专家策略,即复制负载较重的专家,然后启发式地将复制后的专家分配到GPU上,以确保不同GPU间的负载平衡。但与预填充阶段不同,解码阶段的全连接通信不占用GPU SMs,即在发出RDMA消息后,所有GPU SMs被释放,系统在计算完成后等待全连接通信结束。表示为(PP/2 - 1)(F&B + B - 3W),有2×参数,激活为PP + 1 ,F&B表示两个相互重叠的前向和后向块的执行时间。不考虑专家组,全局复制专家,然后将复制后的专家分配到各个GPU。
2025-02-27 11:27:52
944
原创 DeepSeek开源周,第三弹再次来袭,DeepGEMM
专为NVIDIA Hopper张量核心设计,支持普通GEMM和MoE分组GEMM,计算效率突破。支持预填充(Prefilling)和解码(Decoding)阶段,适配Transformer和MoE结构。在大型模型推理中,矩阵乘法(GEMM)是计算的核心瓶颈。它凭借极简代码(核心仅300行)、的特性,以及针对Hopper架构的极致优化,性能超越主流库,为大模型推理提速高达。仅需1个核心函数,代码量约300行,学习FP8矩阵乘法优化的绝佳范本。基于JIT(即时编译)实现,安装即用,无需复杂环境配置。
2025-02-26 09:59:56
411
原创 DeepSeek开源周,第二弹再次来袭,DeepEP
很高兴介绍 DeepEP——第一个用于 MoE 模型训练和推理的开源 EP 通信库。OpenSourceWeek第 2 天:DeepEP。✅节点内和节点间均支持 NVLink 和 RDMA。✅灵活的 GPU 资源控制,实现计算-通信重叠。✅用于训练和推理预填充的高吞吐量内核。✅用于推理解码的低延迟内核。✅原生 FP8 调度支持。✅高效、优化的全员沟通。
2025-02-25 10:58:04
217
原创 DeepSeek携手FlashMLA横空出世,主宰Hopper GPU,性能炸裂!
很荣幸与大家分享 FlashMLA - 我们为 Hopper GPU 开发的高效 MLA 解码内核,针对可变长度序列进行了优化,目前已投入生产。1:BF16 支持,2:分页 KV 缓存(块大小 64),3: H800 上内存受限 3000 GB/s,计算受限 580 TFLOPS。
2025-02-24 10:54:31
225
原创 xAI的Grok3模型限时免费使用,助力深度研究及思维,存在配额限制
可以看到现在访问Grok的官网已经可以试用Grok3了!开启深度搜索会强制开启网络搜索。有兴趣的可以去尝试一下。
2025-02-21 18:16:46
277
原创 拆解微软CEO纳德拉战略蓝图:AI、量子计算、游戏革命如何改写未来规则!
微软CEO萨蒂亚·纳德拉最新访谈释放重磅信号:AI将掀起工业革命级增长,量子计算突破引爆材料科学革命,游戏引擎进化为世界模拟器
2025-02-20 17:51:23
810
原创 YOLOv12 问世!首个兼顾速度与精度的「注意力中枢」实时检测框架
未来,随着硬件的发展(如A100/H100 GPU),注意力机制在实时检测中的应用将更加普及。小模型(N/S):YOLOv12-N/S在参数量和计算量相近的情况下,mAP分别比YOLOv11高1.2%和1.1%,延迟更低;这一技术大幅优化内存访问效率,让注意力模块在GPU上的运行速度接近CNN,是YOLOv12能「快人一步」的关键。就在昨天,2月19号 ,YOLOv12算法低调发布,YOLOv9,10,11都还没来得及看!CPU兼容性:在普通CPU上,YOLOv12的延迟仅为竞品的1/3左右。
2025-02-20 16:02:46
859
原创 想在本地部署DeepSeek-R1?本地化部署方案!
需要注意的是,一般模型文件都比较大,如果遇到网络问题导致下载中断或者超时的话,可以用modelscope手动下载模型文件到.ollama/models目录下,然后再重新执行ollama run命令即可。如果在模型下载过程中遇到中断或超时问题,你可以先手动通过modelscope平台下载模型文件,然后将vLLM服务启动命令中的模型名称替换为本地模型文件所在的路径,以便继续使用已下载的模型文件。然而,由于遭受了来自漂亮国的网络攻击以及国人的热情,官网和API调用的稳定性受到了严重影响,极大地损害了用户体验。
2025-02-08 18:10:24
1132
原创 labelme标注的多边形数据转为yolo使用的txt
依次为:类别 目标中心点x 目标中心点y 目标宽w 目标高h 目标点1x坐标 目标点1y坐标 目标点2x坐标 目标点2y坐标 目标点3x坐标 目标点3y坐标 目标点4x坐标 目标点4y坐标。读取labelme标注后的json文件,写入到各个txt文件。样本标注为4个点多边形标注。
2023-05-04 14:56:07
1067
原创 mac 下安装pycocotools报错注意的地方
最后发现是python3.9不支持pycocotools。更换为python3.8就安装成功,国内源加速安装命令。
2023-04-26 10:08:34
259
原创 windows安装pycocotools报错问题
安装时候报错:ERROR: Could not build wheels for pycocotools, which is required to install pyproject.toml-based projects。虽然查看输出日志发现有个错误 error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools"点击链接傻瓜操作安装就行 默认选择的不要勾掉。
2023-04-12 21:28:12
269
原创 青龙面板的使用方法最新版
青龙面板使用方法1:获取cookie打开:https://bean.m.jd.com/登录后按F12点击【Network】--【ALL】 搜索【log】刷新页面 在coocie中找到pt_key=xxxxxxxxxxxxxxx;pt_pin=xxxxxxxxx2:输入cookie将获取到coocie添加青龙面板的【环境变量】名称:JD_COOKIE值:【填写你的cookie】备注:自定义3:编辑定时任务注意:国内鸡:(TX云等)为了能正常clone下来,需要修改青龙 confi
2022-05-02 13:00:46
3207
原创 Oracle 服务器登录opc或者ubuntu以后怎么root登录
直接切成rootsudo -i启用root密码登录sudo -iecho root:输入你的新密码 |sudo chpasswd rootsudo sed -i 's/^#\?PermitRootLogin.*/PermitRootLogin yes/g' /etc/ssh/sshd_config;sudo sed -i 's/^#\?PasswordAuthentication.*/PasswordAuthentication yes/g' /etc/ssh/sshd_config.
2022-04-10 10:49:10
3225
1
原创 Flask跨域问题的多种方法
首先安装flask-cors 1 pip install flask-cors 全局跨域配置方式 范围 说明 CORS函数 配置全局API接口 适用于全局的API接口配置 app = Flask(__name__)cors = CORS(app,’参数如下‘)@app.route("/")def test_api():return "test_success"装饰器参数 类型 Head字段 说.
2022-03-14 11:58:39
1219
原创 mac版本Homebrew自动安装,拒绝报错
一、自动脚本(全部国内地址)(在Mac os终端中复制粘贴回车下面脚本)(已经安装过brew的请自行备份后,再运行下面的安装脚本!!!!!)安装脚本:/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"卸载脚本:/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homeb
2020-10-27 22:00:49
156
转载 在新安装的Centos中安装python3.7 解决pip和yum问题
https://blog.youkuaiyun.com/u013214212/article/details/81540840
2020-08-12 13:57:54
326
原创 Yolo系列详解
零、图像基本概念图像表示为二维的矩阵灰阶图像0-255,0表示黑色,255表示白色,其余表示灰色。图像的坐标轴彩色图像注意:颜色信息对于任务有时候有用,有时候没用。一、什么是目标检测目标检测是计算机视觉中的经典的原子问题,即通过输入的图像来完成物体的检测,它需要解决两个问题:物体在哪里 物体是什么目标检测算法的传统实现 sift hog 等算法。这些算法的大致逻辑如下:通过人定义的算法和规则提炼关键点。 通过人设计的算子和计算流程计算...
2020-08-05 15:20:38
18453
7
原创 linux下初步运行yolov4,小白步骤
Ⅰ. 编译一直在darknet文件夹下;Ⅱ. 每次修改 Makefile 文件后需重新 make 一下才能生效;Ⅲ. 默认的 Makefile 是使用 CPU;
2020-05-11 17:50:49
2159
7
原创 Tensorflow2.0之图像TFRecords数据集
图像数据处理实例 制作TFRecord¶ 单个图片数据 import osimport globfrom datetime import datetimeimport cv2 #提前安装cv2import numpy as npimport matplotlib.pyplot as pltimport matplotlib.image as mpi...
2020-04-03 11:44:31
1354
2
原创 Tensorflow2.0之TFRecords制作
TFRecords制作为了高效地读取数据,可以将数据进行序列化存储,这样也便于网络流式读取数据。TFRecord是一种比较常用的存储二进制序列数据的方法tf.Example类是一种将数据表示为{"string": value}形式的meassage类型,Tensorflow经常使用tf.Example来写入、读取TFRecord数据
2020-04-03 11:06:10
1089
原创 yolov3提高精度策略
在.cfg文件中设置random=1,它会通过对不同分辨率的图片进行训练以提高精度 使用高分辨率的图像输入。在.cfg文件中设置height和width值。但是你无需重头训练,只需使用回416x416分辨率的权重数据就好了。 检查数据集标注是否正确符合规范 检查训练数据集数据量是否过少 迭代次数推荐不低于2000 * classes 你的训练样本希望包含没有目标物体的图像,即该图像中没有...
2019-09-05 14:23:00
10798
12
原创 Ubuntu16安装NVIDIA显卡驱动(循环登录问题完美解决)
下载驱动等按照你查询的教程下载即可,我要说的是安装时候的循环登录问题重启电脑后在登录页面,按CTRL+ALT+F1,或者CTRL+ALT+F2+FN,如果你重启不能进入命令行模式可以试试F1-F6,如果还是不行,自行百度~进入该模式后需要输入用户名和密码(当前本人使用的root账户所以不用加sudo),然后进入NVIDIA驱动所在文件夹1:给驱动文件增加可执行权限:chmod a+...
2019-07-26 18:15:38
2033
原创 linux-Centos7安装python3
安装时候碰到好多人的不完整安装教程,被坑了好多次,最后自己慢慢摸索把centos7.5版本的python升级到了python3总结了一下,希望更多人别被一些不完整或者缺文改字的文章所蒙骗,希望大家也一步一步来安装 1.查看是否已经安装PythonCentOS 7.几默认安装了python2.7.5 使用 python -V 命令查看一下是否安装Python然后使用命令 wh...
2018-09-13 10:46:15
3155
1
原创 机器学习之普通线性回归、岭回归与lasso回归比较
一、普通线性回归 1、原理 分类的目标变量是标称型数据,而回归将会对连续型的数据做出预测。应当怎样从一大堆数据里求出回归方程呢?假定输人数据存放在矩阵X中,而回归系数存放在向量W中。那么对于给定的数据X1, 预测结果将会通过Y=X*W给出。现在的问题是,手里有一些X和对应的Y,怎样才能找到W呢?一个常用的方法就是找出使误差最小的W。这里的误差是指预测Y值和真实Y值之间的差值...
2018-03-10 10:11:31
18103
光伏组件图像和yolo标注
2024-01-23
opencv-4.1.2,linux版本
2020-05-14
cmake-3.6.2-Linux-x86_64
2020-05-14
YOLOv4三个文件
2020-05-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人