AI大模型
文章平均质量分 89
AI大模型
荔枝吻
完美主义架构师,欢迎关注【保姆级喂饭教程】等系列。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【AI总结】为什么NVlink能够实现比PCIe更高的传输带宽?从PCIe到NVLink:GPU互连带宽的跃迁之路
(建议保存高清图,横轴 2003-2025,纵轴 对数带宽)PCIe 1.x 2.x 3.x 4.x 5.x 6.x(计划)带宽曲线肉眼可见地“分叉”,PCIe 线性爬升,NVLink 指数起飞。内存墙:HBM3e 带宽 8 TB/s,NVLink 5.0 1.8 TB/s 仍只有 22 %,下一步是近存计算;软件墙:PyTorch 默认数据并行,通信占比 30 %,自动并行化+重叠计算才是终极解;生态墙:NVLink 是 NVIDIA 护城河,开放标准何时破局?原创 2025-09-17 13:26:39 · 1386 阅读 · 0 评论 -
【AI总结】Python BERT 向量化入门指南
tokenizer 先分词,BERT 再编码,切片 [:,0,:] 拿句向量!全文代码 ≤ 30 行,复制即可跑通。原创 2025-09-05 11:32:06 · 862 阅读 · 0 评论 -
【保姆级喂饭教程】【抽丝剥茧知识讲解】2025年最新Windows从Hugging Face下载模型全部方法总结
AI开发绕不过一个问题是,如何从hugging face下载模型/数据集,由于众所周知的原因,访问和下载需要科学上网,还不稳定,总是下载失败。大部分教程都比较专业,即使命令比较详细,从0开始的新手可能也不知道在哪使用,许多命令还不区分Windows和Linux和mac,也缺少图片的指示。本教程选取几个常用和简单的方法下载模型,以bert模型为例hugging face doc官网:huggingface_hub.hf_hub_download。原创 2025-08-14 16:38:07 · 1930 阅读 · 0 评论 -
【转载】训练集、验证集、测试集(附:分割方法+交叉验证)
数据在人工智能技术里是非常重要的!本篇文章将详细给大家介绍3种数据集:训练集、验证集、测试集。同时还会介绍如何更合理的讲数据划分为3种数据集。最后给大家介绍一种充分利用有限数据的方式:交叉验证法。训练集相当于上课学知识验证集相当于课后的的练习题,用来纠正和强化学到的知识测试集相当于期末考试,用来最终评估学习效果训练集(Training Dataset)是用来训练模型使用的。在《一文看懂机器学习》里我们介绍了机器学习的7个步骤,训练集(Training Dataset)主要在训练阶段使用。原创 2025-09-04 14:41:32 · 1090 阅读 · 0 评论 -
【保姆级喂饭教程】【抽丝剥茧知识讲解】2025年 Windows10 安装 CUDA Toolkit 和 cuDNN,PyTorch 安装 CUDA Runtime 和 cuDNN
在深度学习与高性能计算领域,GPU 早已成为加速训练与推理的“第二颗 CPU”。但想让 GPU 真正发挥作用,离不开一套与之配套的软件栈——CUDA。本教程将以“零基础、可复制”为目标,从硬件检测到环境变量,一步一步带你完成 CUDA Toolkit 与 cuDNN 的完整安装与验证。安装之前弄清楚自己是否需要安装cuda和cudnn…切记本文出发点是使用pytorch运行后发现无法使用cuda加速模型计算,输出为false。原创 2025-08-28 11:28:40 · 1485 阅读 · 0 评论 -
【AI总结】别再傻傻分不清!一文带你彻底搞懂 Transformer、Transformers、Hugging Face 与 huggingface-hub
是根基,是理论突破。库是让理论落地开花的关键工具,是接触HF生态的主要入口。是以Transformers库为起点构建的完整AI开源平台和社区宇宙。它包含了Hub、Spaces、API等众多部分。是这个宇宙中的核心资源仓库(模型、数据集)。库是代码连接并操作Hub仓库的专用桥梁,通常与库协同工作。📌是思想(论文/架构),是实现了这个思想的流行工具库(Python包),是创造这个工具库并围绕它建立了庞大平台和生态的公司,而。原创 2025-08-13 20:45:37 · 861 阅读 · 0 评论 -
【技术变迁脉络解析】一文带你彻底搞懂 Transformer、Transformers、Hugging Face 与 huggingface-hub,以及发展历史
Transformer(单数,首字母大写?小写?Transformers(复数,还带个 s?Hugging Face(公司?社区?库?huggingface-hub(又是什么鬼?今天这篇文章就带你从历史、定位、API、代码级别彻底梳理这四个概念,让你之后再也不会张冠李戴!是「设计图纸」是「发动机」是「仓库搬运工」是「整座 AI 超级商场」下次再有人问你它们的区别,直接把这篇文章甩给 TA!原创 2025-08-13 20:41:32 · 1109 阅读 · 0 评论 -
【AI翻译】从 HuggingFace Hub 下载文件官方文档
将使用 LFS SHA256 哈希查询 Xet 内容寻址服务(CAS)以获取重构元数据(xorbs 内的范围)来组装这些文件,以及直接下载 xorbs 的预签名 URL。使用 Xet 存储系统,将文件分解为不可变块,远程存储这些块(称为块或 xorbs),并在请求时检索它们以重新组装文件。但请注意,若无此文件夹再次运行脚本,恢复时间可能更长,因为元数据会丢失。它会下载远程文件,并以版本感知的方式缓存到磁盘,最后返回本地文件路径。的 Python 绑定,用于实现基于块的去重,加快上传和下载速度。原创 2025-08-13 15:52:25 · 1375 阅读 · 0 评论 -
【前沿技术动态】【AI总结】时隔六年!OpenAI 8 月 5 日「开放权重」回归,GPT-OSS 双模型能否重塑开源格局?
从 GPT-2 到 GPT-OSS,OpenAI 用了六年时间完成一次“开源回归”。当巨头们把最尖端的能力锁进 API 时,开放权重模型的出现让**“AI 民主化”**不再是一句口号。下一步,社区能否围绕 GPT-OSS 长出新的爆款应用?微调后的 20 B 模型又会不会在细分领域“以小搏大”?欢迎留言聊聊你的脑洞!原创 2025-08-11 11:38:01 · 959 阅读 · 0 评论 -
【前沿技术动态】【AI总结】如何评价 OpenAI 凌晨发布的 GPT-5?——一场“魔法”退潮后的工程胜利
如果说 GPT-4 是「功能机」到「智能机」的跃迁,那 GPT-5 更像是iPhone 3GS:更快、更稳、更便宜,但依旧不是革命。真正的 iPhone 4 时刻,或许要等到 GPT-6 把多模态、具身智能、自监督推理一次性打包。但在那之前,GPT-5 已经足够让绝大多数开发者把 P0 需求从「等 AGI」改成「先上线再说」。毕竟,能落地的生产力,才是第一生产力。原创 2025-08-08 10:13:52 · 958 阅读 · 0 评论 -
【知识聚合】AI相关名词解释、软件网址聚合
AI在最近几年获得了飞速的发展,并且仍然在日新月异的变化中,每天都有些新技术和新产品,对于刚开始接触了解AI的朋友来说,有时候会很难理解和分清他们的作用,很多0基础教程又无法做到真正的0基础,都是用一些默认概念去解释一个专业概念,解释了又好像没解释。本教程致力于对AI相关名字进行大白话的解释,以及一句话对AI产品进行描述。原创 2025-05-22 13:56:50 · 321 阅读 · 0 评论 -
Ollama修改安装目录和模型下载目录
因为c盘空间不足,而Ollama安装需要接近5个G的空间,个人适用的7b模型也在5G左右,所以把Ollama安装目录和模型下载目录都设置在D盘。原创 2025-02-20 11:26:52 · 4093 阅读 · 0 评论
分享