- 博客(4)
- 收藏
- 关注
转载 windows11 安装CUDA Toolkit,Python,Anaconda,PyTorch并使用DeepSeek 多模态模型 Janus-Pro识别和生成图片
因为公司网络做了严格限制,必须使用账号登录,才能上网。必须是指定的ip地址和MAC地址设备才可以上网。windows11开启热点,安装第三方虚拟机软件,开启WSL2虚拟机都是被禁止的,否则账号会被封锁,无法上网。挺无奈的,那么就只能使用windows 11系统来安装CUDA Toolkit,Anaconda,PyTorch这些组件,使用DeepSeek 多模态模型 Janus-Pro,识别和生成图片了。
2025-07-12 12:45:41
23
转载 探秘Transformer系列之(23)--- 长度外推
LLM的进步正在推动更长的上下文和广泛的文本生成,这些模型在数百万个标记的序列上进行训练。这种趋势给系统内存带宽带来了压力,导致执行成本增加。多轮对话场景的 LLMs 有几个难点:1. 注意力机制的O(n2)O(n2)O(n^2)计算量;2. 解码阶段缓存 KV 需要耗费大量的内存;3. 流行的 LLMs 不能拓展到训练长度之外。在本文,我们来讨论第三点。文本续写和语言延展是人类语言的核心能力之一,在有限的学习资源下,人类可以通过理解它们的组成部分和结构来理解潜在无限长度的话语。尽管Transformer在
2025-05-07 12:44:25
200
转载 重生之数据结构与算法----图论
合集 - 数据结构与算法(6)1.重生之数据结构与算法----数组&链表03-032.重生之数据结构与算法----队列&栈03-043.重生之数据结构与算法----哈希表03-054.重生之数据结构与算法----二叉树03-065.重生之数据结构与算法----二叉树的变种03-076.重生之数据结构与算法----图论03-10收起 简介 图结构本质上还有多叉树的变种,图结构在逻辑上...
2025-03-11 02:37:36
49
转载 图书馆座位预约平台设计与实现-计算机毕业设计源码+LW文档
摘 要 随着互联网技术的日益发展,计算机技术已经深入渗透到人们的日常生活中,成为了工作、学习不可或缺的助手。在高校的日常运营中,各类管理系统也如雨后春笋般涌现。作为培育人才、传授知识与技术的高等学府,高校在信息技术应用上更是趋于成熟。鉴于图书馆座位管理一直缺乏系统化手段,学生们难以实时掌握座位的使用情况,因此,开发一套图...
2024-08-26 04:14:53
76
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅