- 博客(181)
- 资源 (2)
- 收藏
- 关注
原创 DeepSeek海豚本地部署保姆级教程
DeepSeek可以在网页端使用,但是有些时候可能不是很稳定,除了网页端,也能通过本地部署来使用。下面就一起来看看吧本地部署方法1. 在加速界面工具栏选择【一键本地部署】2. 选择适合您本地情况的相关内容进行安装3. 安装完成会自动打开对话框4. 此时我们可以直接在终端下提问,DeepSeek-R1会在终端下回答。
2025-03-06 20:43:40
438
原创 DeepSeek开源Day5:3FS&smallpond技术详解
3FS 的设计初衷是为 DeepSeek 的 AI 基础设施(如 Fire-Flyer AI-HPC)和模型(如 DeepSeek-V3、R1)提供底层存储 + 数据支持。3FS 涵盖训练数据预处理、数据集加载、检查点保存与重载、嵌入向量搜索以及推理过程中的 KVCache(键值缓存)查找等环节。3FS 显然是 DeepSeek 高效训练体系的关键组件,进一步体现了 DeepSeek 的硬件基因。
2025-03-06 20:34:12
1287
原创 DeepSeek开源Day4:DualPipe&EPLB技术详解
DualPipe 的设计目标是最大化集群设备的计算性能,通过在前向传播(Forward)和后向传播(Backward)阶段实现计算与通信的完全重叠,显著减少传统流水线并行中的 “气泡”(Pipeline Bubble,即空闲等待时间)。这种方法在保持计算通信比例恒定的情况下,即使模型规模进一步扩大,也能维持接近零的通信开销。为保证 MoE 部分不同专家之间的负载均衡,会将共享专家和高负载的细粒度专家在集群的不同 GPU 做多个复制,让 GPU 把更多的热数据(发给共享专家的)跑起来。
2025-03-06 20:31:26
1366
原创 DeepSeek开源Day3:DeepGEMM技术详解
包含测试脚本,如 test_intranode.py(节点内测试)、test_internode.py(节点间测试)和 test_low_latency.py(低延迟测试),以及 utils.py(工具函数)。1)在调度过程中,(a)IB 发送、(b)IB 到 NVLink 转发、(c) NVLink 接收由相应的 warp 处理。2)在合并过程中,(1) NVLink 发送、(2)NVLink 到 IB 的转发和累积、(3)IB 接收和累积也由动态调整的 warp 处理。
2025-03-06 20:30:22
872
原创 DeepSeek开源Day2:DeepEP技术详解
包含测试脚本,如 test_intranode.py(节点内测试)、test_internode.py(节点间测试)和 test_low_latency.py(低延迟测试),以及 utils.py(工具函数)。1)在调度过程中,(a)IB 发送、(b)IB 到 NVLink 转发、(c) NVLink 接收由相应的 warp 处理。2)在合并过程中,(1) NVLink 发送、(2)NVLink 到 IB 的转发和累积、(3)IB 接收和累积也由动态调整的 warp 处理。
2025-03-06 20:28:45
1609
原创 DeepSeek开源Day1:FlashMLA技术详解
FlashMLA 是由 depseek-ai (深度求索)开发的一个开源项目,针对Hopper 架构GPU(例如 H100 或 H800)的高效的 MLA 推断(Inference)解码内核,旨在加速 MLA 机制的计算,特别适用于 DeepSeek 系列模型(如 DeepSeek-V2、V3 和 R1)。DeepSeek V3/R1 介绍(来源:中存算半导体)其中 MLA 是 DeekSeek 研发的多头潜注意力()机制。
2025-03-06 20:26:02
1040
原创 阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版
尤其是对于那些致力于打造专业级AI解决方案的小型企业或是初创团队而言,Qwen-32B无疑提供了一个极具吸引力的选择——它既具备强大的逻辑推理、数学处理以及编程能力,又保持了良好的可访问性和灵活性。我把这段代码粘贴到了Leetcode平台上,直接提交,没想到这段代码竟然完美的通过了全部测试用例吗,而且执行用时才127ms,击败了93%的在这个算法题库做尝试的人。最后的原因还是落在了Qwen团队的强化学习上。说实话,这个结果让我挺惊讶的,毕竟127ms的用时,看平均的用时基本都在1691ms左右。
2025-03-06 19:23:35
808
原创 大模型推理服务全景图
随着 DeepSeek R1 和 Qwen2.5-Max 的发布,国内大模型推理需求激增,性能提升的主战场将从训练转移到推理。由于无论是训练还是推理,如何提升性能都是业内讨论最多的话题之一。为什么是性能呢?在大模型消耗计算资源多、客户端内容流式生成的场景下,性能显得尤为重要。推理性能的提升涉及底层硬件、模型层,以及其他各个软件中间件层的相互协同,因此了解大模型技术架构的全局视角,有助于我们对推理性能的优化方案进行评估和选型。
2025-02-17 10:52:09
1016
原创 【RAG落地利器】Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比
向量数据库是一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。每个向量都有一定数量的维度,根据数据的复杂性和粒度,可以从数十到数千不等。向量通常是通过对原始数据(如文本、图像、音频、视频等)应用某种转换或嵌入函数来生成的。嵌入函数可以基于各种方法,如机器学习模型、词嵌入和特征提取算法。向量数据库的主要优点是,它允许基于数据的向量距离或相似性进行快速和准确的相似性搜索和检索。这意味着不用使用基于精确匹配或预定义标准查询数据库。
2025-02-14 22:44:16
1569
原创 Windows安装 WSL2、Ubuntu 、docker(详细步骤 , 弃用 docker desktop )
在现代软件开发领域,容器化技术已经成为提升应用部署效率和环境一致性的关键手段。Docker 作为一款卓越且被广泛应用的容器化平台,凭借其独特的技术架构,允许开发者将应用程序及其所需的全部依赖项,完整地打包进一个高度可移植的容器中。这一创新的技术方案,使得应用无论部署在何种基础环境,无论是本地开发机、测试服务器,还是复杂的生产集群,都能以高度一致的方式稳定运行,极大地降低了因环境差异导致的应用故障风险。在 Windows 操作系统生态中,Docker Desktop 凭借其出色的易用性,成为了广大开发者安装
2025-02-14 16:23:43
1721
原创 无法加载文件C:\Users\***\Documents\WindowsPowerShell\profile.ps1,因为在此系统上禁止运行脚本 是因为遇到了权限问题
以管理员身份运行PowerShell:右键点击 PowerShell 图标,选择“以管理员身份运行”,以获得更高的权限;在终端 get-ExecutionPolicy,如果输出 Restricted,就说明执行策略设置为过于严格,则可能阻止未签名的脚本运行。首先要确保 C:\Users***\Documents\WindowsPowerShell\profile.ps1 路径下的 script.ps1 文件是存在的,并且命名是正确的!关闭后再一次打开就没有提示信息了,问哦解决。
2025-02-14 14:25:45
1354
原创 DeepSearcher开源:告别传统RAG,私有数据+Deepseek,打造本地版Deep Research
OpenAI近期推出了一款名为Deep Research的高级AI研究工具,旨在帮助用户高效完成复杂的研究任务。该工具基于OpenAI最新的o3模型,专为网络浏览和数据分析优化。在本文写作过程中,笔者在思索如何对Deep Research做本地化复现的过程中,也有几个思考想要做一个分享:1、数据会成为未来企业的生存红线,掌握优质数据的企业,也就拥有了Deep Research +N,脱颖而出的机会,而在这一背景下,数据隐私大于天,如何做好数据保护,是在接入AI能力之前要更早考虑的事情。
2025-02-13 19:53:52
2897
原创 Windows中指定路径安装DockerDesktop
Widnows中直接安装docker desktop,默认会被安装到路径下,可以通过下面方式来设置安装到指定的目录下。
2025-02-13 11:23:14
549
原创 5.银河麒麟V10(ARM) 离线安装redis
将/usr/local/redis-5.0.3/redis.conf 复制一份到/etc/redis目录下,并命名为6379.conf。在当前/usr/local/redis-5.0.3目录下执行编辑redis.conf配置文件。解决方案: rm -rf /var/run/redis_6379.pid。将redis的启动脚本复制一份放到/etc/init.d目录下。在当前目录下/usr/local/redis-5.0.3。以上链接下载不了的情况使用百度网盘进行下载。在/etc目录下新建redis目录。
2024-12-25 16:55:25
1502
原创 MySQL8修改root密码报错 ERROR 1819 (HY000)
这意味着,拥有足够权限设置其他用户密码的用户可以将密码设置为该用户的名称,而不能将该用户的密码设置为执行语句的用户的名称。在调用 validate_password 的所有情况下都会进行检查,包括使用 ALTER USER 或 SET PASSWORD 等语句更改当前用户的密码,以及调用 VALIDATE_PASSWORD_STRENGTH() 等函数。我的错就是第七条 validate_password.check_user_name影响的,我要把密码修改成root和用户名一样。用户名匹配区分大小写。
2024-12-25 16:20:26
745
原创 4.银河麒麟V10(ARM) 离线安装 MySQL
链接: https://pan.baidu.com/s/1etUFFGVO_8VLc7o58W3cOw?将/etc/my.cnf 中的 skip-grant-tables 增加注释,重启 mysqld 服务;通过网盘分享的文件:mysql-8.0.40-1.el8.aarch64.rpm-bundle.tar。el8表示的是如CentOS 8,非麒麟版本的基本上都是el7版本,请核实你的版本在进行下载。登录不了怎么办别急,早知道你输入不对密码,请先执行修改密码再进行登录,跳过此章节直接修改密码。
2024-12-25 16:04:02
1995
原创 Linux x86_64离线安装Nginx全教程(含安装包)
通过网盘分享的文件:nginx链接: https://pan.baidu.com/s/1r6SCnogqbhm-JOTPIjc6xA?检查环境,分别执行gcc -v和g++ -v,查看显示信息的最后一行是否有gcc版本信息;5、校验nginx.conf文件语法格式:./nginx -t。3、处理完请求后再停止:./nginx -s quit。4、加载文件并重启:./nginx -s reload。6、版本和配置选项信息:./nginx -V。如果没有,安装gcc,进入gcc目录,执行。
2024-12-25 14:08:41
677
原创 3.银河麒麟V10 离线安装Nginx
链接: https://pan.baidu.com/s/1BUHbrEg29Hr0lz-SQFZHMQ?pwd=mgyv 提取码: mgyv。tar -zxvf + 包名称。:CPU核心数默认为1。可以设置为4,调高就行。需要去除斜杠,否则加载不到index.html。启动后在浏览器输入ip地址,如下图即可。如果网速下载不到请使用网盘下载。通过网盘分享的文件:nginx。在终端以下命令,刷新服务配置。以下是完整配置(去掉了多余的)打开终端执行以下命令。打开终端执行以下命令。打开终端执行以下命令。
2024-12-25 12:13:12
2206
原创 银河麒麟部署环境生态须知
使用lscpu查看,例如下面的是华为海思(HiSilicon)鲲鹏(Kunpeng-920)的CPU。温馨提示: 当前银河银河麒麟高级服务器操作系统V10发行版如下.(Tercel) 版本是 银河麒麟 V10 SP1 版本,(Sword) 版本是 银河麒麟 V10 SP2 版本,(Lance) 版本是 银河麒麟 V10 SP3 版本,可以使用下面3种方式查看。龙芯->mips ,
2024-12-25 10:53:19
476
原创 2.银河麒麟操作系统 v10 中离线安装 Docker
可以看到,系统处理器架构为 [ARM 架构](https://so.youkuaiyun.com/so/search?注意:–data-root=/app/docker/lib 是安装时数据的目录,建议自定义安装目录不要使用系统指定的目录进行安装。可以看到 docker 可以正常启动,不过当前是在窗口中手动启动的,Ctrl + C,杀掉就好。此时Docker 还没启动,只是可以看到Docker 的版本信息了。这里根据自己的架构,选择对应的包,下载就好了。测试 Docker 启动:dockerd。
2024-12-25 09:07:30
1320
原创 Python 和Java 哪个更适合做自动化测试?
所谓自动化测试,指的是使用独立于待测软件的其他软件,来自动执行测试、比较实际结果与预期并生成测试报告这一过程。在测试流程已经确定后,测试自动化可以自动执行的一些重复但必要测试工作。也可以完成手动测试几乎不可能完成的测试。对于持续交付和持续集成的开发方式而言,测试自动化是至关重要的。注重学习思路,测试基础的沉淀,测试策略及测试思路的培养对自动化测试更是事半功倍。等工作的时候基本都封装了一套自己的测试架构,大家更在乎的是使用xxxx的技术方案探讨和实践哦~~自动化测试进化图,点亮智慧树,请收好~
2024-12-24 21:51:34
634
原创 国内RPA产品对比
录制功能非常的不友好,必须先点击录制菜单项,再到界面上选取元素的方式生成节点,对程序员的代码能力要求比较高,Bug 太多不容易通过,容易进入死循环,大致就是 AA 的翻版。流程设计的步骤:写代码,编译,修改代码,编译,调试。RPA依靠先进的软件自动化技术,RPA依靠先进的软件自动化技术,大大降低开发成本和开发周期,实现银行内部跨系统和工作流程的自动化,提高生产力,降低成本。,指用软件机器人实现业务处理的自动化,以“模拟人”的方式进行业务操作,帮助企业处理重复的、规则固定的、繁琐的流程作业。
2024-12-24 21:34:21
1688
原创 15款行业大数据报告下载网站
投资理财类专业的研报大数据平台(可下载APP)。国家高端产业智库,研究报告免费下载PDF版本。全面专业的数据报告下载,学术专利知识查询。全球领先的新经济行业数据分析报告发布平台。科技与产业创新机构,研究数据报告PDF。科技行业数据报告,可下载PDF版本。全球知名的咨询公司,行业洞察分析。阿里出品,阿里相关产品数据报告。引领设计变革,设计行业数据报告。行业分析报告,提供PDF下载。各种数据报考在线浏览查看。移动互联网数据研究调查。第一财经商业数据中心。中国大数据产业观察。
2024-12-22 22:27:20
1635
原创 麒麟软件常见问题
A:直接点击视频中间的安装插件按钮,会自动打开flashplayer的下载界面,我选择的是.tar.gz方式安装,下载完成后解压,将libflashplayer.so 复制到 /usr/lib/mozilla/plugins文件夹,再进入/ usr/lib/mozilla/plugins文件夹,执行chmod 755 libflashplayer.so,更改插件权限,此时就可以观看视频了。A: 已适配的打印机,大部分驱动已集成到系统,可通过添加打印机查找是否有对应驱动,如无驱动则需向打印机厂商获取;
2024-12-22 21:26:20
1532
原创 银河麒麟高级服务器操作系统(ARM版)V10-服务器购买入口
银河麒麟高级服务器操作系统V10是麒麟软件有限公司针对企业级关键业务,适应虚拟化、云计算、大数据、工业互联网时代对主机系统可靠性、安全性、性能、扩展性和实时性等需求,依据CMMI5级标准研制的提供内生本质安全、云原生支持、自主平台深入优化、 高性能、易管理的新一代自主服务器操作系统。
2024-12-22 16:27:10
292
原创 BeyondCompared4提示“缺少评估信息或损坏”修复
使用 beyond compare4,在安装的30天后,出现“缺少评估信息”、“评估信息损坏”的提示。按 Win+R 进入 打开Windows命令运行框,输入cmd 之后将以下代码粘贴按回车即可!解决方法如下(Win11下亲测可行)
2024-12-22 15:43:08
241
原创 开发常使用IDEA插件
颜值是生产力的第一要素,IDE 整好看了,每天对着它也是神清气爽,有木有?就 Intellij IDEA 提供的暗黑和亮白主色,虽然说已经非常清爽了,但时间久了总觉得需要再来点新鲜感?Vuesion Theme 这个主题装上后,你会感觉整个 Intellij IDEA 更高级了。
2024-11-15 16:31:15
1100
原创 MongoDB索引操作和执行计划Explain()详解
/ 这里其实是说索引列的值的区分度,如果重复度过高,那么使用索引的性能可能不如不用,索引底层优化器可能不选择使用索引。举例,比如通过上面的执行计划发现某个作为查询条件的字段,没有用上索引,且通过索引可以极大提高性能,那么可以考虑对该字段增加索引。索引的选择性是指索引中不同值的唯一性程度。如果索引的选择性很低,即索引中的值几乎都相同,那么使用该索引可能不会带来明显的性能提升。返回的执行计划,可以确定是否使用了适当的索引,是否存在潜在的性能问题,并根据需要进行索引优化、查询重写等操作,以提高查询性能。
2024-11-15 16:12:23
1819
原创 mongodb explain 查看使用索引的名称 mongodb 查询索引
索引桶(indexbucket)的大小是有限制的,如果某个索引项超过了它的限制,这个索引项就不会被包含在索引中。结果集在原集合中所占的百分比越大,索引就会越低效,因为使用索引需要进行两次查找:一次是查找索引项,一次是根据索引的指针去查找其指向的文档。对于慢查询来说,它是最重要的诊断工具之一。也就是说,如果在 {“x” : 1} 上有一个索引,在 {“y” : 1} 上有另一个索引,然后在 {“x” : 123, “y” : 456} 上进行查询时,MongoDB 会使用其中一个索引,而不是两个一起使用。
2024-11-15 16:11:51
845
原创 MongoDB自定义顺序排序
我们希望按照商品的销售数量对商品进行排序,但是我们希望”Out of stock”状态的商品排在最后。首先,我们需要在每个商品文档中添加一个”status”字段,用于表示商品的状态。在我们的例子中,我们可以使用整数值来表示各个年级的排序顺序。通过以上命令,我们为每个状态分配了对应的排序值:0表示”Out of stock”,1表示”In stock”,2表示其他状态。命令对数据进行排序。上面的命令将按照”grade”字段的值升序对学生进行排序。,根据”grade”字段的不同值给出对应的排序值。
2024-11-15 15:37:31
635
原创 MongoDB聚合操作
{ “_id” : 4, “name” : “herry”, “sex” : “男”, “score” : 90, “age” : 56 }{ “_id” : 1, “name” : “tom”, “sex” : “男”, “score” : 100, “age” : 34 }{ “_id” : 2, “name” : “jeke”, “sex” : “男”, “score” : 90, “age” : 24 }管道操作是可以重复的。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。
2024-11-15 15:36:24
1258
原创 MongoDB聚合管道数组操作
语法:{ $last: }获取数组中最后一个元素例子:找到每个人最喜欢吃的最后一个水果"name": 1,])"name": 1,]){ "_id" : "1001", "name" : "张三", "lastFruit" : "orange" }{ "_id" : "1002", "name" : "李四", "lastFruit" : "apple" }{ "_id" : "1003", "name" : "王五", "lastFruit" : "orange" }
2024-11-15 15:33:18
1223
原创 mongodb基础知识
在 MongoDB 中使用 sort() 方法对数据进行排序,sort() 方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序排列,而 -1 是用于降序排列。如果你需要在MongoDB中读取指定数量的数据记录,可以使用MongoDB的Limit方法,limit()方法接受一个数字参数,该参数指定从MongoDB中读取的记录条数。由于所有出现在查询中的字段是索引的一部分, MongoDB 无需在整个数据文档中检索匹配查询条件和返回使用相同索引的查询结果。
2024-11-15 15:32:11
1122
原创 Git之国内项目托管平台
众所周知,GitHub 服务器在国外,如果网络不好的话,严重影响使用体验,甚至会出现登录不上的情况。针对这个情况,可以使用国内的项目托管平台—— Gitee 码云,来替代 Github 这个国外的项目托管平台。Gitee 码云是开源中国推出的基于 Git 的代码托管服务中心,网址是。Gitee 的使用方式和 GitHub 基本一样,此外它还是一个中文网站,如果英文不是很好的话,它是最好的选择。
2024-11-15 15:25:31
1676
原创 像JSON一样使用ProtoBuf,空间还能缩小60%,性能提升100%
在前面《释放你九成的带宽和内存:GZIP在解决Redis大Key方面的应用》一文中我使用GZIP算法可以将JSON格式数据的大小缩小88%从而节省了大量的存储和带宽资源,本文介绍另一种JAVA对象序列化神器——(Protocol Buffers(),它是由 Google 开发的一种用于序列化结构化数据的高效、灵活且语言中立的协议。它被广泛用于数据通信、数据存储、RPC(远程过程调用)等场景,特别是在分布式系统和微服务架构中。Protobuf 序列化后的数据体积通常比 JSON、XML 小很多,而且占用更少的
2024-11-06 09:02:37
688
原创 Node.js同时安装多个版本及相关配置指南(简单易操作)
以上就是如何给Node.js同时安装多个版本以及相关配置的内容,个人觉得非常简单易操作的,按照步骤来做,一般不会有什么问题。到此这篇关于Node.js同时安装多个版本及相关配置指南的文章就介绍到这了,更多相关Node.js同时安装多个版本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!在Ubuntu上安装最新版本的Node.jsCentos7 安装Node.js10以上版本的方法步骤Linux系统中如何下载、解压和安装特定版本的Node.js。
2024-08-30 14:23:24
2259
原创 【亲身经历】京东云服务体验记实:从满心期待到彻底失望
这次京东云的使用经历,我只能说非常失望。从服务响应的缓慢,到基本功能的不稳定,再到退款流程的不透明,每一个环节都让我感受到了深深的挫败感。对比之下,我之前使用过的阿里云、华为云和腾讯云,无论是在服务稳定性、响应速度,还是在客户服务的专业度上,都有着明显的优势。作为一名长期使用阿里云、华为云和腾讯云的用户,我对京东云充满了好奇和期待,毕竟京东在电商领域的口碑一直不错,自然也想看看他们在云服务方面的表现如何。作为云服务的核心功能之一,镜像的稳定性和访问速度至关重要,京东云在这方面的表现,实在是让人难以接受。
2024-06-20 17:21:05
1642
4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人