- 博客(55)
- 收藏
- 关注
原创 学习DeepSeek - R1开发篇(3)
在每一轮对话中,模型会输出思维链内容(reasoning_content)和最终回答(content)。**程序的“隐形杀手”:**网络中断、用户误操作、资源不足等异常可能导致程序崩溃或数据丢失。**用户体验的“守护者”:**友好的错误提示(如“网络异常,请重试”)比直接闪退更易被接受。**开发效率的“倍增器”:**通过自动化测试减少50%调试时间,降低维护成本。· 长期记忆:通过memory.json存储的历史记录。· 短期记忆:当前会话的messages列表。从环境变量加载API密钥(推荐方式)
2025-11-22 19:15:00
578
原创 学习DeepSeek - R1 部署篇(2)
Q4_K_M是一种兼顾效率与精度的量化方案,适用于资源有限但需较高生成质量的场景。Q4_K_M 是一种混合量化策略,用于在模型压缩、推理速度与精度之间取得平衡。其具体含义如下:• Q4:主量化精度为 4 位整数(即每个权重参数用 4 个二进制位表示),相比 8 位浮点数(Q8_0)可减少约 50% 的存储和计算开销。• K:采用。
2025-11-21 18:30:00
581
原创 学习DeepSeek - R1 概念篇和基础使用篇(1)
本质上蒸馏是“知识迁移”而非“架构替换”。大模型蒸馏(Knowledge Distillation)是一种将大型复杂模型(教师模型)的“知识”迁移到小型轻量模型(学生模型)的技术。**满血版:**杭州深度求索人工智能基础技术研究有限公司开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,如同经验丰富的厨师(教师模型)通过传授火候掌控、调味技巧等隐性知识,让学徒(学生模型)无需完全复制操作细节,也能做出接近师傅水平的菜肴。
2025-11-20 16:30:00
1401
原创 Qwen3-Coder本地调用
Qwen3 Coder采用混合专家 MoE 架构,总参数达 480B,激活 35B 参数,拥有原生支持 256K token 的上下文,并可扩展至 1M 长度的惊人能力,在各类编程任务中都有着出色的表现。优势:保障代码隐私性,避免敏感数据外传;运行稳定与离线可用:本地部署彻底摆脱网络依赖,断网时仍能无限次使用模型;模型完全部署在开发者本地设备(如个人电脑/服务器),所有数据处理和推理均在本地完成,无需连接阿里云等外部服务器。生成代码,加注释,可以直接操作本地文件。:理解需求,制定开发计划。
2025-11-19 15:45:00
464
原创 大模型时代 Agent 开发
AI 领域技术脉络: Prompt 工程 -> Prompt Chain或Flow -> Agent、多AgentAI Agent 基本框架如图:基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式,带来更为广泛的人机融合。生成式AI的智能革命演化至今,从人机协同呈现了三种模式。智能体模式相较于嵌入模式、副驾驶模式无疑更为高效,或将成为未来人机协同的主要模式。AI Agent将使软件架构的范式从面向过程迁移到面向目标。
2025-11-18 16:55:05
1284
原创 一文详解Java线程池原理
当有新任务时,如果线程池中线程数没有达到核心线程池的大小,则会创建新的线程执行任务,否则将任务放入阻塞队列。当线程池中存活的线程数总是大于时,应该考虑调大。:当阻塞队列填满时,如果线程池中线程数没有超过最大线程数,则会创建新的线程运行任务。如果线程池中线程数已经达到最大线程数,则会根据拒绝策略处理新任务。非核心线程类似于临时借来的资源,这些线程在空闲时间超过之后,就应该退出,避免资源浪费。:阻塞队列,存储等待运行的任务。:非核心线程空闲后,保持存活的时间,此参数只对非核心线程有效。
2025-06-25 16:09:30
1371
原创 MySQL ACID靠什么保证的
ACID 中的原子性主要通过 Undo Log 来实现,持久性通过 Redo Log 来实现,隔离性由 MVCC 和锁机制来实现,一致性则由其他三大特性共同保证。
2025-06-20 10:03:43
916
原创 AI概念解析:从入门到精通的36个关键术语指南
随着AI的普及和快速发展,越来越多的人开始关注AI,但是深奥晦涩的专业术语,让很多人望而却步,甚至对于人们应用AI产生了一定困难。因此,社区决定对AI领域的热点概念和专业术语进行解读,并配备相应图表以便于大家更形象的理解。我们将从七大方面进行深度解读,方便大家能够更好的进入该领域学习和应用。
2025-06-18 13:51:34
686
原创 ArrayList线程安全问题解决方案
jdk8 Stream API的出现大大简化了我们对于集合元素的处理代码,对于串行流来说,无需考虑线程安全问题;但是,对于并行流来说,由于它是以多线程的方式并行处理同一个集合中的数据元素的,因此,存在着线程安全问题。使用并行流向一个集合元素中存入数据,由于集合对象作为共享资源来使用,如果不注意,就会存在线程安全问题。此问题的发现是由于实际生产过程中,集合对象存入数据之前进行了判空操作,不为空才加入数据,但是后续的结果中还是出现了空数据导致的空指针异常。
2024-04-30 14:22:41
1100
原创 IEDA使用小技巧
我们想稍微查看一下People这个类,但是tab已经够多了,ctrl+alt+b 会打开新的标签,标签多了就混乱了,尤其一堆命名类似的tab,这时候我们可以按ctrl+shift+i 实现预览功能,不占tab。idea默认是选择显示单行的,显示多行tab,在打开tab过多时非常实用。在左下角的 favorites 中 ,找到bookmarks,可直接点击跳转。ctrl+alt+h 可以清楚看到方法在哪些地方被调用。
2023-07-29 00:04:23
374
原创 docker基于centos7镜像安装python3.7.9
使用本地索引依赖包,pip提供了可以在本地目录搜索依赖包的选项,这样安装的好处是以前安装过的依赖包不会更新,避免出现升级带来的bug。中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/清华:https://pypi.tuna.tsinghua.edu.cn/simple。阿里云:http://mirrors.aliyun.com/pypi/simple/豆瓣:http://pypi.douban.com/simple/
2023-07-28 10:31:14
1636
原创 详解mnist数据集进行手写数字识别-tensorflow入门
mnist数据集进行手写数字识别–tensorflow入门载入并准备好 MNIST 数据集查看训练集和测试集数据预处理 将这些值缩小至 0 到 1 之间,然后将其馈送到神经网络模型构建模型 设置层编译模型 损失函数 优化器 指标训练验证模型 在模型训练期间,会显示损失和准确率指标进行预测 预计结果实际结果可视化 对比绘制图表 查看模型的预测验证预测结果import tensorflow as tfimport matplotlib.pyplot as pltimport num
2020-11-29 14:52:17
658
原创 推送代码到GitHub遇到的Connection timed out问题
最近在尝试使用Hexo和GitHub构建个人博客,本地将代码推送到GitHub是完全正常的。可是今天推送代码时候却推不上去。报错信息:ssh: connect to host github.com port 22: Connection timed outfatal: Could not read from remote repository.Please make sure you have the correct access rights and the repository exists.
2020-11-12 10:45:42
2475
原创 手把手一步步Linux下安装JDK1.8
Linux下安装JDK1.8下载 jdk1.8wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u131-b11/d54c1d3a095b4ff2b6607d096fa80163/jdk-8u131-linux-x64.tar.gz解压移动目录tar命令
2020-11-12 10:43:20
179
原创 PicGo+GitHub实现免费图床
为了方便自己学习和工作两台电脑.md文件中图片的同步,所以了解到PicGo和Github实现免费图床,特将操作过程记录下来。图床图床一般就是指存储图片的服务器。图床一般是指储存图片的服务器,有国内和国外之分。国外的图床由于有空间距离等因素决定访问速度很慢影响图片显示速度。国内也分为单线空间、多线空间和cdn加速三种。百度百科简单来说上传图片后会得到图片的链接,这样就可以通过此链接来查看图片,方便迁移。PicGoPicGo 是一款图片上传的工具, 支持SM.MS图床,微博图床,七牛图床,腾讯云COS
2020-10-22 16:30:14
600
原创 1014 福尔摩斯的约会 (20分) PATJava代码实现 牛客AC
1014 福尔摩斯的约会 (20分) PATJava代码实现 , 牛客AC, PAT中两个测试用例未过,求大佬解救。
2020-05-20 08:51:36
156
原创 1024 科学计数法 (20分) PAT Java代码实现
1024 科学计数法 (20分)科学计数法是科学家用来表示很大或很小的数字的一种方便的方法,其满足正则表达式 [±][1-9].[0-9]+E[±][0-9]+,即数字的整数部分只有 1 位,小数部分至少有 1 位,该数字及其指数部分的正负号即使对正数也必定明确给出。现以科学计数法的格式给出实数 A,请编写程序按普通数字表示法输出 A,并保证所有有效位都被保留。PAT Java代码实现
2020-05-16 20:19:43
338
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅