自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 pip清华源

三、将清华源设为默认源。

2025-11-27 21:20:33 218

原创 《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》论文笔记

探索纯强化学习是否能够激发大语言模型的推理能力,并进一步通过引入冷启动(Cold Start)数据和蒸馏(Distillation)技术,提升模型的泛化能力和小模型的推理能力。论文提出了两个主要模型:直接对基础语言模型(DeepSeek-V3-Base)进行强化学习训练,不使用任何有监督微调数据(SFT)。使用 Group Relative Policy Optimization (GRPO) 算法进行 RL。模型在没有任何监督数据的前提下,自然学会了多步推理、反思、验证等行为,展示出“自我演化能力”。但缺

2025-07-16 16:04:04 533

原创 大模型中常见的术语及其解释

在大模型(尤其是大语言模型、大视觉模型、大多模态模型等)领域中,有许多常见术语。

2025-05-28 19:20:48 1094

原创 软件设计师之软件工程与系统开发

极限编程(XP)12个最佳实践:计划游戏、小型发布、系统隐喻、简单设计、测试先行、重构、结对编程、集体代码所有权、持续集成、每周工作40小时、现场客户、编码标准。判定覆盖:设计足够多的测试用例,使得程序中的每一个判断至少获得一次“真”和一次“假”,即使得程序流程图中的每一个真假分支至少被执行一次。瀑布模型:不适用于需求多变或早期需求不确定的开发过程,按软件生命周期划分为制定计划、需求分析、软件设计、程序编写、软件测试和运行维护。排序为:语句覆盖、判定覆盖、条件覆盖、条件组合覆盖、路径覆盖。

2025-04-22 20:25:16 539

原创 大模型知识蒸馏

大模型就像一个知识渊博的老师,知识很多,但行动很慢(计算慢、部署难)。小模型就像一个学生,脑容量没老师大,但反应快(运行轻便、速度快)。蒸馏技术的目标就是:让这个小学生尽可能学到老师的“精华知识”,虽然没有老师那么全能,但足够聪明,能在大多数任务中表现很好!蒸馏技术的三步走训练老师(大模型)老师先认真学习海量知识(用大量数据训练),变得非常强大,能解决复杂问题(比如识别图片、生成文本)。老师生成“参考答案”老师不仅给出答案(比如“这张图是猫”),还会告诉学生为什么选这个答案。

2025-04-09 20:00:00 175

原创 软件设计师之案例分析

相对而言,程序题的难度不是很大,一般在判断条件上或返回值上出题较多,这需要认真阅读题目,找到对应的条件或返回结果。,如果是“存储名称”,则根据箭头提示的文字,将其“集合化”,比如是考试信息,则可以命名为“考试信息表”或“考试信息”。碰到这样的题时,要注意一下几点。UML是一个比较庞大的建模技术体系,在分析UML案例之前,首先应该对UML、设计模式有一定的了解,然后根据具体的设计模式进行解题。(1)读题要仔细,实体只可能是名词,大多是实体名词而非抽象名词,比如公司、部门、角色(经理、员工)等,重点划线。

2025-04-09 15:01:50 970

原创 ubuntu操作系统

tar -cvf example.tar example 其中,c表示create创建档案,v表示verbose显示详情,f表示file。归档并压缩:tar -zcvf example.tar.gz example 或 tar -xzvf example.tar.gz -C outdir。(3)退出,exit。还原档案包:tar -xvf example.tar -C outdir 其中,-C参数指定目标目录,默认解到当前目录下。特例:超级用户root,其用户目录为/root。

2025-04-08 13:36:27 342

原创 最近爆火的KAN是什么?与MLP的区别又有哪些?

像“固定流水线工厂”:每个工人(神经元)只会固定动作。

2025-04-01 14:36:17 615

原创 CMD常见的命令

1、盘符名称+冒号(英文状态下),举例:D:回车,表示切换到D盘。2、dir 说明:表示查看当前路径下的内容。5、cd 目录1\目录2\... 说明:进入多级目录。14、systeminfo 显示系统详细信息。4、cd.. 说明:回退到上一级目录。8、exit 说明:退出命令提示符窗口。6、cd \ 说明:回到盘符目录。9、mkdir 说明:创建新目录。3、cd 目录,说明:进入单级目录。7、cls 说明:清屏。

2025-03-18 19:16:59 202

原创 软件设计师之计算机硬件基础知识

中断方式下,CPU与I/O可并行工作。RISC:指令系统精简,指令字长等长,寻址方式少,通用寄存器多,组合逻辑控制(硬布线控制),指令流水线必须实现。DRAM:通过电容上的电荷来存储信息,需要定期刷新,速度较慢,适合大容量存储,系统主存主要由DRAM组成。中断判优:硬件故障>软件中断,非屏蔽中断>可屏蔽中断,DMA中断>I/O中断,输入设备>输出设备。CISC:指令系统庞大,指令字长不固定,寻址方式多,通用寄存器少,微程序控制。常见的异常有:除数为0,溢出,访问超时,缺页,地址越界,故障,自陷。

2025-03-17 19:51:43 183

原创 软件设计师之知识产权相关法规

受委托创作的作品,著作权的归属由委托人和受托人通过合同约定,合同未作明确约定或者没有订立合同的,著作权属于受托人。两个以上的申请人同日分别就同样的发明创造申请专利的,应当在收到通知后自行协商确定申请人。4、商业秘密的构成条件:(1)未公开的。(2)具有经济效益的。(3)采取了保密措施的。专利权的保护期限:发明专利权自申请日起20年,实用新型和外观设计自申请日起10年。相同内容的计算机软件发明创造,向专利行政部门提出专利申请,专利权授予最先申请的人。必须申请商标注册,未经核准注册的,不得生产、销售。

2025-03-16 08:30:00 358

原创 软件设计师之信息安全

SQL注入:把SQL命令插到Web表单提交、域名输入栏、页面请求的查询字符串中,最终欺骗服务器执行设计好的恶意SQL命令。安全外壳协议(SSH):一个较为可靠的、为远程登陆会话及其他网络服务提供安全的协议。被动攻击:只是窥探、窃取、分析数据,但不影响网络、服务器的正常工作。MIME消息包含文本、图像、音频、视频以及其他应用程序专用的数据。重放攻击:把窃取到的、接收方接受过的数据原封不动地再次发送给接收方,以达到欺骗接收方地目的。(2)确定访问权限:权限包含读、写、执行、删除、追加等方式组合。

2025-03-15 20:21:04 435

原创 大模型的参数究竟是什么东西?

🎛️你可以想象:大模型就像一个超级复杂的机器,内部有无数个**「旋钮」**(参数)。每个旋钮负责记住某种规律,比如:旋钮A:判断「苹果」和「香蕉」都是水果旋钮B:发现「因为...所以...」是因果关系旋钮C:记住「巴黎」是法国的首都当你问:「苹果和香蕉有什么共同点?模型就会拧动相关的「旋钮」,找到「都属于水果」这个规律,然后回答你。

2025-03-13 10:00:00 373

原创 软件设计师之新技术考点

架构:由数据层、网络层、共识层、激励层、合约层和应用层组成。关键技术:产品和传感器(条码、RFID、传感器等)自动化识别技术、无线传输技术(WLAN、蓝牙、ZigBee)、自组织组网技术、中间件技术。5V特点:大量(volume)、高速(velocity)、多样(variety)、价值(value)、真实性(veracity)服务类型:IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。五个环节:(1)数据准备(2)存储管理(3)计算处理(4)数据分析(5)知识展现。

2025-03-13 08:30:00 306

原创 大模型的token是什么意思?

一个单词(比如 "apple")、半个单词(比如 "un-" 或 "-happy"),甚至标点符号。下次你看到大模型限制"输入不能超过XXX字",其实就是token数量的限制哦!:模型一次能处理的token数有限(比如GPT-4最多约32k个token):通常是一个字(比如 "苹"、"果"),或者常见的词语(比如 "苹果")1️⃣ 给每个token编号(比如“苹果”=12345)2️⃣ 分析碎片之间的关系(比如“吃”后面常接食物):模型能识别的token总数有限(比如几万个)英文 "Hello!

2025-03-12 16:20:49 279

原创 软件设计师之面向对象常见考点

面向对象程序设计选择合适的面向对象程序设计语言,将程序组织为相互协作的对象集合,每个对象表示某个类的实例,类通过继承等关系进行组织。面向对象分析包括五个活动:(1)认定对象(2)组织对象(3)对象间的相互作用(4)定义对象的操作(5)定义对象的内部信息。包含的主要活动是识别类及对象、定义属性、定义服务、识别关系、识别包。类:类是在对象上的抽象,对象是类的具体化。对象:在面向对象的系统中,对象是基本运行时的实体。多态:不同的对象收到同一信息可以产生不同的结果。静态绑定:在一般的程序设计语言中,绑定是在。

2025-03-12 14:38:17 410

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除