- 博客(12)
- 收藏
- 关注
原创 多目标模型的学习
省车省油钱,但鲜花怕热、冰块怕化、炸药怕碰,温度湿度只能取中间值,结果花蔫了、水洒了、炸药还差点晃爆,互相拖后腿,这叫“跷跷板”。总结:从“一辆货车”到“旋钮混舱”,再到“贴封条的分层物流”,核心思路只有一句话——先共享后隔离,越隔越细,让包裹既能同路,又不互相添麻烦。行为上:CGC 是“单层隔离”,PLE 是“多层渐进隔离”——后者把 CGC 当积木,纵向堆叠,让共享与专属知识逐层提纯。,把每一段的预测都绑在“曝光”这张大地图上,既不怕样本跑偏,也不怕数据太少,送得稳、送得准,还省油钱。
2025-09-30 23:59:38
412
原创 大模型微调学习
相比全量微调,LoRA 表达能力受限,复杂任务可能效果不佳。:LoRA 只训练少量参数,显存占用低,训练速度快。:LoRA 权重可合并回原模型,推理速度无显著下降。先查模型的特定的指令微调格式,按格式构造数据。:LoRA 模型对未见过的新任务泛化能力较弱。:若基座模型能力弱,LoRA 提升空间有限。:LoRA 权重可插拔,便于多任务切换。仅训练插入的低秩矩阵,冻结原模型参数。保存 LoRA 权重(非完整模型)。:原模型参数不变,避免灾难性遗忘。加载原模型和 LoRA 权重。(用于可视化训练过程)等。
2025-09-27 03:00:36
354
原创 精排模型学习
校长(候选商品)拿出一条项链,发现“戒指班长”最相关,就把戒指班长的意见放大,裤子班长先靠边。做法:先把历史当“老乡”用 DIN 跑通 baseline,发现用户爱变心就上 DIEN 小火车,如果一天来意多端再让 DSIN 当老师分班开会——三步升级。淘宝“猜你喜欢”、抖音“推荐视频”、头条“推荐新闻”——只要一排商品或内容,都能用。“今天我要买键盘,把我过去看鼠标、看显卡的老乡全拉来撑场面,看跑鞋的老乡先靠边。会话兴趣激活层——候选商品当校长,给每个班长打分,谁分高听谁的。
2025-09-27 00:32:05
654
原创 提示词工程总结与拓展
提示词 = 任务【必选】+生成主体【必选】+细节【可选】+形式【可选】+角色扮演+分布思考+格式约束+例子。正例:“请把下列段落润色为 IEEE 会议论文的学术中文,保持原意,仅替换用词与句式,不增减信息”。把变量槽位做成模板字符串,供前端表单、API 查询参数直接替换,实现“零代码”上线新活动。杜绝歧义、省略、黑话。实现方法:抽象出“变量槽位”,如【主题】【受众】【字数】,其余部分固化。:去掉口语、冗余,保留逻辑,一次通过 Turnitin 语法检测。:品牌调性、受众、平台不清楚,输出千篇一律。
2025-09-24 00:27:56
784
原创 推荐系统task2学习总结
如何在庞大的物品库中,快速找到与用户兴趣高度匹配的候选集。传统的协同过滤方法虽然有效,但在面对数亿用户和数千万商品时,计算复杂度成为不可逾越的障碍。u2i召回的演进历程,本质上是一个将复杂的“匹配”问题逐步简化为高效“搜索”问题的过程。通过隐向量内积把二阶交互拆成“用户侧和+物品侧和+交叉内积”,交叉部分恰好满足 〈u,v〉 形式,首次证明“复杂评分可压缩成两支向量”。i2i召回解决的是“买了这个商品的人还会买什么”的问题,u2i召回直面的则是推荐系统的核心命题——“这个用户会喜欢什么商品”。
2025-09-21 23:58:42
430
原创 大模型云部署和私有部署
大模型云部署SiliconFlow 平台+OpenAI 兼容接口的“五分钟上手”方案:申请密钥、装库、写三行代码,就能让 8B 参数的 Qwen3 在屏幕上说出“你好”。这一步看似“Hello World”,却解决了初学者最容易被卡住的两大痛点——网络与硬件。无需 GPU、无需 CUDA、无需考虑显存,只要会发 HTTP 请求就能体验 2025 年最新模型的能力。作者把 temperature、max_tokens、stream 三个关键参数揉进对话封装函数,并用“温度越高越创意”一句话点透采样本质。
2025-09-21 03:00:04
192
原创 推荐系统初步
快速搬来 200~500 款“他可能喝”的饮料(可乐、雪碧、新品气泡水)。:老板不仅想卖饮料,还想顾客顺手买薯片、办会员、给五星。:用户一走进超市,货架上万种商品,你不能全部摆他面前。给这 200 款饮料逐一打分,谁分高谁靠前。同时输出多个指标(点击率、转化率、好评率)。,让用户最想买的出现在第 1-3 位。,避免“只点不买”或“买后差评”。用户真爱,速度要快,精度可放宽。:柜台地方小,只能摆 10 瓶。
2025-09-17 20:56:34
164
原创 实在Agent实现自动化办公
安装完成后,浏览器会出现插件提示,点击开启浏览器插件。按照安装向导的提示进行操作,包括接受许可协议、选择安装路径等。安装完成后,通常会有安装成功的提示。:登录后进入输入框界面,可以直接输入问题或任务需求,实在Agent会给出相关回复。通过以上步骤,你可以快速安装并使用实在Agent,享受其带来的自动化和智能化体验。:例如“帮我查询一下北京到杭州的机票信息”,实在Agent会自动规划任务并执行。:点击左侧界面切换按钮,可以展开全操作界面,进行更复杂的功能操作。:如果任务涉及网页操作,确保浏览器插件已开启。
2025-02-27 16:01:26
841
原创 使用 Cursor 编程的心得和技巧
通过以上技巧,你可以更高效地使用 Cursor 进行编程,减少手动编写代码的工作量,提高开发效率和代码质量。使用 Cursor 进行编程时,掌握一些高效的心得和技巧可以帮助你更好地利用其强大的 AI 功能,提高开发效率和代码质量。• 反馈具体问题:如果代码有错误,提供具体的错误信息或描述问题,帮助 Cursor 更好地理解并修正。• 生成测试代码:在开发过程中,要求 Cursor 生成测试代码,确保代码的正确性和稳定性。• 代码补全:在编写代码时,Cursor 会自动补全代码片段,减少手动输入的工作量。
2025-02-15 23:31:57
743
原创 cursor,我都已经再context那里选择某个文件了,还需要用@符号来选别的文件吗?
如果你需要在当前文件中引用其他文件的内容,或者需要引入新的文件作为上下文,那么可以使用。符号来引用这个文件,因为 Cursor 已经将其作为上下文加载了。中选择了某个文件,那么在当前编辑环境中,你不需要再使用。
2025-02-13 15:18:09
333
原创 cursor+Qwen2.5
**模型版本**:推荐使用 `Qwen2.5-Coder-32B` 或更高版本,支持长上下文和复杂代码任务。- **网络问题**:若国内访问受限,可通过阿里云百炼平台或代理服务解决。### **步骤 3:获取 API Key**### **步骤 1:安装 Cursor**2. **修改 API 基础 URL**1. **申请阿里云 API Key**1. **打开 Cursor 设置**### **步骤 4:选择并验证模型**### **步骤 2:配置模型接口**
2025-02-12 14:04:13
1458
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅