工具/经验
青缘
研二 腾讯llm算法ing
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【职场经验】论职场和学校汇报材料区别
职场汇报与学术汇报存在显著差异:职场汇报需以业务痛点为导向,采用"痛点-方案-效果"的平行模块结构,突出业务价值;而学术汇报更注重方法流程的完整呈现。职场汇报框架建议:先说明业务需求和痛点,再分模块展示解决方案及对应效果提升。这种结构化表达更利于突出重点,便于非专业人士理解,适用于转正/晋升答辩等场景。相比之下,学术论文的线性叙述方式在职场上容易显得冗长,难以快速展示核心价值。原创 2025-09-03 00:08:30 · 308 阅读 · 0 评论 -
【业务算法】如何度过算法工程师至暗时刻——指标不涨
摘要:针对模型训练中指标不达标的焦虑问题,文章指出数据质量是核心痛点。关键解决方案包括:逐条检查bad case、用奖励模型复核标注数据、数据飞轮迭代以及优先优化关键指标。作者强调,相比各种训练技巧,数据质量优化(如处理标注错误、调整数据长度)对模型效果影响更大。非数据问题(代码、超参等)相对容易解决。最后建议将数据优化作为首要任务,以提升模型效果。原创 2025-06-28 23:52:01 · 337 阅读 · 0 评论 -
【业务算法】阳性召回和阴性剥离优化&发掘bad case
在二分类任务中,模型调优需平衡召回率(黑样本覆盖率)和阴性剥离率(正常样本过滤效率)。业务通常优先满足召回指标,再优化其他性能。调优方法包括调整分类阈值和多模型对比分析。当效果不如预期时,需固定一个指标对比另一个,并重点分析灰样本。通过检查bad case的分布、文本特征、标注质量和数据一致性,可以识别模型弱点并改进。建议积累业务经验,循序渐进地提升模型效果。原创 2025-05-27 23:38:50 · 598 阅读 · 0 评论 -
HuggingFace模型推理通用模板(包含流式/非流式)
【代码】HuggingFace模型推理通用模板(包含流式/非流式)原创 2025-02-23 21:10:12 · 275 阅读 · 0 评论 -
模型拒答/拒绝回复的正则匹配
2. 对待检测的样本与此拒答样本进行相似度计算,达到一定阈值之后判断为拒答。在检测大模型的回答/输出是否拒答时,可以使用以下函数进行检测。1.把用此函数检测出来的样本进行保存。原创 2025-02-23 21:04:48 · 290 阅读 · 0 评论
分享