产品规划会议纪要
一、会议基本信息
- 时间:2025-09-15 14:00-15:00
- 参与方:产品部(李明)、研发部(张伟)、设计部(王芳)
- 记录人:AI助手
二、讨论要点
1. Q4功能规划
讨论内容:李明提出Q4需完成三大核心功能:用户画像系统、智能推荐引擎、多端同步机制。张伟指出推荐引擎的算法选型存在分歧,目前在协同过滤与深度学习模型间摇摆。
结论:采用"混合模型"方案,基础推荐用协同过滤保证效率,个性化部分用轻量级深度学习模型。
三、决策事项
- 功能优先级排序:用户画像系统(10月) → 多端同步(11月) → 智能推荐(12月)
- 技术栈选择:前端采用React Native统一多端,后端使用Python+TensorFlow构建推荐系统
- 预算审批:新增2名算法工程师,预算上限15万元/季度
四、待办行动项
| 任务描述 | 优先级 | 负责人 | 截止日期 |
|---|---|---|---|
| 用户画像数据 schema 设计 | 高 | 王芳 | 2025-09-22 |
| 推荐算法原型验证 | 中 | 张伟 | 2025-10-08 |
| 跨部门需求评审会议安排 | 高 | 李明 | 2025-09-18 |
五、会议截图分析
截图 20250915_142315.png (产品Roadmap)
- 关键信息:Q1计划新增"企业版API"功能,与Q4的推荐系统存在数据互通需求
- 风险提示:当前规划中未明确数据中台的支持时间表,可能导致功能延期
## 常见问题与性能调优
### 显存不足解决方案
| 问题表现 | 解决方案 | 显存节省 | 性能影响 |
|----------|----------|----------|----------|
| 模型加载失败 | 启用4bit量化 | ~50% | 推理速度降低15% |
| 并发时OOM | 减少max-num-seqs | 每减少1并发节省~8GB | 吞吐量降低 |
| 长会议处理失败 | 降低max-model-len | 每减少4096 tokens节省~6GB | 上下文变短 |
### 推理速度优化
ERNIE-4.5-VL在A100上的基准性能:
- 纯文本生成:约30 tokens/秒
- 图像解析:单张图片约2-3秒
- 混合内容:约15 tokens/秒(含图像)
优化建议:
1. 预加载常用系统提示词到缓存
2. 采用流式输出(stream=True)提升用户体验
3. 非关键图像使用缩略图降低分辨率
### 精度问题处理
当模型漏检关键信息时,可采用以下提示工程技巧:
请使用思维链分析:
- 图片中有几个数据图表?分别是什么类型?
- 每个图表的X轴和Y轴代表什么?
- 找出图表中的最大值和最小值
- 将数据与会议讨论的KPI目标进行关联分析
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



