产品规划会议纪要-优快云博客

产品规划会议纪要

【免费下载链接】ERNIE-4.5-VL-28B-A3B-PT ERNIE-4.5-VL-28B-A3B 是百度研发的先进多模态大模型，采用异构混合专家架构（MoE），总参数量280亿，每token激活30亿参数。深度融合视觉与语言模态，支持图像理解、跨模态推理及双模式交互（思维/非思维模式）。通过模态隔离路由和RLVR强化学习优化，适用于复杂图文任务。支持FastDeploy单卡部署，提供开箱即用的多模态AI解决方案。项目地址: https://ai.gitcode.com/paddlepaddle/ERNIE-4.5-VL-28B-A3B-PT

一、会议基本信息

时间：2025-09-15 14:00-15:00
参与方：产品部(李明)、研发部(张伟)、设计部(王芳)
记录人：AI助手

二、讨论要点

1. Q4功能规划

讨论内容：李明提出Q4需完成三大核心功能：用户画像系统、智能推荐引擎、多端同步机制。张伟指出推荐引擎的算法选型存在分歧，目前在协同过滤与深度学习模型间摇摆。
结论：采用"混合模型"方案，基础推荐用协同过滤保证效率，个性化部分用轻量级深度学习模型。

三、决策事项

功能优先级排序：用户画像系统(10月) → 多端同步(11月) → 智能推荐(12月)
技术栈选择：前端采用React Native统一多端，后端使用Python+TensorFlow构建推荐系统
预算审批：新增2名算法工程师，预算上限15万元/季度

四、待办行动项

任务描述	优先级	负责人	截止日期
用户画像数据 schema 设计	高	王芳	2025-09-22
推荐算法原型验证	中	张伟	2025-10-08
跨部门需求评审会议安排	高	李明	2025-09-18

五、会议截图分析

截图 20250915_142315.png (产品Roadmap)

关键信息：Q1计划新增"企业版API"功能，与Q4的推荐系统存在数据互通需求
风险提示：当前规划中未明确数据中台的支持时间表，可能导致功能延期


## 常见问题与性能调优

### 显存不足解决方案
| 问题表现 | 解决方案 | 显存节省 | 性能影响 |
|----------|----------|----------|----------|
| 模型加载失败 | 启用4bit量化 | ~50% | 推理速度降低15% |
| 并发时OOM | 减少max-num-seqs | 每减少1并发节省~8GB | 吞吐量降低 |
| 长会议处理失败 | 降低max-model-len | 每减少4096 tokens节省~6GB | 上下文变短 |

### 推理速度优化
ERNIE-4.5-VL在A100上的基准性能：
- 纯文本生成：约30 tokens/秒
- 图像解析：单张图片约2-3秒
- 混合内容：约15 tokens/秒（含图像）

优化建议：
1. 预加载常用系统提示词到缓存
2. 采用流式输出（stream=True）提升用户体验
3. 非关键图像使用缩略图降低分辨率

### 精度问题处理
当模型漏检关键信息时，可采用以下提示工程技巧：

请使用思维链分析：

图片中有几个数据图表？分别是什么类型？
每个图表的X轴和Y轴代表什么？
找出图表中的最大值和最小值
将数据与会议讨论的KPI目标进行关联分析

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考