产品规划会议纪要

产品规划会议纪要

【免费下载链接】ERNIE-4.5-VL-28B-A3B-PT ERNIE-4.5-VL-28B-A3B 是百度研发的先进多模态大模型,采用异构混合专家架构(MoE),总参数量280亿,每token激活30亿参数。深度融合视觉与语言模态,支持图像理解、跨模态推理及双模式交互(思维/非思维模式)。通过模态隔离路由和RLVR强化学习优化,适用于复杂图文任务。支持FastDeploy单卡部署,提供开箱即用的多模态AI解决方案。 【免费下载链接】ERNIE-4.5-VL-28B-A3B-PT 项目地址: https://ai.gitcode.com/paddlepaddle/ERNIE-4.5-VL-28B-A3B-PT

一、会议基本信息

  • 时间:2025-09-15 14:00-15:00
  • 参与方:产品部(李明)、研发部(张伟)、设计部(王芳)
  • 记录人:AI助手

二、讨论要点

1. Q4功能规划

讨论内容:李明提出Q4需完成三大核心功能:用户画像系统、智能推荐引擎、多端同步机制。张伟指出推荐引擎的算法选型存在分歧,目前在协同过滤与深度学习模型间摇摆。
结论:采用"混合模型"方案,基础推荐用协同过滤保证效率,个性化部分用轻量级深度学习模型。

三、决策事项

  1. 功能优先级排序:用户画像系统(10月) → 多端同步(11月) → 智能推荐(12月)
  2. 技术栈选择:前端采用React Native统一多端,后端使用Python+TensorFlow构建推荐系统
  3. 预算审批:新增2名算法工程师,预算上限15万元/季度

四、待办行动项

任务描述优先级负责人截止日期
用户画像数据 schema 设计王芳2025-09-22
推荐算法原型验证张伟2025-10-08
跨部门需求评审会议安排李明2025-09-18

五、会议截图分析

截图 20250915_142315.png (产品Roadmap)

  • 关键信息:Q1计划新增"企业版API"功能,与Q4的推荐系统存在数据互通需求
  • 风险提示:当前规划中未明确数据中台的支持时间表,可能导致功能延期

## 常见问题与性能调优

### 显存不足解决方案
| 问题表现 | 解决方案 | 显存节省 | 性能影响 |
|----------|----------|----------|----------|
| 模型加载失败 | 启用4bit量化 | ~50% | 推理速度降低15% |
| 并发时OOM | 减少max-num-seqs | 每减少1并发节省~8GB | 吞吐量降低 |
| 长会议处理失败 | 降低max-model-len | 每减少4096 tokens节省~6GB | 上下文变短 |

### 推理速度优化
ERNIE-4.5-VL在A100上的基准性能:
- 纯文本生成:约30 tokens/秒
- 图像解析:单张图片约2-3秒
- 混合内容:约15 tokens/秒(含图像)

优化建议:
1. 预加载常用系统提示词到缓存
2. 采用流式输出(stream=True)提升用户体验
3. 非关键图像使用缩略图降低分辨率

### 精度问题处理
当模型漏检关键信息时,可采用以下提示工程技巧:

请使用思维链分析:

  1. 图片中有几个数据图表?分别是什么类型?
  2. 每个图表的X轴和Y轴代表什么?
  3. 找出图表中的最大值和最小值
  4. 将数据与会议讨论的KPI目标进行关联分析

【免费下载链接】ERNIE-4.5-VL-28B-A3B-PT ERNIE-4.5-VL-28B-A3B 是百度研发的先进多模态大模型,采用异构混合专家架构(MoE),总参数量280亿,每token激活30亿参数。深度融合视觉与语言模态,支持图像理解、跨模态推理及双模式交互(思维/非思维模式)。通过模态隔离路由和RLVR强化学习优化,适用于复杂图文任务。支持FastDeploy单卡部署,提供开箱即用的多模态AI解决方案。 【免费下载链接】ERNIE-4.5-VL-28B-A3B-PT 项目地址: https://ai.gitcode.com/paddlepaddle/ERNIE-4.5-VL-28B-A3B-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值