团队 Daily Scrum:2025 年 12 月 12 日(Beta Day 7)
项目核心信息链接:
Cax Beta 阶段计划与估计
今日进度
张平路
-
工作进展:
- 在集群上发起一次“接近真实规模”的端到端任务(多基因组数据)。
- 监控 CPU、内存、I/O、缓存命中率、Checkpoint 写入情况。
- 记录整体耗时,并与 Alpha 阶段基线进行对比,初步估算性能提升比例。
-
遇到的困难:
- 一轮完整任务耗时仍然较长,调参和问题定位周期偏大。
-
明日计划:
- 针对运行中发现的慢点阶段,按阶段拆开单独测试。
田钦中
-
工作进展:
- 收集端到端运行过程中的日志和中间结果,对缓存命中情况进行统计。
- 检查断点续跑机制:在中途故意中断一次任务,验证是否能成功从最近 Checkpoint 恢复。
- 将本次大规模测试的过程整理成一份“端到端测试记录”。
-
遇到的困难:
- 部分日志过于冗长,不利于阅读,需要在后续版本中做分级控制。
-
明日计划:
- 根据测试记录梳理问题清单,标出必须在 Beta 阶段修复的高优先级问题。
任务记录(Day 7 主任务:大规模端到端测试)
- HPC 环境端到端任务跑通;
- 断点续跑机制通过基本验证;
- 端到端日志与问题清单初稿产生。
燃尽图数据
| 日期 | Projected Remaining Hour | Actual Remaining Hour | Completed Hour(累计) |
|---|---|---|---|
| 12-04 | 72 | 72 | 8 |
| 12-05 | 64 | 64 | 16 |
| 12-08 | 56 | 56 | 24 |
| 12-09 | 48 | 48 | 32 |
| 12-10 | 40 | 40 | 40 |
| 12-11 | 32 | 32 | 48 |
| 12-12 | 24 | 24 | 56 |
今日小结:
首次大规模端到端任务跑通,标志着 Cax 在“真实场景可用性”上迈出了一大步,但性能和日志管理仍有优化空间。

7585

被折叠的 条评论
为什么被折叠?



