团队 Daily Scrum:2025年12月4日(Beta Day 1)
项目核心信息链接:
beta阶段计划和估计 - Cax 项目 Beta 阶段优化计划 ([优快云][1])
今日进度
张平路
-
工作进展:
-
按照 Beta 计划的第 1 天任务,对当前比对流程在真实数据集(中等规模基因组集合)上进行性能 Profiling。
-
搭建了基础的性能测试脚本,统计整体运行时间、CPU 利用率、内存占用情况。
-
初步识别出两个主要耗时热点:
- 读入与预处理阶段的 I/O 阻塞明显;
- 核心比对循环中存在重复计算,且尚未并行化。
-
形成了第一版《性能瓶颈清单草稿》,为后续多线程改造提供优先级依据。
-
-
遇到的困难:
- 现有日志粒度偏粗,难以精确定位到具体函数级别,需要补充更细的计时埋点。
- 不同数据集规模差异较大,导致一次测试时间较长,整体 Profiling 效率偏低。
-
今日计划完成情况:
- 完成了真实数据集上的首轮性能 Profiling。
- 产出了初版瓶颈分析文档和热点函数列表。
-
下一步计划(明天):
- 在核心函数周围增加精细化计时和统计埋点。
- 根据热点位置初步设计多线程拆分方案(哪些循环/模块可以安全并行)。
田钦中
-
工作进展:
- 协助准备多套不同规模的基因组数据集,规范测试数据目录结构,确保性能测试可重复执行。
- 编写了统一的性能测试脚本(包含参数配置、数据路径、输出日志路径),方便后续自动化跑多轮 Profiling。
- 将今天所有 Profiling 结果整理成表格,对比不同数据规模下的时间分布,为“并行化优先级”打分。
-
遇到的困难:
- 部分历史脚本中路径硬编码严重,迁移到统一测试环境时需要逐个修复。
- 性能数据量较大,手工整理容易出错,后续需要半自动化统计工具。
-
今日计划完成情况:
- 完成数据集准备与性能测试脚本编写。
- 形成了《多线程优化优先级列表》初稿(按耗时占比与并行可行性排序)。
-
下一步计划(明天):
- 将优先级列表细化为具体任务(如“重构读入模块”“拆分比对循环”等),拆到 4–6 小时一粒度。
- 尝试在非核心路径上做一个最小多线程 Demo,验证线程池框架可行性。
任务记录(与 Beta 第 1 天计划对齐)
今日主任务:多线程比对算法性能 Profiling(真实数据集) ([优快云][1])
-
预期输出:
- 性能瓶颈报告
- 热点函数统计
- 并行优化优先级清单
-
实际输出:
- 《性能瓶颈分析草稿 v0.1》
- 性能测试结果表(按数据规模与阶段拆分)
- 优先级清单初稿(待后续验证与更新)
-
工时统计:
- 张平路:4 小时
- 田钦中:4 小时
- 合计:8 小时
燃尽图数据(截至 12 月 4 日)
Beta 阶段估算总工作量:80 小时
两人每天各 4 小时,共 8 小时,计划周期 10 天。
| 日期 | Projected Remaining Hour | Actual Remaining Hour | Completed Hour (累计) |
|---|---|---|---|
| 12月4日 | 72 | 72 | 8 |
说明:
- 预计总工时 80 小时,理想情况下每天消耗 8 小时。
- 第 1 天实际投入 8 小时,工作按计划推进,实际剩余时间与理论值一致。


被折叠的 条评论
为什么被折叠?



