RAG挑战赛是什么?
任务是基于企业年报构建问答系统。比赛日的流程简单来说是这样的:
- 解析阶段:你会拿到100份随机企业的年报(每份都是长达1000页的PDF),然后在2.5小时内完成解析并构建数据库。
- 问答阶段:系统需要回答100个根据模板随机生成的问题。
所有问题都必须有明确答案类型,比如:
- 是非题(是/否);
- 企业名称(或多选情况下的多个名称);
- 高管职位、新产品名称;
- 数字指标(收入、门店数量等)。
每个答案还必须附带证据页码——这就像强迫AI写毕业论文时必须标注参考文献,防止它瞎编乱造。
冠军系统架构:

除了基础流程外,这个冠军方案还包含两个路由器和LLM重排序模块
你可以在