NLP+条件随机场实现解析PRD文档输出测试用例

本文介绍了如何利用NLP和条件随机场算法将PRD文档解析成测试用例。首先,PRD需遵循特定规则,每个功能点一句。接着,通过分词、去停用词、获取语义结构等NLP处理,得到特征矩阵。然后,用wordtovec数据化特征并训练条件随机场模型。模型训练后,进行召回率测试,满足要求后上线。最后,提供接口给业务方,用于在线解析PRD生成测试用例,并通过迭代训练优化准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

       17年的一个质量团队的算法竞赛题目,要求每个质量团队(测试开发工程师团队)通过算法实现将 PRD文档解析成测试用例,经过大量咨询BU甚至集团的算法大神后,技术栈定格在了 NLP(自然语言处理)结合条件随机场(算法)来解析无图PRD(PRD有一定规则)通过在线算法模型输出测试用例,基本流程:

1,要求PRD编写一个功能点一句自然语言(有且只有个一个规则);设计测试用例基本结构为 :P:前置条件;A:动作;E:预期结果

2,通过条件1的规则 将一个PRD切割出多个功能点语句,放入一个LIST。

3,轮询LIST 给一个 元素(PRD每一句话)调用NLP接口,将此语句分词,去停用词,获取语义关系结构,情感词分析,返回的结果为每一句话为一个JSON结构,如:打开首页点击商品图片后页面跳转到商品详情页。经过NLP分析后 返回的分词 ,每个分词对应NLP赋予的3个属性(这些属性就是后面算法的提取的特征),将JSON结果转化为 矩阵行列数据 如:

4,为上面的分词打标  label 替换为 步骤1 定义的用例每个部分映射 P,A,E (而label前面的 字段 为用的数据特征 后面算法用到)

5,使用wordtovec 将字符串矩阵 数据化 (每个特征的数量范围尽量在一个度量内,否则后面还需要做归一化)。

6,获取条件随机场算法组件,将步骤5的数据 提取80%作为 训练数据 对算法进行模型训练(其实就是求参,理论上训练数据越多,最后训练出的模型在预测结果方面越准确)。

7,调用步骤6训练完的模型,输入将剩余的20%打标数据,进行召回率测试,召回率达到一定要求后 认为此模型已达到预期要求,上线。

8,上线后,提供工程化的接口给业务方,业务方调用此接口传入 PRD信息,在线算法模型返回解析后的 测试用例。如:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值