NLP+条件随机场实现解析PRD文档输出测试用例

最新推荐文章于 2025-03-11 09:44:30 发布

原创

最新推荐文章于 2025-03-11 09:44:30 发布 · 1.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了如何利用NLP和条件随机场算法将PRD文档解析成测试用例。首先，PRD需遵循特定规则，每个功能点一句。接着，通过分词、去停用词、获取语义结构等NLP处理，得到特征矩阵。然后，用wordtovec数据化特征并训练条件随机场模型。模型训练后，进行召回率测试，满足要求后上线。最后，提供接口给业务方，用于在线解析PRD生成测试用例，并通过迭代训练优化准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

17年的一个质量团队的算法竞赛题目，要求每个质量团队（测试开发工程师团队）通过算法实现将 PRD文档解析成测试用例，经过大量咨询BU甚至集团的算法大神后，技术栈定格在了 NLP（自然语言处理）结合条件随机场（算法）来解析无图PRD（PRD有一定规则）通过在线算法模型输出测试用例，基本流程：

1，要求PRD编写一个功能点一句自然语言（有且只有个一个规则）；设计测试用例基本结构为：P：前置条件；A：动作；E：预期结果

2，通过条件1的规则将一个PRD切割出多个功能点语句，放入一个LIST。

3，轮询LIST 给一个元素（PRD每一句话）调用NLP接口，将此语句分词，去停用词，获取语义关系结构，情感词分析，返回的结果为每一句话为一个JSON结构，如：打开首页点击商品图片后页面跳转到商品详情页。经过NLP分析后返回的分词，每个分词对应NLP赋予的3个属性（这些属性就是后面算法的提取的特征），将JSON结果转化为矩阵行列数据如：

4，为上面的分词打标 label 替换为步骤1 定义的用例每个部分映射 P,A,E （而label前面的字段为用的数据特征后面算法用到）

5，使用wordtovec 将字符串矩阵数据化（每个特征的数量范围尽量在一个度量内，否则后面还需要做归一化）。

6，获取条件随机场算法组件，将步骤5的数据提取80%作为训练数据对算法进行模型训练（其实就是求参，理论上训练数据越多，最后训练出的模型在预测结果方面越准确）。

7，调用步骤6训练完的模型，输入将剩余的20%打标数据，进行召回率测试，召回率达到一定要求后认为此模型已达到预期要求，上线。

8，上线后，提供工程化的接口给业务方，业务方调用此接口传入 PRD信息，在线算法模型返回解析后的测试用例。如：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。