http://testyourvocab.com/

http://testyourvocab.com/

转载于:https://www.cnblogs.com/shouwangzhe-/p/4335688.html

按照软件工程思路设计 英语词汇量估算工具; 提交内容: 数据(如词汇表等)、算法思路、具体设计文档(报告)、代码等; 测试语料估计出来的四类学员词汇量水平(范围+确信度) 其他验证思路; 有实际创新加分 有扩展功能加分 分组责任参考(1-8人): 总体设计; 算法设计(主要是词汇量测试算法和验证方法); 前端选择和UI设计(web、桌面程序、app、小程序等都可以)。 简单数据库选择和设计;(不限定数据库) 演示测试:两种测试,一个GUI演示测试,一个是后台批处理测试。 实际估计:测试语料估计出来的四类学员(A.txt B.txt C.txt D.txt)词汇量水平(范围+确信度) 收集词汇列表等不同辅助数据,设计一至多种用户词汇量估算算法; 设计验证方法: 即 衡量你的算法, 估算出来的词汇量到底有多准确? 可与业内产品做比较比如: http://testyourvocab.com/ (首选),比较可行的方法 浏览器模仿自动测试,抓取结果。 参考 百词斩词汇测试 或 扇贝单次词汇测试 (这个难以批处理验证) 可以设计prompt做预训练模型或者在线api调用来验证,不能作为算法设计实现。 实际估计:根据给出的文本,估计不同类别学员的词汇量水平(见下页)。 界面设计:可用web页面、桌面程序、app、小程序等。 后台批处理测试结果举例: 可考虑 输入一个单词列表,直接算法后台计算结果 输入列表格式:词A, 认识; 词B,认识; 词C, 不认识;词D, 不认识;.... 。 输出结果:估算词汇量 界面实例测试结果 找不同学生,每个人测试3-5次,汇报测试结果(分组有多人必须包括这个功能) 主要数据:姓名、四级六级成绩、多次测试结果、 四六级和测试词汇量的相关性。 因为测试语料可见,所以设计算法时的词汇语料库不能太小,比如不能只用中小学的语料库 给出 词汇量估计范围+确信度 词汇量估计的 验证方法 是一个 开放问题,没有准确答案。可以上网参考别人的思路,但是不能直接调包。一个有效性验证的参考比较思路: (1)获取批量数据(模拟浏览器打勾点击): 到 testyourvocab.com 去点上认识的词 (一共2-3个页面),网站会给出 词汇量 (假设为 C1 ),这样一次模拟, 你可以抓下来的数据包括{你认识打勾的词 R1 个} {你没有打勾就是不认识的词 U1个} {网站预测的词汇量C1}。 假设模拟100次, 就可以得到100行的数据: {你认识打勾的词 Ri 个} {你不认识的词 Ui个} {网站预测的词汇量Ci} (2)自己算法估计把这100行前2部分 {你认识打勾的词 Ri 个} {你不认识的词 Ui个}批量输入到你实现的算法算出你们估计词汇量{Di}, 100 行 1列 (3)比较比较 {Di} 和{Ci}的差距。 评估设计算法的稳定性: 找一个 设计中 词汇量估计方法没用到的公认词汇列表A 对列表A 多次随机采样 生成 不同长度 不同比例的 词汇测试列表(按比例, 比如90%词汇认识,10%词汇不认识)然后多次平均 看看词汇量估计结果的合理性 (不同比例, 不同长度, 多次随机抽样 统计估计结果的平均值、方差值) 不同比例, 不同长度 举例:比如 比例 [10% 20% 30%] 长度 [ 200 300 400], 这样就有9种组合,每个组合测100次, 9*100=900次了所以一定要有后台批处理测试方法。
最新发布
06-21
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值