AI测试工具
文章平均质量分 80
wjcaolinghua
优秀的测试设计,不是数量的堆砌,而是对系统‘最可能出错’、‘最关键路径’、‘最容易遗漏’的精准打击。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据质量全景图:测试、清洗、完整性与偏差识别
数据质量全景:测试、清洗与偏差治理 本文系统阐述了数据质量管理的核心方法论。研究显示,不良数据每年造成企业1290万美元损失,数据工程师40%时间用于处理质量问题。数据质量测试包含7项关键检查(NULL值、容量、分布等),数据清洗则通过5大步骤转化原始数据。完整性检查需覆盖全生命周期,涉及审计跟踪、校验和技术等方法。同时,文章剖析了6大数据偏差来源及识别技巧,如归因窗口差异、时区处理等。最后提出3阶段实施路线图,助力企业构建可靠数据体系。电商案例显示,有效数据清洗可使库存准确率从73%提升至98%。原创 2025-11-27 14:55:34 · 292 阅读 · 0 评论 -
模型评估核心指标:准确率、精确率、召回率
本文介绍了分类模型评估的三大核心指标:准确率、精确率和召回率。通过混淆矩阵中的TP、FP、TN、FN四个基本概念,详细解释了每个指标的计算方法和应用场景。准确率反映总体预测正确率,但在数据不平衡时可能失真;精确率关注预测正例的准确性,适用于减少误报的场景;召回率衡量找出真实正例的能力,适用于减少漏报的情况。文章还讨论了精确率与召回率的权衡关系,并引入F1分数作为综合评估指标。最后通过练习题帮助读者掌握这些指标的实际计算和应用。原创 2025-11-26 15:15:45 · 862 阅读 · 0 评论 -
数据漂移:AI系统可靠性设计的终极挑战
数据漂移:AI模型性能衰减的隐形杀手 数据漂移指模型推理数据与训练数据统计分布偏离的现象,是导致AI系统性能下降的核心原因。主要分为特征漂移、概念漂移和标签漂移三类,会引发模型误判、业务损失等连锁反应。检测方法包括统计检验、可视化分析和专业算法,应对策略则涵盖模型重训练、数据再平衡和增量学习等技术。建立漂移监控体系、加强数据治理是当前最佳实践,未来自适应模型和联邦学习有望实现更智能的漂移应对。原创 2025-11-24 15:15:57 · 64 阅读 · 0 评论 -
驾驭人工智能:从新手到专家的提示词艺术
摘要:提示词是与AI沟通的核心工具,直接影响输出质量。优秀提示词需具备五大原则:清晰聚焦、简洁明了、提供上下文、结构化和迭代优化。常见类型包括指令型、生成型、问答型和编辑型提示词。需警惕"大模型幻觉"现象,建议要求AI提供来源、交叉验证并使用思维链提示。掌握这项技能可有效提升与AI的协作效率,实现从普通用户到"对话艺术家"的转变。(149字)原创 2025-11-19 15:20:50 · 488 阅读 · 0 评论 -
国内大模型及发展趋势
本文概述了中国主要大模型的发展现状及未来趋势。重点介绍了百度文心一言、阿里通义千问、腾讯混元等8款通用大模型的特点和应用场景,以及医疗、法律等垂直领域专业模型。文章指出当前大模型呈现六大发展趋势:1)从单模态向全模态演进;2)大小模型协同发展;3)从基础模型向具身智能进化;4)开源生态日益繁荣;5)更注重后训练优化;6)从聊天助手向推理决策系统转变。这些趋势将推动大模型向多模态感知、高效部署、物理世界交互等方向发展,最终实现从"知识库"到"智能体"的转变。原创 2025-11-18 14:36:45 · 478 阅读 · 0 评论 -
在扣子上搭建测试用例自动编写智能体
本文详细介绍了如何利用扣子平台搭建一个能将PRD文档自动转化为XMind测试用例的智能工作流。操作步骤包括:1)注册扣子账户并创建工作流;2)设置文件输入节点接收PRD文档;3)配置大模型节点生成测试用例(重点优化提示词);4)添加思维导图插件节点转换格式;5)测试运行流程。文中特别强调了提示词优化技巧和插件配置细节,最终可实现将需求文档一键转化为结构清晰的测试用例思维导图。该方案适合新手操作,每个步骤都配有具体实现方法。原创 2025-11-06 21:15:49 · 919 阅读 · 0 评论 -
Temporam无限免费的邮箱和手机号
Temporam是一个临时通信服务平台,提供临时邮箱地址和手机号码,用于接收邮件或短信验证码,保护用户隐私。主要功能包括:1) 邮箱功能:自动生成临时邮箱地址,可查看邮件内容及附件,但仅限接收且会过期;2) 短信功能:分配虚拟号码接收短信,适用于短期验证,不支持拨打电话。该平台无需注册,完全免费,适合处理一次性验证或避免垃圾信息,但不建议用于重要事务。使用时需注意有效期限制和功能约束。原创 2025-09-22 10:52:57 · 848 阅读 · 0 评论 -
免费的excel 数据AI助手,让你的工作轻松提效10倍
这是一款基于AI技术的智能工具,允许用户通过自然语言指令直接操作Excel文件,无需手动编写公式或宏。它简化了数据处理流程,尤其适合初学者或需要快速完成任务的用户。本指南将逐步介绍如何访问并执行常见操作,确保您能高效利用该工具。原创 2025-07-24 14:31:08 · 1014 阅读 · 0 评论 -
本地如何安装midscene.js运行环境
手把手教你本地安装midscene.js运行环境原创 2025-06-25 11:14:06 · 1735 阅读 · 0 评论 -
chrome插件中如何使用midscene.js
在Chrome扩展商店添加Midscene.js插件,随后在插件设置中配置环境变量,包括API基础URL、密钥和指定模型参数。完成配置后,用户可以像编写手工测试用例一样创建自动化测试脚本,示例展示了包含账号、密码输入和验证码自动识别的登录流程测试。系统执行后会显示10秒登录过程及结果。原创 2025-06-10 20:52:25 · 1189 阅读 · 0 评论 -
阿里百炼注册和本地环境配置
本文记录了在Windows系统中配置阿里云百炼大模型API Key的步骤。首先登录阿里云百炼平台创建并获取API Key,然后在系统环境变量中添加DASHSCOPE_API_KEY变量并填入密钥值。配置完成后,可通过CMD执行echo命令验证环境变量是否生效。该过程为使用midscence.js前的必要准备,其他系统配置可参考阿里云官方文档。原创 2025-06-09 20:33:42 · 813 阅读 · 0 评论
分享