保护动态目标:应对 Web 应用概念漂移
1. 响应变化
当应用程序升级以产生不同响应时,就会发生响应变化。界面重新设计、功能添加或移除等都是导致响应变化的原因。在现代网站中,页面更新或重新设计经常发生,因此响应变化十分常见且频繁。
例如,一个视频分享应用的新版本在用户界面中引入了 Web 2.0 特性,允许在不刷新整个页面的情况下修改用户界面元素。旧版本中,该应用生成的文档中只有相对较少的节点包含客户端代码;而在新版本中,文档的许多节点都包含事件处理程序,用于响应用户事件向应用程序触发异步请求。如果响应模型没有更新以反映此类文档的新结构,由于 Web 应用响应特性的合法变化,将会产生大量误报。
2. 概念漂移的普遍性
为了了解概念漂移是否是现实世界网站的一个相关问题,进行了三个实验:
- 实验一:监测 2264 个公共网站
- 监测方法 :每小时访问每个网站的一个代表性页面,在 2009 年 1 月 29 日至 4 月 13 日期间,共收集了 3303816 个页面,每个网站有超过 1390 个快照。其中十分之一的代表性页面是手动选择的,包含大量表单、输入字段和带有参数的超链接;其余网站则使用其主页。
- 数据处理 :对于每个网站 w,在时间 t 抓取的每个页面样本与表单集合和输入字段集合的基数 |F|(w)t、|I|(w)t 相关联。收集变量 |F|w 和 |I|w 的样本,图 1 展示了变量 XI = stdev(|I|(w1)), …, stdev(|I|(wk)) 和 XF = stdev(|F|(w1)
超级会员免费看
订阅专栏 解锁全文
1205

被折叠的 条评论
为什么被折叠?



