对于采用ajax技术的页面,每次刷新或者向后滚动鼠标既可以换到新的列表,而浏览器中地址没有变化。
此时采用的方法为Fiddler查看或者类似工具,找到真实的页面地址即可。
另外可以在采集中单独添加标签,与标题,内容同等重要,只是主要标签有先后顺序之分,有些内容地址复杂的可用xpath工具自动提取
采集到的标签,作为属性之一,在后面的文件命名等极为重要
本文介绍了如何通过Fiddler等工具获取使用Ajax技术的网页真实地址,并利用XPath等手段自动提取复杂的内容地址,同时强调了标签采集的重要性。
对于采用ajax技术的页面,每次刷新或者向后滚动鼠标既可以换到新的列表,而浏览器中地址没有变化。
此时采用的方法为Fiddler查看或者类似工具,找到真实的页面地址即可。
另外可以在采集中单独添加标签,与标题,内容同等重要,只是主要标签有先后顺序之分,有些内容地址复杂的可用xpath工具自动提取
采集到的标签,作为属性之一,在后面的文件命名等极为重要

被折叠的 条评论
为什么被折叠?