要比较Information Extraction的效率,把网页保存在本地这样可以排除网速的影响,从而得到一个更让人信服的结果,但是直接的download许多动态网页,保存下来的结果在浏览器呈现就会失去原来的样式,从而影响Extraction的准确性特别是利用Visual信息的Extraction算法,另一方面许多测试的网页过一段时间可能就不存在了,一个可以Save网页完整信息的工具就显得比较重要,这个工具就是提供这个功能的。
一个很有用的Information Extraction的firefox插件
最新推荐文章于 2025-12-17 20:27:06 发布
为了准确评估InformationExtraction算法的效率并避免网络速度的影响,使用能够完整保存网页信息的工具至关重要。这类工具不仅可以确保所保存的网页保持原始样式,还能够在原网页消失后继续用于测试。
7603

被折叠的 条评论
为什么被折叠?



