首先澄清一下,JS实现的爬虫是指用JS实现解析逻辑的爬虫,大概的想法就是把某个页面的内容下载下来,像IE或者Firefox那样把HTML的内容解析成DOM树,然后用JS解析页面的内容,得到自己想要的东西。
为什么要用JS呢?一是会JS的人基本都是搞WEB相关的东西的,DOM什么的都是熟人熟路;二是JS里面像CSS selector、jquery这样方便的东西,用起来应该是很爽的。
如果有这么个东西,大家以后没事爬爬数据的时候还是很方便的。
大家觉得这个主意怎么样?要是觉得好的人多,我打算找人一起弄个比较成熟的包出来 。
为什么要用JS呢?一是会JS的人基本都是搞WEB相关的东西的,DOM什么的都是熟人熟路;二是JS里面像CSS selector、jquery这样方便的东西,用起来应该是很爽的。
如果有这么个东西,大家以后没事爬爬数据的时候还是很方便的。
大家觉得这个主意怎么样?要是觉得好的人多,我打算找人一起弄个比较成熟的包出来 。
JS爬虫实践
本文探讨了使用JavaScript进行网页内容抓取的技术方案。介绍了利用JS解析HTML并获取所需数据的方法,强调了JS在DOM操作及选择器应用上的优势。
1179

被折叠的 条评论
为什么被折叠?



