1.URL2io 提供网页信息提取服务
http://blog.url2io.com/url2io-app-samples/pageless/
2.readability
https://github.com/luin/readability
3.arex
https://github.com/ahkimkoo/arex
http://www.cnblogs.com/jasondan/p/3497757.html
本文介绍了几个用于从HTML网页中提取正文内容的工具和服务,包括URL2io、Readability、Arex和Html2Article。这些资源可以帮助开发者高效地获取网页的主要内容。
1.URL2io 提供网页信息提取服务
http://blog.url2io.com/url2io-app-samples/pageless/
2.readability
https://github.com/luin/readability
3.arex
https://github.com/ahkimkoo/arex
http://www.cnblogs.com/jasondan/p/3497757.html

被折叠的 条评论
为什么被折叠?