先上一张图吧,接口识别我们开源中国的链接(识别的我们今日的每日一搏 https://my.oschina.net/u/3747963/blog/1787633)
识别的一篇网络文章(原文地址: http://www.nowamagic.net/librarys/veda/detail/2048 )
能准确的分析页面标题,时间,TAG,还有最重要的是内容,就连内容里的广告也能识别并且去掉,是不是还可以。
测试地址: http://www.qlshou.com/apidemo/pageparse