
PHP
随风_ltw
这个作者很懒,什么都没留下…
展开
-
PHP编写爬虫参考
phpQueryPHP Simple HTML DOM ParserphpQueryListphp snoopyPhantomJS 1 、 Guzzle :功能很完善的 httpclient ,带异步并发功能,别的脚本语言找不到这么好的 httpclient2 、 Goutte :对 symfony 的 dom-crawler 和 css-selector 的简单封装,你也可以直接用...原创 2018-08-01 18:04:04 · 591 阅读 · 0 评论 -
Yaml爬虫规则
- rule: href: { select: img:eq(0), attr: href, filter: -a -#footer img, callback: [regex, '/^abc(\d)$/'] } content: { select: img:eq(0), attr: text, filter: -a -#footer img, callback: [func_...原创 2018-08-01 18:04:37 · 339 阅读 · 0 评论 -
获取wordpress分类,递归拼接无限级分类血缘关系并进行排序,返回原始数据非HTML
wordpress提供了两个获取分类的函数wp_list_categories()和get_categories,一个格式化输出分类,另一个直接获取分类数组,格式化的配置参数自定义性太差,分类数组没有层级关系,这两个都满足不了需求,只能通过get_categories()获取的数据加工处理<?phprequire('wp-blog-header.php' );header("Co...原创 2018-11-19 16:42:54 · 542 阅读 · 0 评论