
PHP
雪峰流云
以技术为乐的程序猿!
展开
-
折磨半个月终于找到php脚本所谓的“内存泄露”原因!
最近项目改版做2期,1期是我写的,当然2期也由我主要负责,我借鉴了同事和网上的多种可取方法,在性能上做了较大提升。项目是一个后台网页爬取程序,使用php开发,基于DOMDocument+Xpath+curl多线程异步,同时少量网页使用phpQuery处理,正则表达式提取等等,处理数据的结构写入MySQL。在批量爬取处理过程中,内存占用很平稳,比如开300线程同时爬取html网页,做Dom+xp原创 2013-07-27 21:23:56 · 30840 阅读 · 6 评论 -
PHP函数printf()、sprintf()的用法
printf()函数优点在于可以格式化输出格式: %['padding_character][-][width][.precision]type 所有的转换说明都是以%开始,如果想打印一个%符号,必须用%% ; 参数“'padding_character”是可选,它将被用来填充变量直至所指定的宽度,该参数的作用就在变量前面填充,默认的填充字符是一个空格,如果指原创 2013-08-13 16:48:16 · 1321 阅读 · 0 评论 -
DOM+XPath提取规则注记!
下面是使用DOM+Xpath提取html中页面时经常使用的Xpath规则的一些示例:XPath相关的规则没有属性 //B[not(@*)]没有类属性 //B[not(@class)]要求链接有title属性 //a[@title]选取最后一个节点 //p[last()]/a要求有“title”值的class属性和没有class属性的节点集合表示如下://ul[@cl原创 2013-12-31 07:46:39 · 2668 阅读 · 0 评论 -
Notepad++ 列操作
在网上找到一篇关于socket编程的文章,想把其中的代码直接拷贝下来运行测试,但是人家网站做的不够人性化,每行的开头都有行号,直接拷贝就要一行行的删除,甚是麻烦,想到linux下的vi编辑器可以完成列操作,windows下应该也有相关软件可以胜任。想起实习时候用过的一款功能强大且开源免费的编辑器Notepad++,从网上找到如下解决方法,由于不知原始出处,这里不再注明。【列编辑】通常我们编辑文转载 2013-12-31 08:01:17 · 2143 阅读 · 0 评论 -
GeoIP的使用 - PHP版
转载地址:http://sjolzy.cn/GeoIP-PHP-version-use.htmlGeoIP介绍:什么是GepIP ?所谓GeoIP,就是通过来访者的IP, 定位他的经纬度,国家/地区,省市,甚至街道等位置信息。这里面的技术不算难题,关键在于有个精准 的数据库。有了准确的数据源就奇货可居赚点小钱,可是发扬合作精神,集体贡献众人享用是我们追求的。GeoIP如转载 2014-02-23 15:50:41 · 3664 阅读 · 0 评论