版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出版、作者信息和本声明。否则将追究法律责任。http://blog.youkuaiyun.com/mayongzhan - 马永占,myz,mayongzhan
原理,原理,还是原理!!!
采集系统是综合了 定时执行,采集,存储,发布 的复合性系统
这些具体技术可以参考我以前的文章
1
定时执行分为两种,win和linux 本质都是一样的.定时利用cli执行某一php脚本,执行采集.
可以参考我的文章:(linux定时执行),去搜一下吧
2
主要的部分就是采集,可以参考我的文章,关于file,meta,url,socket,curl的文章,和正则处理.我都写过的.
3
存储,直接采用mysql数据库存数据
4
发布,略...原理都略掉...这个会造成混乱...