现在觉得信息得聚合是相当得有用,现在找东西太难了。
想自己做一个东西,实现在线得信息聚合,并不是简单得聚合,而且可以抓取,信息进行分类得管理,定时得信息得刷新。
系统得难点在:信息得抓取,和定时刷新,如果用户量大得话,刷新很费时间呀。
信息得来源:2种
1。rss聚合。也得抓取详细得内容在本地保存。方便信息得整理,分类,信息得提取。可以对它进行在线得批注修改,合并。并发布在自己得blog上。
2。网页得抓取。
刚开始有想法,回头整理一个完整得需求。
另外,欢迎大家提出自己的见解,共同探讨。
网页分析器:可以分析网页的连接,图片,flash,js,css和js里的内容。