现在觉得信息得聚合是相当得有用,现在找东西太难了。
想自己做一个东西,实现在线得信息聚合,并不是简单得聚合,而且可以抓取,信息进行分类得管理,定时得信息得刷新。
系统得难点在:信息得抓取,和定时刷新,如果用户量大得话,刷新很费时间呀。
信息得来源:2种
1。rss聚合。也得抓取详细得内容在本地保存。方便信息得整理,分类,信息得提取。可以对它进行在线得批注修改,合并。并发布在自己得blog上。
2。网页得抓取。
刚开始有想法,回头整理一个完整得需求。
另外,欢迎大家提出自己的见解,共同探讨。
网页分析器:可以分析网页的连接,图片,flash,js,css和js里的内容。
本文探讨了一种在线信息聚合工具的构想,旨在通过RSS聚合和网页抓取等方式收集信息,并实现信息分类管理及定时刷新等功能。此外,还考虑了信息分析及用户交互等特性。
944

被折叠的 条评论
为什么被折叠?



