做一个博客聚合的站点,而站点的聚合必须不能手工聚合,而是程序自动聚合,这样,才能在众多的聚合网站中,立于不败之地。
程序自动聚合,实际上就是网页搜索。可是考虑使用python开发。
这个只是一个想法,不知道能否实现,如果可以的话,每天可以更新成百上千的内容。
博客上的内容必须被采集下来,作为自己页面的博客,然后注释上来源地址。
另外加上论坛加精贴聚合
先选择几个有特色的网站,作为内容来源。每个网站选择一个特色版块。
内容采集时,可以对页面的访问量设定一定的值,如:1-20页,采集访问量n以上的页面,以后一次性采集500次以上。具体值可以先统计再采集。一般总采集量在500-1000篇文章左右。
博客选择:
linux: http://blog.chinaunix.net/techart.php?frmid=6&page=1
freebsd: http://blog.chinaunix.net/techart.php?frmid=7&page=1
论坛:不过论坛可以对大型技术论坛多采集几个重要版块
linux内核:http://linux.chinaunix.net/bbs/forum-8-1.html
linux服务器应用:http://linux.chinaunix.net/bbs/forum-3-1.html
linux入门:http://bbs.linuxeden.com/forum-15-1.html