基于关键字的网站域名相关性研究项目
启动:基于关键字的网站相关性研究项目
项目地址: http://www.domolo.com/website/domainClouds
常有一些问题困扰着我。
比如:
和 donews最相关和相似的网站是那个?
和 baidu 最相关和相似的网站是那个?
和 alibaba 最相关和相似的网站是那个?
和 csdn 最相关和相似的网站是那个?
和 seo.org.cn最相关和相似的网站是那个?
上次 第18次互联网统计报告 中说:
中国拥有的网站数量达到了78.84万 个,半年增加9万个。北京市的网站总数是14.4万,广东省的网站总数是14.1万,而基于广东省的域名数是50多万个,北京市的域名总数40万个,不过 CNNIC方面分析,下半年广东省的网站总数很有可能会超过北京市的网站总数,从而成为中国网站最多的省份。截至今年6月30日,中国内地的IPv4的地 址数有8478万多个,一年增长了1600多万个,现在排在全球第三位。
我现在已经收集了12万多个网址,正在以每天XXX个速度增加。
我的初期想法是:研究域名,ip,关键字,pagerank 等数据得出一些更有意义的结论。
等主域名达到30万个的时候,就开放所有功能.......敬请期待.
相关阅读:
http://www.wespoke.com/archives/001078.html