基于关键字的网站域名相关性研究项目
启动:基于关键字的网站相关性研究项目
项目地址: http://www.domolo.com/website/domainClouds
常有一些问题困扰着我。
比如:
和 donews最相关和相似的网站是那个?
和 baidu 最相关和相似的网站是那个?
和 alibaba 最相关和相似的网站是那个?
和 csdn 最相关和相似的网站是那个?
和 seo.org.cn最相关和相似的网站是那个?
上次 第18次互联网统计报告 中说:
中国拥有的网站数量达到了78.84万 个,半年增加9万个。北京市的网站总数是14.4万,广东省的网站总数是14.1万,而基于广东省的域名数是50多万个,北京市的域名总数40万个,不过 CNNIC方面分析,下半年广东省的网站总数很有可能会超过北京市的网站总数,从而成为中国网站最多的省份。截至今年6月30日,中国内地的IPv4的地 址数有8478万多个,一年增长了1600多万个,现在排在全球第三位。
我现在已经收集了12万多个网址,正在以每天XXX个速度增加。
我的初期想法是:研究域名,ip,关键字,pagerank 等数据得出一些更有意义的结论。
等主域名达到30万个的时候,就开放所有功能.......敬请期待.
相关阅读:
http://www.wespoke.com/archives/001078.html
本研究旨在探索基于关键字的网站间相关性,通过收集并分析大量网站数据,包括域名、IP地址、关键字及PageRank等指标,以期揭示不同网站间的关联性和相似度。

2545

被折叠的 条评论
为什么被折叠?



