
搜索引擎
cnki_ok
这个作者很懒,什么都没留下…
展开
-
谁是搜索引擎的挑战者
<br />从市值来看,全球最大的互联网公司的是谷歌,中国最大的互联网公司是百度。凑巧的是,谷歌还是全球最大的的搜索引擎,百度是中国最大的搜索引擎。不管是全球范围,还是中国市场,搜索引擎商业模式之优越都可见一斑。<br />搜索引擎迎来了开元盛世,绣口一吐,就是一个盛唐。但水满则溢,月盈则亏。盛世,往往就蕴含着危机。谷歌和百度,估计体会甚深。<br /> <br />先说谷歌,瑞士法院认为它的街景服务存隐私问题、谷歌在美或遭反垄断调查、它与美国国家安全局的结盟引起了政治争议、推出的社交网络Google Bu转载 2011-05-03 12:41:00 · 1108 阅读 · 0 评论 -
百度谷歌搜索引擎参数详解
谷歌搜索引擎搜索代码参数:(google.com) q--查询的关键词(Query),百度对应的参数为wd hl--Google搜索的界面语言(Interface Language) hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数。 hl=zh-TW繁体中文语言界面,港台地区常使用。hl=en 英文语言界面。start--显示结果的页数,百度对应转载 2012-07-18 09:57:25 · 5333 阅读 · 0 评论 -
百度搜索引擎详解
今天无意中读到的,网上转载很多了,不过还是忍不住在转载一番,不过原文就找不到了,读得有点累,但是多少有点启发了,推荐一下。查询处理以及分词技术随 着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为 普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎转载 2012-07-18 09:54:01 · 3537 阅读 · 0 评论 -
Clucene实现中文分词搜索
Clucene实现中文分词搜索(转载)2008年05月23日 星期五 17:42最近,一阵忙乎,终于在Clucene(版本0.9.16)中实现了中文分词搜索。 一些需要改动的地方如下: 一、 把项目设置为Use Unicode Character Set。因为使用ANSI时,汉字存在与其他语言编码重叠的问题,不能准确判断是否为汉字。转载 2012-08-09 08:35:21 · 857 阅读 · 0 评论 -
CLucene 0.9.16版本支持中文方法
重新去学习搜索1,环境:windows平台,vc82,项目设置:必须设置为Use Unicode Character Set。因为使用ANSI时,汉字存在与其他语言编码重叠的问题,在分析文本时,很难判断一个char是否是半个汉字,或者是前半个汉字还是后半个汉字。同时,CLucene对UCS2编码能够提供支持,所以VC项目直接设置为Use Unicode Character Se转载 2012-08-09 08:49:58 · 1329 阅读 · 0 评论 -
Clucene实现中文分词搜索
最近,一阵忙乎,终于在Clucene(版本0.9.16)中实现了中文分词搜索。一些需要改动的地方如下: 一、 把项目设置为Use Unicode Character Set。因为使用ANSI时,汉字存在与其他语言编码重叠的问题,不能准确判断是否为汉字。 二、 \src\CLucene\util\Misc.cp转载 2012-08-29 11:43:56 · 981 阅读 · 0 评论