搜索引擎技术
clearsmoking
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
中文搜索引擎技术揭密:中文分词
信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvist转载 2007-03-10 13:32:00 · 596 阅读 · 0 评论 -
数学之美 系列二 -- 谈谈中文分词
数学之美 系列二 -- 谈谈中文分词2006年4月10日 上午 08:10:00uT("time114462952509335533");发表者: 吴军, Google 研究员 谈谈中文分词----- 统计语言模型在中文处理中的一个应用上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀到转载 2007-03-10 14:04:00 · 484 阅读 · 0 评论 -
Google の人気の秘密
高度な次世代テクノロジーを利用したGoogleは、すべての問い合わせに対し的確な検索結果を迅速に出します。その秘密は、インターネットのリンク構造そのものに基づいて、関連あるWebサイトを自動的に順位付ける方式を用いてる点にもあります。 Web上の膨大な情報にアクセスし有効に使いこなすには、優れた検索サービスが不可欠です。強力な検索ツールなしに、特定のWebサイトを見つけ出すということは、目録の转载 2007-03-10 23:46:00 · 1239 阅读 · 0 评论 -
搜索引擎中网络爬虫的设计分析
下面简单介绍一下搜索引擎的机器爬虫的制作和一些基本要注意的事项。 说的简单易懂一些,网络爬虫跟你使用的〖离线阅读〗工具差不多。说离线,其实还是要跟网络联结,否则怎么抓东西下来?那么不同的地方在哪里? 1】 网络爬虫高度可配置性。2】 网络爬虫可以解析抓到的网页里的链接3】 网络爬虫有简单的存储配置4】 网络爬虫拥有智能的根据网页更新分析功能5】 网络爬虫的效率相原创 2007-12-31 22:25:00 · 719 阅读 · 0 评论
分享