
搜索引擎
lee_eric
这个作者很懒,什么都没留下…
展开
-
搜索人才争夺日趋白热化
近日,中文搜索引擎百度举行了“AStar”第二届百度之星程序设计大赛决赛,百度首席技术官刘建国表示,希望通过大赛,发现顶尖技术人才,为百度储备优秀的人力资源。 事实上,从对有工作经验人士的“挖墙脚”,到大肆招揽应届毕业生,再到储备优秀在校生的资源,Google、阿里巴巴雅虎、百度等著名搜索网站对于搜索领域的人才争夺自去年开始就如火如荼。对此,中华英才网副总裁陆学彬乐观地表示,随着搜索领域研究转载 2006-10-03 10:57:00 · 722 阅读 · 0 评论 -
互联网搜索的未来
微软帝国的缔造者比尔-盖茨(Bill Gates)曾写过一本在当时轰动一时的书——《未来之路》,他在这本276页的书中预测了微软乃至整个科技产业未来的走势。十年后,人们又一次开始对科技产业的未来展开了预测,不过这一次预测完全集中在盖茨10年前没有预测到的重要产业领域:搜索引擎。2006年5月19日和20日,雅虎欧洲研究中心和Universitat Pompeu Fabrah大学网络搜转载 2006-10-03 18:24:00 · 858 阅读 · 0 评论 -
GOOGLE搜索引擎剖析
撰文/Sergey Brin. Lawrence Page 翻译/万思文章来自《程序员》英文原文可以在这里找到http://dev.youkuaiyun.com/develop/article/12/12657.shtm关键字:WWW 搜索引擎 网络爬虫 PageRank Google 作为一种功能强大的搜索引擎,Googic的背后似乎隐藏着巨大的奥秘转载 2006-10-03 18:19:00 · 2826 阅读 · 0 评论 -
Doug Cutting 访谈录 -- 关于搜索引擎的开发
Doug Cutting Interview Doug Cutting is primary developer of the Lucene and Nutch open source searc转载 2006-10-03 18:16:00 · 1269 阅读 · 0 评论 -
中文分词和搜索引擎
作者:Winter 工程师搜索引擎,上网的人基本上都不陌生了,CNNIC的第17次《互联网调查报告》显示,使用搜索引擎服务的网民,仅次于电子邮件。中文分词,估计了解的人并不多,毕竟太技术,太底层。但中文分词是中文搜索引擎系统中非常重要的模块,这里之所以强调是中文搜索引擎,是针对英文搜索引擎来讲,因为对于英文来说,空格代表词和词之间的分隔,也就不存在分词问题。和中文搜索引擎类似还有日文、韩转载 2006-10-03 18:12:00 · 1243 阅读 · 0 评论 -
自然语言理解技术及其应用探讨
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平,而且在可预见的将来也达不转载 2006-10-03 18:08:00 · 5346 阅读 · 0 评论 -
搜索引擎发展综述
搜索引擎发展综述李锐 lirui@nic.ac.cn(中科院计算技术研究所 北京 100080)摘要:本文简述了搜索引擎的起源和发展,介绍了国内外的研究现状,对其分类、性能评测、关键技术等方面做了一定的讨论,在此基础上对其发展趋势作了大胆的预测。关键词:搜索引擎;Web挖掘;信息检索Internet自诞生以来不断成长,其内容不断丰富,整个网络逐渐堆积成一个前所未有的超大型信息库。I转载 2006-10-03 16:45:00 · 2908 阅读 · 0 评论 -
谈图片搜索
发表者: 朱安, Google 工程师 俗话说:百闻不如一见。有时候图片较于文字更能直接地表达意境。英语中也有相似的说法,就是:A picture is worth a thousand words,意为:一画千言。上星期张晶的《你知道吗》提到了几个图片搜索的巧妙应用,今天我想谈谈 Google 图片搜索的一些基本应用。Google 早在2000年时就开始向中文用户提供图片搜索的服务。目前,Goo转载 2006-10-03 16:36:00 · 697 阅读 · 0 评论 -
俞士汶教授谈中文语言处理
1、与英语等欧洲语言相比,中文在信息化处理上有很多不同的障碍,如:输入、分词等。请简要介绍一下中文语言处理的研究领域和存在的挑战?中文信息处理应该大致划分为汉字信息处理和汉语信息处理两个显然不同的但相互又有联系的层次。在文字信息处理的层次上,由于汉字是大字符集,与英语等欧洲语言采用的几十个字母相比,发展进程中确实遭遇过很多不同的障碍,不过现在大体上已经克服了,汉字信息处理技术已经实用化、产品化转载 2006-10-03 18:25:00 · 1049 阅读 · 0 评论