
Internet
文章平均质量分 55
Super.Jiju
C
Algorithms
Data mining
Web Mining
展开
-
Trends in Web Search
Relevance ->>Intelligence ̵Knowledge search, helping users find answers instead of links, gain insights about a topic, and complete tasks ̵Thus, building infrastructures for web-scale data m转载 2008-03-29 22:46:00 · 838 阅读 · 0 评论 -
利用C语言获取网页源代码
December 02利用C语言获取网页源代码 #include #include #include #pragma comment(lib, "ws2_32.lib") void geturl(char *url) { WSADATA WSAData={0}; SOCKET sockfd; struct sockaddr_in addr; struct hostent *pURL; cha原创 2008-12-02 10:58:00 · 10392 阅读 · 2 评论 -
赞一下youdao搜索!
很久以前我在闲聊的时候说:在一个社区里面,有很多的link,如果对一个link添加上预览功能,是不是会起到很好的效果呢?刚才使用了youdao.com,发现youdao就有这个功能,哈哈,看来我还是有先见之明啊; 这样的好处很明显:1.极大地节省了用户的时间;2.很好的解决了snippets的不足;3.特别在网速慢的像屎一样的地方,这种优越性更是不言而喻的;最后再来个小结论:不久的日子,很原创 2009-05-17 20:21:00 · 2095 阅读 · 1 评论 -
如何使用搜索引擎 zZ
搜索引擎为用户查找信息提供了极大的方便,你只需输入几个关键词,任何想要的资料都会从世界各个角落汇集到你的电脑前。然而如果操作不当,搜索效率也是会大打折扣的。 http://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!564.entry 比方说你本想查询某方面的资料,可搜索引擎返回的却是大量无关的信息。这种情况原创 2009-05-17 19:01:00 · 3925 阅读 · 0 评论 -
AOL Seach query database
AOL Seach query databasehttp://super-jiju.spaces.live.com/blog/cns!806C498DDEE76B61!570.entry500k User Session Collection----------------------------------------------This collection is distrib原创 2009-05-17 18:57:00 · 3812 阅读 · 0 评论 -
Query Segmentation Demo Release!
My demo about query segmentation which is based on prior paper has been released!If you are interested in it, You can view it with the site below:http://cid-806c498ddee76b61.skydrive.live.com/self原创 2009-07-27 13:05:00 · 2071 阅读 · 0 评论 -
IR with Lemur,Step by step
IR with Lemur,Step by stepLemur真是个好东西。可以在我前面的blog里面看到它的基本介绍;作为一个新手,偶会一步一步的在此记录自己的Lemur的学习历程,一方面作为自己的知识索引,另一方面也可以作为Lemur爱好者的参考。Lemur的官方网址:Lemur Project里面的资料很多,但是感觉不是很系统化,有时候经常会为一个函数或者实现一个功能而束手无策;看来偶很有必原创 2008-11-22 14:41:00 · 1082 阅读 · 0 评论 -
如何做好一个垂直搜索引擎 zZ
先引用几句话: 1.“确解用户之意,切返用户之需。” 2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。” 3.“搜索引擎不是人人都能做的领域,进入的门槛比较高。” 4.“只是优秀还不够,最好的方式是将一件事情做到极致。”(google十大真理) 5.“做搜索引擎需要专注” “对于一项排到第四的业务,门户很难做到专注。” 6.“用户无法描述道他要找什么,除非让他转载 2008-10-21 20:20:00 · 1064 阅读 · 0 评论 -
国内搜索引擎技术现状 zZ
当你登录某一个网站,在互联网上搜索各个网站的某一类内容,比如,输入“WTO”,希望得到最新、最全面的信息,你能等待多长时间? 几年前,人们希望十几秒,最多30秒钟就能得到结果,而现在的期望值是1~2秒,也就是说,伴随点击鼠标的“咔哒”一声,显示屏的页面已经变了,排在最前面的十几、二十条信息的标题已经出现在你的面前。 哪个网站的搜索速度明显地变快了,那它一定是使用了先进的搜索引转载 2008-10-21 20:19:00 · 1291 阅读 · 0 评论 -
•Top 10 Challenges in Search Engine
http://www.searchforum.org.cn/seminar/lectures/2006-9-25-JirongWen-Search%20Engine%20Overview.PDF #1: Spamming and Content Quality•Click =>Money, Spam=>Click ==> Spam->Money•An endless game betw转载 2008-03-30 16:31:00 · 790 阅读 · 0 评论 -
Top 10 Myths about Search Engine
http://www.searchforum.org.cn/seminar/lectures/2006-9-25-JirongWen-Search%20Engine%20Overview.PDF •Myth:Some search engines are close to “perfect”.•Fact:They are perfect because you have no choice转载 2008-03-30 15:20:00 · 972 阅读 · 0 评论 -
康夫子:医疗人工智能、大数据信息技术提供商
北京康夫子科技有限公司是一家专注于人工智能技术在医疗健康领域应用研发的技术驱动型公司,成立于2015年,主要创始人来自百度自然语言处理部和国家卫生计生委疾病控制局。凭借国际领先的知识抽取和知识推理、表示等知识图谱构建技术,康夫子成功打造了“医疗大脑”和“饮食营养”两项重要的知识内核(知识图谱)。康夫子医疗大脑以数万本医学教科书、近百万份临床病历、千万篇医疗论文为基础以保证数据的科学性,同时以千万条通俗语言的实际问诊记录为拓展,建立口头医学与文献医学之间的词汇关联,将普通公众对症状的描述和对疾病的理解准确原创 2015-02-23 10:44:16 · 6300 阅读 · 0 评论