Search Engine 笔记
文章平均质量分 80
cos2cot
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[笔记-0]写在最前+笔记大纲
0. 废话 上这门课半学期了,从刚开始的一头雾水,到现在非常喜欢它,收获很大。 教授是在这个领域很有经验,课程设计很合理,讲得也很有条理很清晰。Jamie人也超可爱的~ 打算最近把前半学期的内容按照Jamie给的系统示意图中的模块整理出来,避免考完了就还给他了… 好啦,不多讲啦,开始正题~ -------------------------------------------------原创 2017-10-20 09:35:48 · 447 阅读 · 0 评论 -
[笔记] Introduction to Shallow Language Processing
Bag of Words 解释: 搜素引擎用词袋模型这种shallow form理解语言。词袋模型的特征有: 1)忽略word order; 2)忽略stopwords(像the,a这种频率高又没什么实际意义的词); 3)把words变成terms,将root相同的words变成一个term,比如cats->cat 优缺点: pros:简单;有效 c原创 2017-10-16 08:02:32 · 349 阅读 · 0 评论 -
[Search Engines笔记]17: Authority metrics
参考文档: [1] http://boston.lti.cs.cmu.edu/classes/11-642/ [2] http://www.shuang0420.com/categories/NLP/Search-Engines/ 为啥要它? retrieval model大多只考虑page content的好坏,比如title url什么的,然而来自不同source的相似的con原创 2017-12-21 03:02:03 · 481 阅读 · 0 评论 -
[LC]3. Longest Substring Without Repeating Characters
一、问题描述 Given a string, find the length of the longest substring without repeating characters. Examples: Given "abcabcbb", the answer is "abc", which the length is 3. Given "bbbbb", the ans原创 2017-12-21 06:31:12 · 171 阅读 · 0 评论 -
[Search Engines笔记] 16: Ranked retrieval: Feature-based models
参考文档: Jamie的课件:http://boston.lti.cs.cmu.edu/classes/11-642/ 阿衡的SE笔记:http://www.shuang0420.com/categories/NLP/Search-Engines/ 为啥要Learning to Rank: 我们已经学习了很多的检索方法: Retrieval Models:Vec原创 2017-12-19 08:14:37 · 603 阅读 · 0 评论
分享