- 博客(12)
- 资源 (2)
- 收藏
- 关注
原创 矩阵求导--记录整理
(矩阵求导的本质与分子布局、分母布局的本质(矩阵求导——本质篇))[https://zhuanlan.zhihu.com/p/263777564](矩阵求导公式的数学推导(矩阵求导——基础篇))[https://zhuanlan.zhihu.com/p/273729929](矩阵求导公式的数学推导(矩阵求导——进阶篇))[https://zhuanlan.zhihu.com/p/288541909]先记录一下最近参考的矩阵求导的资料,后面准备写类似的总结和整理的笔记。
2024-02-04 12:02:07
226
1
原创 linux进程运行空间分析
7.1 进程运行空间程序编译链接成功后,要运行;由自己的虚地址空间,映射到物理地址空间进行运行; 可执行文件的虚地址空间,也就是进程运行空间,是怎么划分的?linux-64bit机器为例: 地址64bit,标识范围:0x0000000000000000 ~ 0xFFFFFFFFFFFFFFFF text segment: 代码段 二进制代码;从虚拟内存地址0040000...
2018-09-25 16:53:23
732
原创 c++ STL - regex 正则表达式
c++11引入了boost库实现的正则表达式:regex 参考下面的代码:/* * 正则表达式的使用:c++ 11 提供了正则表达式库,原来是在boost::regex库中 * * 一个str是否是满足某个模式匹配的串,通过正则表达式来判定; * 比如: * ab.cpp 满足 *.cpp 这种模式匹配规则 * * regex:regular expression * *
2018-01-09 23:42:25
1535
原创 第七章 一个完整搜索系统中的评分计算
7.1快速评分及排序思想:把查询向量看成是1,,这样的话,计算query和文档d的余弦相似度时,只需要累加文档d的权重即可7.1.1 非精确的返回前k偏文档的方法思想:1)先找一个文档集合A;条件是包含很多和前k偏文档得分相近的文档;K2)返回集合A中的得分最高的前K篇文档;7.1.2 索引去除技术思想:1)在倒排中查询字典时,词项idf值超过一定阀值的文档被留下;小于阀值
2017-10-18 12:59:12
830
原创 第六章 文档评分、词项权重计算及向量空间模型
6.1 参数化索引及域索引检索的时候,条件可以设置:标题中含?作者是?摘要中含? 有条件要求情况下,怎么处理索引来支持检索?参数化索引。一篇文档,可能含有:标题,摘要,作者,正文等各个部分。不同的部分看做不同的:域(任意自由文本) ,对不同的域建立域索引例子: william作者的作品,建立域索引;支持查询"标题出现merchant,作者有william,正文中存在短语gentl r
2017-08-01 19:09:07
2067
原创 c++ STL - priority-queue 优先级队列
priority_queue 优先级队列是一个拥有权值概念的单向队列queue,在这个队列中,所有元素是按优先级排列的(也可以认为queue是个按进入队列的先后做为优先级的优先级队列——先进入队列的元素优先权要高于后进入队列的元素)。在计算机操作系统中,优先级队列的使用是相当频繁的,进线程调度都会用到。在STL的具体实现中,priority_queue也是以别的容器作为底部结构,再根据堆的处理规则
2017-06-18 14:06:23
395
原创 第四章 索引构建
《信息检索导论》美德两国作者 王斌翻译本文是本人的读书笔记本书参考:http://home.ustc.edu.cn/~zhufengx/ir/index.html [中科大的教学网站,非常具有参考价值] 4.2 基于块的排序索引方法本节存在疑问:多个块进行合并时,把全部的块读入,并写到一个merge文件中,一样需要大内存吧?这个问题怎么解决的?算法思想实例
2017-05-31 11:56:23
349
原创 c++ explicit
explicit 的作用?针对1个参数的,构造函数,存在隐式数据类型转换的可能;为了避免这种转化,构造函数内部使用explicit进行限定,不允许单参数的隐式类型转换;class Test {public: Test(int n):num(n){}private: int num;}Test val = 10;//实际进行隐式类型转换:Test tmp(10)
2017-05-02 14:03:08
229
原创 c++ STL - vector
mainly introduce vector's : instructions、implement、thread-safety vector容器使用较多,记录积累它instructions基本介绍#include //头文件using namespace std; //名空间vector 存储空间连续;list不连续;初始化std::vector ve
2017-05-02 14:02:31
297
原创 第三章 词典及容错式检索
《信息检索导论》美德两国作者 王斌翻译本文是本人的读书笔记本书参考:http://home.ustc.edu.cn/~zhufengx/ir/index.html [中科大的教学网站,非常具有参考价值] 3.2 通配符查询3.2.2 支持通配符查询的k-gram索引k-gram: 举个例子 castle的3-gram形式:$cas,cas,ast,stl,tle,le
2017-04-21 15:05:47
1236
原创 第二章 词项词典及倒排记录表
2.1 文档分析及编码转换2.1.1 字节序列生成2.1.2 文档单位的选择2.2 词项集合的确定2.2.1 词条化2.2.2 去除停用词2.2.3 词项归一化2.2.4 词干还原和词形归并2.3 基于跳表的倒排记录表的快速合并算法倒排记录表的合并o(m+n) ?可以否提高。带跳表指针的倒排记录表?实现?带跳表指针的倒排记录表。2.
2017-04-21 15:05:26
455
原创 第一章 布尔检索
美德两国作者 王斌翻译本文是本人的读书笔记本书参考:http://home.ustc.edu.cn/~zhufengx/ir/index.html [中科大的教学网站,非常具有参考价值] 1.1 一个信息检索的例子初识倒排索引:词典:dictionary、vacabulary、lexicon倒排记录表: postings、post list、inverted list
2017-04-21 15:04:36
343
Long Short Term Memory Networks with Python.zip
2024-02-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人