
其他
文章平均质量分 93
频率coo
seu计算机
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Vim常用命令、配置及插件总结
本篇是在学习了PegasusWang的课程:玩转Vim 从放弃到爱不释手 后总结的常用操作笔记。此课程从Vim入门开始,由浅入深地讲解了Vim的基础操作、配置及常用插件,可以免去学习的许多弯路,是非常优秀的Vim课程,同时也是免费的。下面进入我们此次的正文。目录基础操作0.多模式nomal模式 -> 插入模式可视化模式常用操作1.终端命令行操作2.快速移动3.快速增删改查4.搜索替换5.多文件操作6.复制粘贴与寄存器的使用7.宏的使用 - 批量操作8.补全9.配色方案vim配置及插件1.常用配置原创 2020-06-27 20:42:54 · 516 阅读 · 0 评论 -
【信息检索】Java简易搜索引擎原理及实现(四)利用布尔模型和向量模型计算权值
本篇主要是掌握和测试布尔模型和向量模型在信息检索中应用的基本方法,计算出一些参数值,辅助搜索引擎去对最终各查询结果计算权值,排序。首先介绍几个概念:1. df(document frequency):总文档中包含每个 term 的文档数2. tf(term frequency):每个 term 在每个文档中词频数3. wf(weighting term frequency):根据 tf 计...原创 2019-05-29 18:02:30 · 1713 阅读 · 0 评论 -
【信息检索】Java简易搜索引擎原理及实现(三)B+树索引和轮排索引结构
目标:支持通配符查询在原有字典的基础上,扩展索引结构,实现支持通配符查询。建立轮排索引(Permuterm Index)和 B+树索引结构通配符查询原理比如查询语句 mon*:找出所有以mon开头的单词。如果采用树(或者B-树)结构词典,我们可以很容易的解决,只需要查询范围在mon ≤ w < moo的所有单词就ok了。但是查询语句 *mon:找出所有以mon结尾的单词就比较困难了...原创 2019-05-29 13:10:39 · 6879 阅读 · 0 评论 -
【信息检索】Java简易搜索引擎原理及实现(五)计算查询与文档相似度 + 搜索界面开发 + 服务器快速搭建
在上一篇文章中,我们已经计算出了最终数据呈现所需使用到的大部分数据,本篇我们将完成最后一步:对查询词进行预处理,并计算出查询词与相关文档的相似度,将文档按相似度由高到低排序。同时,完成搜索界面开发和服务器快速搭建的工作。1.计算查询与文档相似度(1)查询词预处理我们在第三篇文章中,构建出了轮排 加上 B+树的索引结构,本次的查询就是基于该结构开展的,因此我们需要首先获取到构建好的B+树。在...原创 2019-05-30 09:44:43 · 1514 阅读 · 0 评论 -
【信息检索】Java简易搜索引擎原理及实现(二)新增停用词表 + 查询处理
实现步骤1)新增停用词表(stop word):常指介词、代词、冠词,剔除倒排索引结构的字典中的停用词。2)基本布尔操作基本算法:2 组/6 个基本操作算法,即:2-way Merge: AND(p1,p2), OR(p1,p2), ANDNOT(p1,p2)m-way Merge: AND(<p1,p2,…,pn>), OR(<p1,p2,…,pn>), AN...原创 2019-05-15 13:26:54 · 1661 阅读 · 0 评论 -
Navicat远程连接docker容器中的mysql 报错1251 - Client does not support authentication protocol 解决办法
1、启动mysql容器,进入容器bash并进入mysql命令行。# docker start mysql02注意:此处mysql02是mysql容器的别名# docker exec -it mysql02 bash# mysql -uroot -p2、容器中登录mysql,查看mysql的版本mysql> status;3、进行授权远程连接(注意mysql 8.0跟之前的...原创 2019-05-07 14:44:36 · 1009 阅读 · 0 评论 -
【信息检索】Java简易搜索引擎原理及实现(一)建立倒排索引
什么是倒排索引?在搜索引擎中每个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合(实际上在搜索引擎索引库中,关键词也已经转换为关键词ID)。例如“文档1”经过分词,提取了20个关键词,每个关键词都会记录它在文档中的出现次数和出现位置。得到正向索引的结构如下:“文档1”的ID > 单词1:出现次数,出现位置列表;单词2:出现次数,出现位置列表;……“文档2”的ID > ...原创 2019-05-14 10:58:46 · 5627 阅读 · 4 评论 -
Oracle中ROWNUM伪列和ROWID伪列的用法与区别
做过Oracle分页的人都知道由于Oracle中没有像MySql中limit函数以及SQLServer中的top关键字等,所以只能通过伪列的方式去满足分页功能,在此,不谈分页方法,只从根本上去介绍这两个伪列的用法与原理,同样还是以scott用户的emp表为例;一、ROWNUM伪列ROWNUM伪列是Oracle首先进行查询获取到结果集之后在加上去的一个伪列,这个伪列对符合条件的结果添加一个从1开...转载 2019-04-23 11:31:29 · 264 阅读 · 0 评论 -
语法分析器实现过程(java)
语法分析器是编译原理的一个实验,本文将会详细给出实现的具体步骤,利用java进行示例讲解,源码(包含java和c++两种实现方式)可在处下载。一、实验目的设计、编写一个语法分析程序,加深对语法分析原理的理解。二、实验原理语法分析器是在词法分析之后,根据词法分析的结果和定义的语法规则判断输入的程序是否有语法错误,LL(1)分析是使用显式栈而不是递归调用来完成分析。以标准方式表示这个栈非常有用...原创 2019-01-19 10:01:07 · 23006 阅读 · 34 评论 -
词法分析器实现过程(java和c++实现)
词法分析器是编译原理的一个实验,本文将会详细给出实现的具体步骤,利用java进行示例讲解,源码(包含java和c++两种实现方式)可在处下载。一、 实验目的设计、编写一个词法分析程序,加深对词法分析原理的理解。二、 实验原理词法分析是从左向右一个字符、一个字符地读入源程序,扫描每行源程序的符号,依据词法规则,识别单词。执行词法分析的程序称为词法分析器,将给定的程序通过词法分析器,识别出一个...原创 2019-01-19 09:59:46 · 7900 阅读 · 5 评论