- 博客(7)
- 收藏
- 关注
原创 Mac 下安装使用 Elasticsearch+head+ik插件
在做问题回答实验的时候,用到Elasticsearch(ES),需要根据问题句中的关键词从近千片候选文档中检索出相关度最高的文档,考虑到将文档进行倒排索引,如ES搜索思路如出一辙。1、安装ES1.1、官网下载 http://www.elastic.co,点击免费使用选取适合自己的电脑的版本下载(试过特别慢,还容易停止下载)改进:搜索找到一个链接下载超级快Mac版本 Darwin1.2、解...
2020-06-08 17:15:10
658
2
原创 Python学习——pandas数据分析包
pandas重要的数据分析库,进行数据预处理和清洗。直接 pip install pandas 安装有两个主要的数据结构,Series和DataFrame。1)Series类似于一维数组,和numpy的array接近,由一组数据和数据标签组成。数据标签有索引的作用。1.1 基本操作2)DataFrameSeries是一维的数据结构,DataFrame是一个表格型的数据结构,它含有不...
2020-03-23 21:23:38
372
原创 deepdive案例实验中的所遇问题即解决
**CNdeepdive下载以及deepdive安装**百度云下载1.1 下载完成后解压,安装,运⾏install.sh,选择1安装deepdive。配置环境变量,deepdive的可执⾏⽂件⼀般安装在~/local/bin⽂件夹下。 在~/.bash_profile下添加如下内容并保存:export PATH="/root/local/bin:$PATH"在终端可以通过vi /....
2020-01-08 19:39:00
1254
1
原创 用map和reduce写str2float函数
Python内含map()/reduce()函数(映射、归约):调用格式:map(函数,参数),含义是将参数输入函数计算并输出,其中参数可以以list形式输入,一一输入函数计算,最后也需要list一下将结果输出。reduce可以理解为map的一个连续计算,讲每一次的结果作为参数带入下一次的函数计算,用以实现累加、乘等。例题:用map和reduce写一个str2float函数:def s...
2019-12-09 14:58:42
267
原创 Python中itertools.product()函数调用
此次刷题过程中接触到Python中itertools包的product函数调用。product(A,B)用于求可迭代对象A和B的笛卡尔积(后续实例说明),和嵌套的for循环等价,即product(A,B)>= ((x,y) for x in A for y in B)首先调用Python包:import itertools其product函数使用形式为:itertools.produ...
2019-11-22 11:32:11
1568
原创 串的模式匹配之KMP算法
想理一理KMP算法的学习思路,但是不会制作动图表达,暂时就用文字描述,尽量表达清晰吧。注:看多了各种解说会发现,有些算法讲解和代码实现有出入,主要是因为针对的字符串存储方式不一样,要先明确串的值从0还是1单元开始存放。模式匹配给定主串s和子串t,则在s中找到t的过程称为模式匹配,其中t称为模式。如果在s中找到等于t的子串,则匹配成功,返回t在s中首次出现的存储位置,否则匹配失败,返回-1。...
2019-11-04 19:08:36
807
原创 文本分类知识
文本分类概述 文本分类是在预定义的分类体系下,根据文本的特征(内容和属性),将给定文本与一个或者多个类别相关联的过程。最终目的是找到一个有效的映射函数,将输入的可视化文本映射为预定义分类体系下的一个或者多个类别。因此,文本分类有两个关键问题:一个是文本的表示,另一个就是分类器的设计。 **|输入文档|—> 预处理 —> **文本表示** —>...
2019-10-21 20:40:18
666
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人