数据分析
文章平均质量分 91
胡啦啦
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python积分scipy.integrate
python积分scipy.integratescipy.integration提供多种积分的工具,主要分为以下两类。对给出的函数公式积分:quad dblquad tplquad fixed_quad quadrature romberg对于采样数值进行积分:trapz cumtrapz simpz romb本文关注于对数值积分的trapz以及cumtrapz函数。 trapz翻译 2015-07-30 10:38:03 · 27231 阅读 · 0 评论 -
概率论入门之一
概率论系列主要是记录学习MIT 的Introduction to Probability and Statistics 的学习笔记。按章节安排来分开我的博客内容。原创 2015-07-23 09:26:29 · 586 阅读 · 0 评论 -
卡尔曼滤波器学习之一最小二乘法
近期对卡尔曼滤波器很感兴趣,想趁着假期的时候好好学习一下。选择的教材是《Fundamentals of Kalman Filtering A Practical Approach, Third Edition》。本系列按照数据的章节顺序安排内容,本文的内容是书籍的第二章,最小二乘法。最小二乘法综述我们的目标是尽可能的逼近真实信号,通过处理采集来的被噪声污染的信号。主要分为两步:原创 2016-02-03 10:53:26 · 4576 阅读 · 1 评论 -
PyLucene学习之一
简介Lucene是一款高性能的、可扩展的信息检索工具库。 信息检索是指文档搜索,文档内信息搜索或者文档相关的元数据搜索等操作。 Lucene只是搜索程序的核心索引和搜索模块搜索程序首先需要实现的功能是索引链, 分为以下几个步骤: 1. 检索原始内容 2. 根据原始内容来创建对应的文档 3. 对创建的文档进行索引Raw Content -> Acquire Content -> Build原创 2016-02-03 11:06:45 · 749 阅读 · 0 评论 -
PyLucene学习之二
文档和域文档是Lucene索引和搜索的原子单位,文档为包含一个或多个域的容器,而域则依次包含”真正的“被索引内容。索引提取文本->创建对应Document实例->通过分析将域文本处理成大量语汇单元->将语汇单元加入段结构 使用倒排索引的数据结构进行存储,能够有效的利用磁盘空间,把文档中提取出的语汇单元作为查询关键字索引步骤1 首先创建Directory对象用于存放索引store=SimpleFSD原创 2016-02-03 11:24:24 · 1429 阅读 · 0 评论 -
PyLucene学习之三
Lucene分析器及统计词频分析分析(Analysis),在Lucene中指的是将域(Field)文本转换成最基本的索引表示单元—项(Term)的过程。语汇单元化过程(tokenization),从文本中提取的文本块称为语汇单元(token)。语汇单元与它的域名结合后,就形成了项(Term)。只有由分析器产生的语汇单元才能被搜索,例外情况是索引对应的域时使用Field.Inde原创 2016-03-07 15:26:33 · 900 阅读 · 0 评论
分享