- 博客(25)
- 收藏
- 关注
转载 ElasticSearch语法
Filter DSL term 过滤term主要用于精确匹配哪些值,比如数字,日期,布尔值或 not_analyzed 的字符串(未经分析的文本数据类型): { "term": { "age": 26 }} { "term": { "date": "2014-09-01" }} { "term": { "public": t
2017-10-19 09:22:42
462
原创 spark关联规则挖掘
使用spark进行关联规则挖掘:1 首先数据全部处理为分类变量2 使用spark mllib 中的FPGrowth挖掘关联规则存在问题1 数据需要处理成sparse格式,也有人称basket格式2 版本原因会报错:java.lang.IllegalArgumentException: Can not set final scala.collection.mutab
2017-10-18 16:37:30
933
转载 ElasticSearch基础
一、关于搜索引擎 各位知道,搜索程序一般由索引链及搜索组件组成。 索引链功能的实现需要按照几个独立的步骤依次完成:检索原始内容、根据原始内容来创建对应的文档、对创建的文档进行索引。 搜索组件用于接收用户的查询请求并返回相应结果,一般由用户接口、构建可编程查询语句的方法、查询语句执行引擎及结果展示组件组成。 如图所示。 著名的开源程
2017-10-18 16:24:53
1800
1
转载 数据科学传送门
数据科学https://www.leiphone.com/news/201703/ilg36LBRAZEpITHA.html如何成为一名数据科学家http://www.jianshu.com/p/1ecd953d5d98
2017-07-18 12:28:51
593
原创 jupyter notebook python2 python3 kernel共存
在windows系统下配置了anaconda2 和anaconda3 共存,但是想在jupyter notebook中能够启用py2 和py3网上有的攻略说activate python2 然后启动jupyter notebook,没有效果需要添加kernelactivate python27ipython kernelspec install-self启动jupyter
2017-05-06 18:44:45
5098
转载 ipython notebook for ubuntu 14.04
1. 环境操作系统:ubuntu 14.04 / 2. 操作步骤a) 安装pip工具终端输入以下命令:sudo apt-get install python-pipb) 安装ipython终端输入以下命令:sudo apt-get install ipythonc) 安装ipython[notebook]
2017-05-05 17:14:33
585
原创 虚拟机SAPRK,not found sc,可能是强制关掉spark造成的
1.查看ifconfig,看ip地址是否和你在/etc/hosts中的ip地址一致,如果不一致,修改/etc/hosts中的ip地址。2.查看spark-env.sh中配置的SPARK_MASTER_IP是否和ifconfig中的ip地址一致,如果不一致,请修改SPARK_MASTER_IP。3 重启虚拟机或者重新启动spark
2017-05-03 17:44:00
1485
原创 ubuntu 14.04 vi编辑方向键会变成ABCD
先卸载vim-tiny:$ sudo apt-get remove vim-common再安装vim full:$ sudo apt-get install vim
2017-05-03 17:41:24
446
原创 ubuntu java1.7 升级 java 1.8
1 下载对应版本的安装包2 解压后复制到 usr/lib/jvm/目录下tar -xzvf jdk-8u131-linux-i586.gzsudo mv jdk1.8.0_131 /usr/lib/jvm/jdk1.8.0_1313 更新jdksudo update-alternatives --install /usr/bin/java java /usr/l
2017-05-02 10:54:50
2139
转载 Ubuntu下怎么安装jdk
Ubuntu下怎么安装jdk方法/步骤1ubuntu使用的是openjdk,我门要首先找到适合的jdk版本。2在终端输入命令:apt-cache search openjdk3从搜索的列表里找到我们需要安装的jdk版本4
2017-05-02 09:58:59
352
转载 Anaconda使用总结
Anaconda使用总结2016.7.19 PeterYuan序Python易用,但用好却不易,其中比较头疼的就是包管理和Python不同版本的问题,特别是当你使用Windows的时候。为了解决这些问题,有不少发行版的Python,比如WinPython、Anaconda等,这些发行版将python和许多常用的package打包,方便pythoners直接使用,此外,还有virtu
2016-12-14 10:51:13
993
转载 python数据分析入门学习笔记
python数据分析入门学习笔记儿学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家。博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~前言:各种和数据分析相关python库的介绍(前言1~4摘抄自《利用python进行数据分析》)1.Numpy: Numpy是python科学计算的基础
2016-10-11 17:23:54
3138
转载 逻辑回归
转自http://www.cnblogs.com/dreamvibe/p/4248769.html逻辑回归一、逻辑回归的认识逻辑回归是一个用来解决二分类的简便方法。先来看看逻辑回归解决二分类的基本思想。之前写了线性回归,现在写逻辑回归~都叫回归,有什么不同呢?首先,从机器学习的角度说一下。机器学习中,有两个问题是比较相似的,即预测和分类。通常将模型的输出是有
2016-08-29 17:49:36
761
转载 Natural Language Processing
Natural Language ProcessingLibraries for working with human languages.NLTK - A leading platform for building Python programs to work with human language data.Pattern - A web mining module for
2016-08-18 14:21:03
1034
转载 TensorFlow的深度学习进行图像修复
博文链接:http://bamos.github.io/2016/08/09/deep-completion/论文链接:http://arxiv.org/abs/1607.07539原文链接:http://weibo.com/5501429448/E2TikbST2?type=comment#_rnd1470830717611
2016-08-11 14:28:24
2795
转载 比较好用的SecureCRT配色方案
from http://my.oschina.net/iuranus/blog/279513摘要比较好用的一种SecureCRT配色方案。设置方式参看:SecureCRT 绝佳配色方案, 保护你的眼睛具体的颜色值做了改动(算是改进吧,比较符合自己的趣味,怎么看都有点小清新- -),效果如下:色值如下:从左至右,从上至下值分别为(RGB元组):1:
2016-08-10 14:44:45
1484
1
原创 tensorflow example
tensorflow example 传送门https://github.com/aymericdamien/TensorFlow-Examples
2016-08-06 16:37:57
786
原创 在Linux CentOS 6.6上安装Python 2.7.9
在Linux CentOS 6.6上安装Python 2.7.9CentOS 6.6自带的是Python 2.6.6,而编译llvm需要Python 2.7以上。checking for python... /usr/bin/pythonchecking for python >= 2.7... not foundconfigure: error: found py
2016-08-06 14:33:45
542
转载 使用sklearn进行集成学习(二)
目录1 Random Forest和Gradient Tree Boosting参数详解2 如何调参? 2.1 调参的目标:偏差和方差的协调 2.2 参数对整体模型性能的影响 2.3 一个朴实的方案:贪心的坐标下降法 2.3.1 Random Forest调参案例:Digit Recognizer 2.3.1.1 调整过程影响类参数
2016-08-03 21:45:28
1363
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人