- 博客(239)
- 资源 (32)
- 收藏
- 关注
原创 统计机器学习-4-三维绘图
用python绘制三维函数图像:Z=X2+Y2Z = X^2 + Y^2Z=X2+Y2import matplotlib as mplfrom mpl_toolkits.mplot3d import Axes3Dimport numpy as npimport matplotlib.pyplot as pltfig = plt.figure()ax = fig.gca(proje...
2019-10-19 20:15:24
553
原创 统计机器学习-3-numpy100题
numpy 100道练习题这100道练习题从numpy的mailing list、Stack Overflow和numpy官方文档收集而来,其目的是提供一个快速入门的参考文档为numpy学习者,也可以用作教学练习题。如果你发现错误或者有更好的解法,欢迎在github上提交issue: https://github.com/rougier/numpy-1001.如何导入numpy包?impo...
2019-05-02 00:38:26
1982
6
原创 统计机器学习-2-矩阵范数与导数
矩阵基础矩阵的知识是从行列式而来,矩阵和行列式的区别在于矩阵是一张表,行列式是一个数:(A)[993426719] \begin{bmatrix} 9 & 9 & 3\\ 4 & 2 & 6 \\ 7 & 1 & 9 \end{bmatrix} \tag{A}⎣⎡947...
2019-05-01 21:47:20
1858
原创 统计机器学习-1-统计机器学习基础
一、统计机器学习的研究内容网络 算法 机器 优化 概率 统计数据 矩阵 信息 模型 推理获知识 靠学习We are drowning in information and starving for knowledge. -John NaisbittData -> Model -> Knowledge二、机器学习与应用统计学对比MLSTATISTICS...
2019-04-28 00:08:54
872
原创 MySQL根据字段名查找数据库名和表名
SELECT DISTINCT TABLE_SCHEMA,TABLE_NAME FROM information_schema.COLUMNS WHERE COLUMN_NAME = '要查找的字段名称'
2019-03-10 16:12:21
2622
原创 Python 风格规范(Google)
本项目并非 Google 官方项目, 而是由国内程序员凭热情创建和维护。如果你关注的是 Google 官方英文版, 请移步 Google Style Guide以下代码中 Yes 表示推荐,No 表示不推荐。分号不要在行尾加分号, 也不要用分号将两条命令放在同一行。行长度每行不超过80个字符以下情况除外:长的导入模块语句注释里的URL不要使用反斜杠连接行。Python会将...
2019-02-28 11:05:17
570
原创 机器学习之KNN鸢尾花分类
KNN简介邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一...
2019-02-24 16:34:28
1351
原创 python处理搜狗新闻数据_140万条
一、文件处理gzip -d SogouCA.tar.gztar -xvf SogouCA.tarcat *.txt > SogouCA.txtcat SogouCA.txt | iconv -f gbk -t utf-8 -c > SougouCA_UTF8.txt二、数据清理与入库建表:CREATE TABLE `news` ( `id` int(10) NOT ...
2019-02-13 15:35:01
2084
原创 canal配置
一、MySQL密码策略修改set global validate_password_policy=0;set global validate_password_length=1;二、安装canal serverCREATE USER canal IDENTIFIED BY 'canal'; GRANT SELECT, SHOW VIEW, REPLICATION SLAVE, REP...
2019-01-05 15:08:00
705
原创 MySQL主从(MS)、主主(MM)复制
一、安装MySQL 5.7如果安装过mysql,删除停掉mysql进程:pkill -9 mysqld删除mysql:rpm -qa|grep -i mysqlyum -y removemysql-community-client-5.6.38-2.el7.x86_64依次卸载 直到没有yum安装cd /usr/local/src/wget http://rep...
2018-12-23 23:12:02
1288
1
原创 zookeeper概念、应用场景、数据组织、集群搭建、客户端操作、Java客户端、curator
一、zookeeper简介1.1 zookeeper简介Apache的很多项目以动物来命令,比如Hadoop(大象)、Hive(小蜜蜂)、Pig(猪猪),这些项目都是hadoop生态系统的成员。Hadoop生态系统是为了解决大数据存储、大数据计算和大数据数据分析的,解决大数据问题的核心思想是分布式,而分布式系统的开发中一个关键问题是如何解决数据在不同系统之间的一致性问题。zookeeper顾名...
2018-11-23 22:03:54
1491
1
原创 mac安装fabric找不到fabric.api
先卸载再安装低版本:pip uninstall fabricpip install fabric==1.14.0
2018-10-16 16:29:22
1845
原创 Lucene索引合并
@Test public void mergeIndex() throws IOException { Analyzer analyzer=new HanLPAnalyzer(); IndexWriterConfig icw = new IndexWriterConfig(analyzer); icw.setOpenMode(Inde...
2018-08-24 15:07:35
859
原创 Elasticsearch电商搜索分词效果调优
分词是搜索中非常核心的一步,下面通过一个案例介绍在没有专业分词系统的情况下,如何做分词性能的调优。
2018-08-06 00:17:59
5437
原创 javax.jms.JMSException: Could not connect to broker URL: tcp://localhost:61616
spring.activemq.broker-url=tcp://localhost:61616改为:spring.activemq.broker-url=tcp://0.0.0.0:61616
2018-07-19 20:50:49
5828
原创 spring boot获取resource目录下文件
Resource resource = new ClassPathResource("resource目录下的文件路径"); File file = resource.getFile();例如:resource目录下: a/1.txt获取1.txt文件的方法: Resource resource = new ClassPathResource("a/1....
2018-07-14 23:38:23
31249
3
原创 spring boot 工程创建、常用注解、控制器、模板引擎使用
最近要狂补Spring boot了,总结一下相关知识点。一、工程创建与运行访问:http://start.spring.io/按如图所示,配置好项目信息,生成project。 Dependencies里面选择项目依赖,一般初始化工程的时候加上web即可。解压下载好的代码,用IDEA打开。 新建一个Hello.java的Controller类:package co...
2018-07-02 14:01:35
681
原创 Elasticsearch 同义词配置
什么是同义词就不用说了,直接说怎么实现。测试环境:ES 5.5.1 一、同义词词库准备一个同义词词库,每行一个同义词词组,例子syno.dic:西红柿,番茄,tomato马铃薯,土豆二、配置分析器DELETE synoPUT syno{ "settings": { "analysis": { "filter": { &
2018-06-27 10:29:56
3808
2
原创 StringUtils中的常用方法
StringUtils.hasText(str)如果字符串里面的值为null, “”, ” “,那么返回值为false;否则为truecontainsWhitespace(str)是否包含空格
2018-06-27 09:47:19
514
原创 解决ES-Hadoop打包报错“Mkdirs failed to create /var/folders...”问题
一、报错问题在mac下运行ES-Hadoop项目,报错如下:Bee:eshadoop bee$ hadoop jar target/eshadoop-1.0-SNAPSHOT-jar-with-dependencies.jar /work/blog.jsonException in thread "main" java.io.IOException: Mkdirs failed to c...
2018-05-21 13:08:43
1990
原创 Elasticsearch Java API(十三)--Java API获取分词结果
需求Java API获取Elasticsearch的分词结果.版本Elasticsearch 5.4 已安装ik分词器测试先创建一个索引:curl -XPUT localhost:9200/bbb返回结果:{ "acknowledged":true, "shards_acknowledged":true}好了,现在es里面有一个b...
2018-05-02 20:18:31
6279
3
原创 Elasticsearch Java API(十二)--搜索时指定分析器
一、问题 今天群里一个同学提了一个问题,如何在搜索时指定分析器,实现自由切换。二、分析我们知道,分析器是写在mapping里面的,通过配置analyzer来指定的。如果没有额外的配置,analyzer中指定的分析器,既是索引期的分析器,又是搜索期的分析器。单独指定搜索期的分析器可以用search_analyzer覆盖。三、解决在搜索时指定分析器,只需要在构造Query的时...
2018-05-02 19:46:29
2309
原创 SHELL编程(三) sed和awk的用法
1.sed1.1 sed的作用1.2 显示文件的第n行1.3 显示文件前n行1.3 显示前n行以外的内容1.4 显示文件第n后和之后的m行1.5 在第n行前面插入内容1.6 替换文件的第n行1.7 在文件的最后插入行1.8 复制粘贴1.9 删除空行1.10 查找并保存1.11 文件重定向2.awk2.1 简介2.2 自定义显示年月日2.3 awk文件操作...
2018-05-01 19:53:09
995
原创 SHELL编程(二) 按天备份mysql数据库脚本
#!/bin/bash########################## mysql auto backup#########################BACKUPDIR=/opt/bee/shtest/data/` date +%Y-%m-%d ` #数据库备份路径MYSQLDB=nowcoder ...
2018-04-29 23:23:39
507
原创 SHELL编程(一) 基础语法
一、基本语法1.1 入门例子1.2 shell变量1.2.1 永久变量1.2.2 临时变量1.2.3单引号和双引号1.2.4 变量管理1.2.5 位置变量和特殊变量1.3 read命令1.4 expr命令1.5 变量测试语句1.6 if判断语句1.7 case流程控制1.8 双小括号的用法1.9 循环语句嵌套1.10 break和continue1.1...
2018-04-29 19:54:26
489
原创 字典序算法与全排列问题(时间复杂度O(N))
给定一个不重复数组组成的数组,比如{1,2,3},按照从小到大的顺序组成的全排列整数有6个:123、132、213、231、312、321,这6个数字都是换位数,即组成的数字一样,只是位置不一样而已。一、最近最大换位数首先解决第一个问题,如何找到给定整数,离它最近且比它大的换位数。比如:12534的最近最大换位数是12543,13254的最近最大换位数是13425。为了和原数接近,...
2018-04-10 13:07:35
7052
原创 解决CentOS默认JDK无法替换问题
在Centos上安装jdk,在/etc/profile中设置好了JAVA_HOME,source之后依然不生效,java -version命令测试一直提示JDK版本为1.5:[root@Hadoop-DN-08]# java -versionjava version "1.5.0"gij (GNU libgcj) version 4.4.7 20120313 (Red Hat 4.4....
2018-04-09 12:39:52
1519
原创 elasticsarch 6安装遇到的问题集锦
1.不能以root用户运行org.elasticsearch.bootstrap.StartupException: java.lang.RuntimeException: can not run elasticsearch as root新建用户,非root运气。2.JDK不能低于1.83.[1]: max virtual memory areas vm.max_map_...
2018-04-09 12:32:35
821
原创 Elasticsearch和Kibana安装X-Pack
一、Elasticsearch安装X-PACK安装命令:bin/elasticsearch-plugin install x-pack默认用户名:elastic 默认密码:changeme访问9200端口需要输入用户名和密码:二、Kibana安装X-packbin/kibana-plugin install x-pack登录Kibana的时候输入用...
2018-03-29 13:39:20
4053
1
原创 ELK日志处理之metricbeat服务器性能监控
一、需求监控服务器的CPU使用率、内存使用情况、线程数等机器物理性能,类似于Windows的资源管理器功能。二、解决方案使用Elastic公司的Metricbeat,Metricbeat和Filebeat一样,是一个轻量级的采集器,不但可以监控服务器的性能指标,还可以监控运行在服务区之上的应用信息(eg.Apache、MongoDB、MySQL、Ngnix、PostgreSQL、R...
2018-02-01 21:31:10
14703
2
原创 【死磕算法系列】两个有序数组的公共部分
【死磕算法】 两个有序数组的公共元素问题提出 给定有序数组A和有序数组B,数组长度分别为M和N,求数组的公共元素。例如: A = {0, 1, 4, 9, 10} B = {1, 4, 8, 9, 11} A和B的公共元素为1,4,9一、最容易解法依次从数组A中取数据,挨个到B中去遍历。如果B中有,说明是公共元素,输出;否则就是没有。...
2018-01-29 14:38:57
2606
原创 Elasticsearch 6 新特性与重要变更解读
2017年11月14日,Elastic Stack 6.0正式亮相,这篇文章总结Elasticsearch 6.0版本的一些新的特性和重要改变,根据官网文档,变更部分包括下列部分,下面一一说明。Aggregations changes Cat API changes Clients changes Cluster changes Document API changes Indice...
2018-01-25 13:52:03
15778
3
原创 mac(Linux)安装配置kafka环境
mac(Linux)安装配置kafka环境导读 本文介绍如何在Mac系统上安装和配置kafka环境,也适用于Linux系统,强烈不建议在Windows环境下尝试本博客。 软件环境说明如下: 操作系统:OS X 10.10.3 JDK版本: 1.8 zookeeper版本:zookeeper-3.4.9 kafka版本:1.0.0 一、
2018-01-14 01:42:26
2292
1
原创 Intellij Idea设置代码的注释信息
导读:在Java开发中给每个类加上作者信息、创建时间等版本信息,对于后期的维护、别人阅读代码都很有益处。Intellij Idea中设置类的注释信息的方法如下。Intellij Idea ->Preference ->Editor->File and code Templates->Includes ->File Header:在FileHeader中声明注释信息,具体内容可以定
2018-01-07 15:00:23
2286
原创 解读Elasticsearch分析器中的重要术语
导读:Elasticsearch分析器中的Analysis、Analyzer、Tokenizer、Token Filter、Character Filter,你知道是什么含义吗?一、什么是Analysis ?Analysis翻译为分析器,其功能是把文本切分成词项(词项是倒排索引中的基本单位)。二、什么是Analyzer?分析器的功能主要是通过分词器(Analyzer)来实
2018-01-07 02:15:08
1513
原创 【死磕算法系列】平衡二叉树的判定
平衡二叉树的一个重要性质:左子树和右子树的树高的差的绝对值小于等于1。 Java实现: public int treeDepth(TreeNode node) { if (node == null) { return 0; } int leftDepth = treeDepth(node.left); ...
2017-12-25 01:07:46
420
原创 【死磕算法系列】二叉树的层次遍历
a / \ b c / \ / \ d e f g / h \ i对于上面的二叉树,层次遍历结果为:ab cd e f ghi...
2017-12-24 16:53:14
466
原创 【死磕算法系列】二叉树的深度
一、递归实现public void treeDepth(TreeNode node){ if(node == null){ return 0; } int leftDepth=treeDepth(node.left); int rightDepth=treeDepth(node.right); return leftDepth>rightDep...
2017-12-24 13:36:23
479
原创 【死磕算法系列】二叉树的镜像
一、二叉树镜像二叉树的镜像就是把每个节点的左子树和右字数互换位置,例如源二叉树为: 8 / \ 6 10 / \ / \ 5 7 9 11其镜像二叉树为: 8 / \ 10 6 /...
2017-12-24 02:17:48
405
原创 【死磕算法系列】二叉树的前序中序后序的递归和非递归遍历
一、二叉树的数据结构1.1 定义树节点public class TreeNode { String val; TreeNode left; TreeNode right; public TreeNode(String val) { this.val = val; } public String getVal() {...
2017-12-24 01:22:54
447
Elasticsearch 5.1.1 java api maven工程 源码下载
2017-04-18
druid-1.0.16.jar
2016-10-29
集体智慧编程中文版
2015-11-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人