- 博客(83)
- 资源 (6)
- 收藏
- 关注
原创 python 中常用文本占位符
#format占位符name1="菜鸟教程"print("format占位符:网站名:{name}, 地址 {url}".format(name=name1, url="www.runoob.com"))#输出结果:format占位符:网站名:菜鸟教程, 地址 www.runoob.com# 通过字典设置参数site = {"name": "百度", "url": "www.baid...
2019-04-18 11:36:47
1964
原创 re正则表达式中?P前缀
#正则 分组'''1. re.match,re.search,re.finditer 的返回值均为m=<re.Match object; span=(0, 1), match='她'>类型, 若想获得匹配值的位置:m.span(); 若想获得匹配值的内容,m.group(); 特殊:re.finditer返回的为迭代器需要循环输出2. re.sub返回替...
2019-04-18 11:08:57
7119
原创 re正则表达式代码示例
# -*- coding: UTF-8 -*-'''1. re.match,re.search,re.finditer 的返回值均为m=<re.Match object; span=(0, 1), match='她'>类型, 若想获得匹配值的位置:m.span(); 若想获得匹配值的内容,m.group(); 特殊:re.finditer返回的为迭代器需要...
2019-04-18 11:03:16
1167
转载 pyecharts学习笔记
转载:https://blog.youkuaiyun.com/u012535605/article/details/80677791值得收藏!!
2018-12-04 21:19:29
600
转载 Python的7种性能测试工具:timeit、profile、cProfile、line_profiler、memory_profiler、PyCharm图形化性能测试工具、objgraph
1.timeit:>>> import timeit>>> def fun(): for i in range(100000): a = i * i>>> timeit.timeit('fun()', 'from __main__ import fun', number=1)0.02922706632834...
2018-11-13 16:40:39
1132
1
转载 神经网络(入门最详细)
form:http://tieba.baidu.com/p/3013551686?pid=49703036815&see_lz=1#先从回归(Regression)问题说起。我在本吧已经看到不少人提到如果想实现强AI,就必须让机器学会观察并总结规律的言论。具体地说,要让机器观察什么是圆的,什么是方的,区分各种颜色和形状,然后根据这些特征对某种事物进行分类或预测。其实这就是回归问题。...
2018-10-23 09:32:34
90177
41
转载 sklearn库的学习
网上有很多关于sklearn的学习教程,大部分都是简单的讲清楚某一个方面。其实最好的教程就是官方文档(http://scikit-learn.org/stable/),但是官方文档讲述的太过于详细,同时很多人对官方文档的理解和结构认识上都不能很好的把握。我写这篇文章的目的是想用一篇文章讲清楚整个sklearn库,我会讲清楚怎么样用这个库,而不是讲清楚每一个知识点。(授人以鱼不如授人以渔)(本文很多...
2018-10-14 17:08:59
596
1
转载 线性判别分析(LDA)基本原理及实现
前言在主成分分析(PCA)原理总结(机器学习(27)【降维】之主成分分析(PCA)详解)中对降维算法PCA做了总结。这里就对另外一种经典的降维方法线性判别分析(Linear Discriminant Analysis, 简称LDA)做一个总结。LDA在模式识别领域(比如人脸识别,舰艇识别等图形图像识别领域)中有非常广泛的应用,因此我们有必要了解下它的算法原理。在学习LDA之前,有必要将其自然语...
2018-10-14 10:51:20
91540
6
转载 PCA主成分分析python实现
Github源码:https://github.com/csuldw/MachineLearning/tree/master/PCA PCA(principle component analysis) ,主成分分析,主要是用来降低数据集的维度,然后挑选出主要的特征。原理简单,实现也简单。关于原理公式的推导,本文不会涉及,你可以参考下面的参考文献,也可以去Wikipedia,这里主要关注实现...
2018-10-13 14:32:50
31470
2
原创 统计学三大相关系数之肯德尔(kendall)相关性系数
肯德尔相关性系数,又称肯德尔秩相关系数,它也是一种秩相关系数,不过它所计算的对象是分类变量。分类变量可以理解成有类别的变量,可以分为无序的,比如性别(男、女)、血型(A、B、O、AB);有序的,比如肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)。通常需要求相关性系数的都是有序分类变量。 举个例子。比如评委对选手的评分(优、中、差等),我们想看两个(或者多个)评委对几位选手...
2018-09-08 21:40:55
53176
4
原创 统计学三大相关系数之斯皮尔曼(spearman)相关系数
斯皮尔曼相关性系数,通常也叫斯皮尔曼秩相关系数。“秩”,可以理解成就是一种顺序或者排序,那么它就是根据原始数据的排序位置进行求解,这种表征形式就没有了求皮尔森相关性系数时那些限制。下面来看一下它的计算公式: 计算过程就是:首先对两个变量(X, Y)的数据进行排序,然后记下排序以后的位置(X’, Y’),(X’, Y’)的值就称为秩次,秩次的差值就是上面公式中的di,n就是变量中数据的个数...
2018-09-08 21:35:13
88435
6
转载 LaTeX常用表格
表格内自动换行\begin{table} \Large \caption{自动换行} \begin{center} \begin{tabular}{|l|l|l|l| p{5cm}|} \hline Item & Name & Gender & Habit & Self-introduction \\ \hline 1 & ...
2018-09-08 20:44:03
60151
1
原创 统计学三大相关系数之皮尔森(pearson)相关系数
统计相关系数简介统计学的相关系数经常使用的有三种:皮尔森(pearson)相关系数和斯皮尔曼(spearman)相关系数和肯德尔(kendall)相关系数.皮尔森相关系数是衡量线性关联性的程度,p的一个几何解释是其代表两个变量的取值根据均值集中后构成的向量之间夹角的余弦.相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可...
2018-09-08 10:53:19
218782
8
原创 在LaTeX中插入数学公式
在论文写作的过程中,手动进行文字排版是一件繁琐的事情,我们可以使用LaTeX进行文字的排版以及数学公式的插入,可以很大地节省时间,专注于论文内容的写作.上篇博客介绍了LateX的安装.LaTeX公式基础这里的基础嫌烦的话可以先不看,直接看杂例,有不理解的地方在回来看这里的内容。此处知识摘取了一些简单的语法,如果需要完整的LaTeX书写数学公式的文档,见参考文献。排版方式行级元素(i...
2018-09-06 10:44:54
18685
2
原创 texlive2017+sublime text 3+ SumatraPDF 的安装与环境配置
所需要的软件: texlive2017、SumatralPDF、Sublime Text,这三个软件可以通过我的百度云中下载,链接为:https://pan.baidu.com/s/1AzUHsND1UcYWK1-PAqf0Yw,密码为: l9qb1. 安装SumatralPDF: 直接点击安装就可以,尽量不要改路径,因为后面要进行路径匹配。 2. 安装texlive2017: 在该文...
2018-09-05 14:31:28
3510
3
转载 数据标准化/归一化normalization
http://blog.youkuaiyun.com/pipisorry/article/details/52247379这里主要讲连续型特征归一化的常用方法。离散参考[数据预处理:独热编码(One-Hot Encoding)]。基础知识参考:[均值、方差与协方差矩阵 ][矩阵论:向量范数和矩阵范数 ]数据的标准化(normalization)和归一化 数据的标准化(normalization)是将数据...
2018-07-10 09:37:31
52750
3
转载 数据库范式简介
一、基本介绍 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多...
2018-06-26 15:20:58
646
转载 黑盒测试和白盒测试
1. 黑盒测试和白盒测试的直观图 从图中可以直接看出来,黑盒测试就当整个程序是个黑盒子,我们看不到它里面做了些什么事情,只能通过输入输出看是否能得到我们所需的来测试。而白盒测试可以当盒子是透明的,里面的一切我们都看的清楚,从而我们可以通过去测内部结构来测试。 2. 黑盒测试 (Black-Box Testing) 黑盒测试又称为功能测试、数据驱动测试或基于规格说明书的测试,是一种从用户观点出...
2018-05-28 16:56:53
82402
1
转载 22种代码异味
1.Duplicated Code(重复的代码)臭味行列中首当其冲的就是Duplicated Code。如果你在一个以上的地点看到相同的程序结构,那么当可肯定:设法将它们合而为一,程序会变得更好。最单纯的Duplicated Code就是[同一个class内的两个方法含有相同表达式(expression)]。这时候你需要做的就是采用Extract Method提炼出重复的代码,然后让这两个地点都调...
2018-04-20 20:13:24
4746
1
原创 CSS盒模型
1)盒模型结构想象一个盒子,它有:外边距(margin)、边框(border)、内边距(padding)、内容(content)四个属性;内容(CONTENT):盒子里装的东西;填充(PADDING) :怕盒子里装的东西(贵重的)损坏而添加的泡沫或者其它抗震的辅料;边框(BORDER) :盒子本身;至于边界(MARGIN)则说明盒子摆放的时候的不能全部堆在一起,要留一定空隙保持...
2018-04-15 16:22:30
289
转载 Flume架构以及应用介绍
在具体介绍本文内容之前,先给大家看一下Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的主角—Flume。本文将围绕Flume的架构、Flume的应用(日志采集)进行详细的介绍。 (一)Flume架构介绍 1、Flume的概念 flume是分布式的日志收集系统,它将...
2018-04-12 20:18:11
287
转载 hbase运行时ERROR:org.apache.hadoop.hbase.PleaseHoldException:Master is initializing的解决方法
hbase运行时ERROR:org.apache.hadoop.hbase.PleaseHoldException:Master is initializing的解决方法ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing at org.apache.hadoop.hbase.master.HMa...
2018-04-11 19:56:31
5254
1
转载 深入理解HBase的系统架构
原文链接:https://blog.youkuaiyun.com/Yaokai_AssultMaster/article/details/72877127#hbase%E7%9A%84hmaster初次接触HBase的读者,建议先阅读浅析HBase:为高效的可扩展大规模分布式系统而生HBase的构成物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Region server,HB...
2018-04-11 15:17:50
357
原创 CentOS7下Hive 安装过程
前提:在Linux上安装mysql,并创建远程账号https://blog.youkuaiyun.com/ruthywei/article/details/79747559版本:hive-1.2.2: https://pan.baidu.com/s/1l1l2aGNqgGV4zJHlfZhYNQmysql5.7: https://pan.baidu.com/s/1xfwETzopdJE14E4q0SSxDQ...
2018-03-30 19:07:26
719
转载 CentOS7 64位下MySQL5.7安装与配置(YUM)
安装环境:CentOS7 64位 MINI版,安装MySQL5.71、配置YUM源在MySQL官网中下载YUM源rpm安装包:http://dev.mysql.com/downloads/repo/yum/ # 下载mysql源安装包shell> wget http://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm...
2018-03-29 19:16:51
261
转载 centos7设置静态IP连接外网
ISO镜像的centos7系统刚装好,网络可能不通,所以要检查网络。 ping 外网检测# ping www.baidu.com1如果未能ping通,请依次检测ip,route# vi /etc/sysconfig/network-script/ifcfg-eth01可以先将dhcp动态分配IP改为静态IP#cgls #BOOTPROTO=dhcpBOOTPROTO=staticIPADDR...
2018-03-29 18:07:26
585
转载 软件工程五大模型
瀑布模型1.里程碑或基线驱动。2.过程逆转性很差或者说不可逆转。逆转可能会延误工期,增加成本,造成损失 1.开发阶段清晰,便于评审、审计、跟踪、管理和控制。1.不可逆或很难可逆。2.问题会积累,错误会传递发散扩大,导致成本和质量失控。1.在开发时间内需求不变化或很少变化。2.分析设计人员对此领域非常熟悉。3.低风险项目。4.用户使用环境稳定(如系统软件,工具软件)快速原型模型1.容易适应需求的变...
2018-03-19 13:12:37
35003
2
转载 通过虚拟机给Linux添加一块磁盘,挂载到相应的目录下
1.在虚拟机中编辑虚拟机设置2.添加硬盘3.运行fdisk -l命令,查看当前的挂载信息4.fdisk /dev/sdb,创建分区5.fdisk -l可以查看到当前系统有一个空的分区6.cat /proc/partitions,查看到分区情况7.mkfs -t ext3 /dev/sdb1格式化分区8.在/目录下创建一个guazai的directory,并且将刚才创建好的格式化的sdb1挂载到/g...
2018-03-15 16:04:02
3723
转载 PyCharm与GitHub配置使用总结
在使用工具来管理github之前,一直都是敲命令来管理的,有时候显得很麻烦很没有效率,所以对于总结了一下PyCharm与GitHub之间管理的小东东. 这篇博客并不详细讲git的使用技术或者原理,因为这是写给对于已经了解git想要提高效率或者懒癌发作想方便一下的童鞋,所以没有git经验的童鞋可能需要先复习一下git与github的知识.一.准备工作Ⅰ.git下载和安装要连接GitHub,...
2018-01-16 00:10:46
4479
2
转载 Hadoop生态系统
Hadoop生态系统原创 2016年05月24日 20:20:58标签:hadoop/hdfs/MapReduce/Hive/Hbase首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、Ma
2017-12-28 17:07:37
530
转载 Python爬虫
最近两天学习了一下python,并自己写了一个网络爬虫的例子。 python版本: 3.5 IDE : pycharm 5.0.4 要用到的包可以用pycharm下载: File->Default Settings->Default Project->Project Interpreter 选择python版本并点右边的加号安装想要的包 我选择的网站是中国天气网中的苏州
2017-12-23 15:19:17
554
原创 opencv行人检测
行人检测是视觉领域很热也很有用的一个主题,特别是在无人驾驶中,行人检测的重要性不言而喻。在之前进行了人脸检测之后,行人检测就显得简单多了。过程大致与人脸检测一样,都是先加载分类器,然后进行多尺度检测。就偷懒不再赘述。感兴趣的可以看人脸检测的这一篇文章:OpenCV实践之路——人脸检测(C++/Python)图片检测#include#include#include#incl
2017-12-15 18:48:16
4232
转载 OpenCV3.2.0+VS2017环境搭建
本机环境:win10 64位 OpenCV3.2.0 Visual Studio 2017 最后结果,亲测可用目录目录第一部分OpenCV320的下载第二部分配置Path系统环境变量第三部分VS2017中配置OpenCV第四部分测试效果测试代码第一部分:OpenCV3.2.0的下载OpenCV官方下载地址: http:
2017-12-15 17:35:04
3858
原创 Linux常用命令
一.常用目录命令1.显示当前目录 pwd2.改变当前目录cd2.1 从当前目录跳转/user/bin cd /user/bin2.2跳回当前home目录 cd ~2.3 跳到目前目录的上上两层 cd ../..2.4跳到目前目录的上一层 cd ..2.5跳到当前目录的子目录Music cd ./Music2
2017-12-09 17:13:34
361
转载 win7系统VMware下安装Linux的centos系统
关于如何在Win7下搭建linux学习环境,特在此分享下.原文链接http://blog.youkuaiyun.com/yulei_qq/article/details/52132536一、工具1、VMware-workstation-full-9.0.0-812388.exe 下载地址:http://pan.baidu.com/s/1bpFT0ZX2、32位的CenOS系统镜
2017-12-08 20:04:17
434
转载 程序员面试、算法研究、编程艺术、红黑树、机器学习5大系列集锦
原文地址:http://blog.youkuaiyun.com/v_JULY_v 。前言 开博4年有余,回首这4年,自己的研究兴趣从最初的编程、面试、数据结构、算法,转移到最近的数据挖掘、机器学习之上,而自己在本blog上也着实花费了巨大的时间和精力,写的东西可能也够几本书的内容了。然不管怎样,希望我能真真正正的为读者提供实实在在的价值与帮助。 下面,敬请观赏。有任何问题,欢迎随时
2017-11-24 15:45:56
489
转载 Python连接数据库
下载 MySQL for Python,最新版 MySQL-python-1.2.4b4.tar.gz1) 提前安装:mysql_config 环境否则后面 python setup.py build 会提示找不到 “EnvironmentError: mysql_config not found”,安装命令如下:sudo apt-get install libmysqlcli
2017-11-24 15:39:13
496
转载 UML交互图(顺序图和交互图)
一、概念交互图描述对象之间的动态合作关系以及合作过程中的行为次序。交互图常常用来描述一个用例的行为,显示该用例中所涉及的对象以及这些对象之间的消息传递情况,即一个用例的实现过程。交互图有顺序图和协作图两种形式。时序图中描述对象按照时间顺序的消息交换。协作图着重描述系统成分如何协同工作。时序图和协作图从不同角度表达了系统中的交互和系统行为,它们之间可以相互转化。时
2017-11-04 11:01:11
76051
3
原创 mysql安装全过程
一、概述安装mysql需要环境和图形化工具 MySQL版本:5.7.17 客户端工具:NavicatforMySQL 二、MySQL安装安装条件: 1).net framework4.0(下载地址:http://rj.baidu.com/soft/detail/15910.html?ald) 如果Windows Server 2003 在
2017-11-03 11:17:09
68831
18
转载 基于Python的flask的开发实战
原文地址http://www.cnblogs.com/PythonOrg/p/5498573.html1.初始化所有的flask程序都必须创建一个程序实例web服务器使用wsgi接口协议,把接收客户端的请求都转发给这个程序实例来进行处理。这个程序实例就是flask对象from flask import Flaskapp = Flask(__name__)#__name_
2017-10-30 09:37:58
1257
1
Microsoft Visual C++ Runtime 64 bits
2017-11-03
json应用jar包
2017-06-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人