- 博客(14)
- 收藏
- 关注
原创 python连接impala获取数据并推送至企业微信机器人
python连接impala获取数据并推送至企业微信机器人安装依赖包安装依赖包pip install saslpip install thriftpip install thrift-saslpip install impyla pip install saslpip install thriftpip install thrift-saslpip install impyla 数据库连接导入基础包#导入pandas模块import pandas as pdimport n
2021-07-02 16:11:11
234
原创 MAC系统下查看和生成SSH KEY 的方法
MAC系统下查看和生成SSH KEY 的方法一、打开vim(terminal.app)查看本地是否存在SSH-Key# ls -al ~/.ssh如果vim输出的是如下内容:证明本地没有生成的SSH Key,请执行第二步。# No such file or directory如果vim输出的是如下内容: 证明本地已经存在SSH Key 文件,请执行第四步。# id_rsa id_rsa.pub二、如果没有,生成新的SSH Key#ssh-keygen -t rs
2021-04-26 11:35:44
477
原创 用Python做数据分析--七大数据类型之字典
字典字典是一种可变数据类型点典的元素存储方式是键值对的形式,键值对之间用逗号隔开键值对的形式形如:key:value最外层用{}括起来d = {key1 : value1, key2 : value2 }由于字典是键值对的形式,所以字典是无序的,自然不能切片和索引,而是通过键来取值键:一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一值:可以取任何数据类型,但键必须是...
2020-03-02 21:43:06
438
原创 SVM参数及方法
SVM的基本概念一些简单的基本概念:分隔超平面:将数据集分割开来的直线叫做分隔超平面。超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。间隔:一个点到分割面的距离,称为点相对于分割面的距离。数据集中所有的点到分割面的最小间隔的2倍,称为分类器或数据集的间隔。最大间隔:SVM分类器是要找最大的数据集间隔。支持向量:坐落在数...
2020-03-01 15:05:13
934
原创 用Python做数据分析--七大数据类型之列表
Python数据类型–列表1.列表的两种定义方式1.1 list命名s = 'python' # 目前的可迭代对象,我们就学了一个字符串L = list(s)Ltype(L)1.2 用[ ] 来定义# 列表中的内容可以是任意的数据类型list = [1234,'Hello',3.14,True,'abc']list2.列表的一些运算2.1 +号运算,使得...
2020-02-20 22:30:12
432
1
原创 Python数据清洗实战案例--拉勾招聘数据清洗
Python数据清洗实战案例–拉勾招聘数据清洗(本篇博客主要介绍个人对一份数据的清洗代码和清洗效果)主要涉及应用的库是numpy、pandas、matplotlib,话不多说,直接上代码#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactiv...
2020-02-16 19:45:05
6868
14
原创 sklearn决策树实战案例
sklearn决策树实战案例#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"import numpy as npimport pandas as pdimport matplotlib.pyplot as p...
2020-02-13 10:32:33
582
原创 sklearn实战之kmeans(聚类)
kmeans聚类算法案例本篇博客只做个人对kmeans算法代码的案例展示# 常规的导包from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactive='all'import numpy as npimport pandas as pdimport matpl...
2020-02-11 17:25:30
1588
原创 sklearn之Knn实战乳腺癌数据案例
sklearn之Knn实战乳腺癌数据案例(此处博主不细说Knn算法的基础逻辑,有兴趣可自行百度)(导入的数据是sklearn自有的乳腺癌数据,sklearn有大量内置的数据,详细可点击sklearn数据集链接)from sklearn.datasets import load_breast_cancer#导入乳腺癌数据集的类from sklearn.neighbors import K...
2020-02-11 12:14:16
6200
原创 用python做数据分析--七大数据类型之数值型
数值型数值型数据在python中是不可变数据类型,包含整数型int、浮点数型float、复数型complex整数型intPython中的整型属于int类型,,默认用十进制表示,此外,也支持二进制,八进制,十六进制表示方法。浮点数型float浮点数是属于有理数当中的,Python中的浮点数就是数学当中的小数, 在运算中,整数与浮点数运算的结果依旧是浮点数。复数型complex语法:...
2020-01-11 22:37:37
861
原创 用python做数据分析一七大数据类型之字符串
字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。在python中:字符串是不可变数据类型,也是有序数据类型字符串有2种定义方法;1.通过str()函数对字符串进行定义,例如下图:eg:2.通过直接加引号进行定义...
2020-01-09 23:01:27
821
原创 用python做数据分析一七大数据类型之布尔型
布尔型数据类型在计算机科学中,布尔数据类型又称为逻辑数据类型,是一种只有两种取值的原始类型:非零(通常是1或者-1)和零(分别等价于真和假)。在python中,布尔型数据类型是不可变数据类型,取值只有true 和 false,可以拿来做算术运算,此时等价于 1 和 0。eg:布尔型数据类型在python中表示的数据类型是bool;可用**type()**命令行来查看;eg:...
2020-01-05 13:58:44
598
原创 用python做数据分析一基础语法
Python–基础语法标准输出函数–print()输出函数什么叫输出呢,比如我们的一台电脑,是可以在屏幕上显示内容的。数字啊,图片都可以。当然呢,底层怎么去控制电脑在屏幕上显示什么我们不知道,当然也不用知道,我们只需要知道其对应的python语句就行了。python里面的输出语句是用的print()函数,关于函数的概念,我们会在后面函数部分进行详细的讲解。接下来呢就是希望在电脑上打印出 ...
2020-01-04 14:07:24
512
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人