
python
向阳的野草
这个作者很懒,什么都没留下…
展开
-
python3使用matplotlib绘制散点图,并标注图例,轴
python3使用matplotlib绘制散点图,并标注图例,轴代码效果图:代码from matplotlib import pyplot as pltfrom matplotlib import font_manager# 使得中文可以显示出来my_font = font_manager.FontProperties(fname="/usr/share/fonts/truetype/...原创 2018-12-15 18:53:19 · 20386 阅读 · 0 评论 -
机器学习 决策树 随机森林算法
决策树概念有关决策树的理论参考:https://blog.youkuaiyun.com/gunhunti4524/article/details/81506012不再赘述要注意的是,sklearn默认使用的是 基尼系数同是介绍一个数据集网站http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets示例代码# 决策树APIfrom sklear...原创 2018-12-23 10:53:37 · 250 阅读 · 0 评论 -
python3 numpy详解
基础操作import numpy as np# np创建数组a = np.array([1,2,3])print(a)print(type(a))a2 = np.array(range(10))print(a2)print(type(a2))# numpy特有的方法 生成一个数组类型 与array(range())一致a3 = np.arange(0,12,2)print...原创 2018-12-17 22:53:21 · 678 阅读 · 0 评论 -
机器学习 使用交叉验证为KNN调优参数
# KNN的距离算法 使用的是欧氏距离 即算空间中点的距离 (根号下的 差的平方和)# 要注意的是knn算法是需要做 标准化处理的# API:(参数:n_neighbors=5)默认使用5个邻居 邻居的数量对算法的结果有影响 数量越大则要判断的点越多from sklearn.neighbors import KNeighborsClassifierimport pandas as p...原创 2018-12-23 00:07:07 · 1726 阅读 · 0 评论 -
机器学习算法 朴素贝叶斯
一切尽在代码中python自己下载数据集 是真的慢…from sklearn.datasets import fetch_20newsgroupsfrom sklearn.model_selection import train_test_splitfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklear...原创 2018-12-22 22:55:38 · 172 阅读 · 0 评论 -
python3使用sklearn自己的数据
即使用load_ 加载安装sklearn时已经装好的数据集# 导入花的数据集from sklearn.datasets import load_iris# 导入模型划分(划分训练集 测试集)from sklearn.model_selection import train_test_split'''sklearn.datasets加载获取流行数据集datasets.load_*()...原创 2018-12-22 22:17:56 · 3777 阅读 · 1 评论 -
机器学习算法 -- KNN
概念KNN属于分类算法.如果一个样本在特征空间中的k个最相似(即特征空间最相近)的样本大多数属于某一个类别,则该样本也属于这个类别.示例代码示例代码使用的是kaggle上的facebook数据集,根据已有的数据,预测新的人员入酒店id# KNN的距离算法 使用的是欧氏距离 即算空间中点的距离 (根号下的 差的平方和)# 要注意的是knn算法是需要做 标准化处理的# API:(参数:...原创 2018-12-22 16:27:10 · 135 阅读 · 0 评论 -
机器学习 --2 特征预处理 之 数据将维
特征选择概念特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。方差过滤式# 按照方差过滤from sklearn.feature_selection import VarianceThreshold# 特征选择第一种方式:过滤式# 方差特征选...原创 2018-12-21 21:11:32 · 211 阅读 · 0 评论 -
机器学习 --2 特征预处理 之 数据标准化
归一化:API位置sklearn.preprocessing归一化:特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间注意也可以通过指定MinMaxScalar 里边的feature_range 来指定缩放的范围示例代码from sklearn.preprocessing import MinMaxScaler# 归一化# 最小最大缩放(MinMaxS...原创 2018-12-21 20:16:39 · 1057 阅读 · 0 评论 -
Tensorflow基础
简介安装tensorflow 这玩意是google的 which means we need VPN!安装tensorflow的教程网上一把把的,具体的就不说了。只是简单说一下,分类,机器学习,深度学习这些火起来的一部分原因就是因为近年来计算能力的大幅提高,而这其中,和GPU分不开,要安装GPU版本什么的百度啦。在conda里边选一个环境pip安装一下就行了,类似于一个package(个人...原创 2018-12-26 22:37:11 · 148 阅读 · 0 评论 -
python3使用matplotlib绘制直方图
频数分布直方图代码from matplotlib import pyplot as pltfrom matplotlib import font_managera = [131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130,...原创 2018-12-15 20:39:50 · 4243 阅读 · 0 评论 -
机器学习 -- 1 特征抽取
1 概述使用Scikit-learn提供的特征抽取API进行特征的抽取字典特征抽取from sklearn.feature_extraction import DictVectorizer# 1 实例化DictVectorizerdef dicvec(): # 实例化: # 默认sparse为True打印出sparse矩阵类型用以节约内存 ''' ...原创 2018-12-20 22:16:28 · 178 阅读 · 0 评论 -
python3使用matplotlib绘制条形图
绘制竖状条形图代码from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname="/usr/share/fonts/truetype/arphic/ukai.ttc")a = ["战狼2", "速度与激情8", "...原创 2018-12-15 19:43:54 · 3036 阅读 · 0 评论 -
机器学习算法 线性回归 正规式 梯度下降 岭回归
# 波士顿房价数据集from sklearn.datasets import fetch_california_housing, load_boston# 线性回归 (正规方程 梯度下降)from sklearn.linear_model import LinearRegression, SGDRegressorfrom sklearn.model_selection import tra...原创 2018-12-23 22:56:52 · 492 阅读 · 0 评论