
Python
文章平均质量分 66
lee_沐
这个作者很懒,什么都没留下…
展开
-
Jupyter 修改默认目录
结合网上的各种教程,把自己踩过的坑及步骤记录一下;1、修改配置文件在cmd运行jupyter notebook --generate-config会提示不是内部命令,需要把路径添加进环境变量中:因为是 anaconda 安装,软件被接管了,需要通过 Anaconda Prompt 运行(包含了相应的命令)运行jupyter notebook --generate-config生成配置文件,去修改配置文件去掉#注释,后面改为 jupyter notebook 要启动的...原创 2021-04-08 17:40:57 · 284 阅读 · 0 评论 -
Python 日期转换
Python日期转换原创 2021-01-18 20:37:39 · 2349 阅读 · 0 评论 -
用Pandas的resample进行上采样/下采样
除了用imlearn这个库进行上下/下采样外,用random.sample进行随机下采样的方法已在这一部分进行讲解:https://blog.youkuaiyun.com/m0_37712157/article/details/81209712#1%E3%80%81random.shuffle%E6%89%93%E4%B9%B1%E6%8E%92%E5%BA%8F%EF%BC%9A ...原创 2019-10-24 23:46:23 · 2570 阅读 · 0 评论 -
Random函数应用
目录(一)random的日常应用1、random.shuffle打乱排序:2、random.sample用来下采样:(二)常用函数1、np.random.RandomState()2、np.random.uniform()3、举例:(一)random的日常应用1、random.shuffle打乱排序: 这个随机打乱在日常是常用的一个功能,但是他...原创 2018-07-25 20:46:39 · 1225 阅读 · 0 评论 -
Python 数据类型(二):字典
目录1、创建字典2、字典查找:(一般统计标签值,用来判断如KNN出现最大频率的标签,Shannon熵统计每个标签出现的频率)3、字典取key值(用来统计有什么样的标签)4、字典根据标签来统计标签样本的个数(result_list[j] += 1#对各自标签出现的次数进行统计,常用)什么样的标签)1、创建字典当根据label来创建一字典,即标签:dataSet =...原创 2019-02-28 19:49:30 · 222 阅读 · 0 评论 -
Python 常见问题总结
1、TypeError: 'list' object cannot be interpreted as an integerfor i in range(input): output += input[i] * weight[i]报错,input为list,因range不接受list类型可以改为: for index, item in enumerate(i...原创 2019-03-29 17:54:02 · 1515 阅读 · 0 评论 -
Python 注意点
在这里对python容易忽视的知识点进行总结:1、input提示“can't multiply sequence by non-int of type 'float'”weight = input("weight(kg): ")因为input是字符串类型,string类型,需转成数值型。man_bmr = 13.7*float(weight) + 5.0*float(heig...原创 2019-03-23 21:40:39 · 112 阅读 · 0 评论 -
python的debug
1、加断点;2、右击,debug3、逐句看:1是一句一句运行,2是进入类内原创 2019-04-19 10:50:11 · 1997 阅读 · 0 评论 -
python各种文件读取
目录1、json文件2、csv3、用with来读取文件,可避免忘掉f.close()4、用pandas读取excel/csv文件1、json文件1)、JSON文件样式:数据保存在键值中;键值对间由逗号分隔;花括号用于保存键值对数据组成的对象;方括号用于保存键值对数据组成的数组(多个对象组成);【{},{}】 ...原创 2019-04-29 20:45:18 · 300 阅读 · 0 评论 -
图像处理(一)
(一)、空间分析域或变换1、平滑均值滤波 2、平滑中值滤波原理:卷积域内像素值从小到大排序,取中值。(为什么卷积核取奇数:a.为了对称,举例:一般padding时有Vaild跟Same两种Vaild: n*n f*f -> n - f + 1Same: 令图像输入大小与输...原创 2019-05-09 15:53:28 · 315 阅读 · 0 评论 -
Python数据类型(三):集合
1、是什么:无序,不重复元素序列;2、创建一个集合set:可以使用大括号{ }或者set()函数创建集合,注意:创建一个空集合必须用set()而不是{ },因为{ }是用来创建一个空字典。3、操作:主要操作:差,并,交>>>basket = {'apple', 'orange', 'apple', 'pear', 'oran...原创 2019-05-22 21:58:02 · 156 阅读 · 0 评论 -
python数据分析报错
1、OSError: Initializing from file failed当你用pandas读取文件报这种错误时,一般是因为你的文件名中带有中文,例如:res = pd.read_csv('我的文件.csv')1这种情况就会报错,只需要这样更改就可以:f = open('我的文件.csv')res = pd.read_csv(f)...原创 2019-07-18 21:50:28 · 254 阅读 · 0 评论 -
pandas的拼接问题
目录1、pd.concat2、pd.merge1、pd.concatpredict = pd.concat([df_id, predict], axis=1, ignore_index=True)concat当axis=1时是横着拼接,默认是纵向拼接的。2、pd.mergepd.merge(A, B, how='outer', left_on=a, right...原创 2019-09-26 14:15:17 · 274 阅读 · 0 评论 -
numpy.r_与numpy.c_
np.r_[a, b]是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等,类似于pandas中的concat()np.c_[a,b]是按行连接两个矩阵,就是把两矩阵左右相加,要求行数相等,类似于pandas中的merge()...原创 2018-07-25 21:11:44 · 436 阅读 · 0 评论 -
numpy.linspace 与 numpy.meshgrid
1、numpy.linspacenumpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)在指定的间隔内返回均匀间隔的数字。返回num均匀分布的样本,在[start, stop]。这个区间的端点可以任意的被排除在外。start是采样的起始点; stop是采样的终点; num是采样的点...原创 2018-07-25 22:15:39 · 983 阅读 · 1 评论 -
numpy.ravel()与 numpy.flatten()
两者所要实现的功能是一致的(将多维数组降位一维),两者的区别在于返回拷贝(copy)还是返回视图(view),numpy.flatten()返回一份拷贝,对拷贝所做的修改不会影响(reflects)原始矩阵,而numpy.ravel()返回的是视图(view,也颇有几分C/C++引用reference的意味),会影响(reflects)原始矩阵。...转载 2018-07-25 22:19:14 · 316 阅读 · 0 评论 -
Python的apply,map,lambda函数应用
在Python中如果想要对数据使用函数,可以借助apply(),applymap(),map() 来应用函数,括号里面可以是直接函数式,或者自定义函数(def)或者匿名函数(lambad) import pandas as pdimport numpy as npfrom pandas import DataFramefrom pandas import Seriesdf1= ...转载 2018-11-21 22:41:32 · 12108 阅读 · 0 评论 -
Pandas基本函数
目录一、生成数据表二、数据表信息查看三、数据表清洗四、数据预处理五、数据提取六、数据筛选七、数据汇总八、数据统计九、数据输出十、数据拼接合并一、生成数据表1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as npimport pandas as pd2、导入CSV或者xlsx文件:...转载 2018-11-21 16:29:52 · 1538 阅读 · 0 评论 -
Python 数据分析之scipy
SciPy是一组专门解决科学计算中各种标准问题域的包的集合,主要包括下面这些包:scipy.integrate:数值积分例程和微分方程求解器 scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能 scipy.optimize:函数优化器(最小化器)以及跟查找算法 scipy.signal:信号处理工具 scipy.sparse:稀疏矩阵和系数线性...转载 2018-09-02 12:13:56 · 578 阅读 · 0 评论 -
Python matplotlib函数
1、Matplotlib提供了以下功能:cla() # Clear axisclf() # Clear figureclose() # Close a figure window2、绘制树import matplotlib.pyplot as plt#定义文本框与箭头格式decisionNode = dict(boxstyle="sawtooth", fc="0...原创 2018-08-27 10:46:59 · 2932 阅读 · 0 评论 -
Python 字典操作及sort与sorted函数
字典显示:1)、tang.keys() #显示键值2)、tang.values() #显示值3)、tang.items() #显示键值:值;返回列表 tang.iteritems() #显示键值:值;返回迭代器 一、字典显示,items()与iteritems()区别。字典的items()方法和iteritems()方法,是python字典的内建...转载 2018-08-26 11:44:23 · 13600 阅读 · 1 评论 -
Python编程技巧(一):列表推导(List Comprehension)
一、是什么: 列表生成式(listcomprehension)是一种简化代码的优美方法。根据python文档,“列表生成式提供了一种创建列表的简洁方法。”二、举例: 1 平方列表如果你想创建一个包含1到10的平方的列表,你可以这样做: 1 2 3 squares = [] for x in r...原创 2018-08-22 10:47:16 · 730 阅读 · 0 评论 -
Python 数据类型(一):列表
列表:1、什么是列表:由[ ]创建;可放任意类型;无长度限制; tang = []2、操作:1)、长度:len()举例: a = [[1,1,'yes'], [1,1,'yes'], [1,0,'no'], [0,1,'no'], [0,1,'no']] len(a) ...原创 2018-08-22 09:28:43 · 769 阅读 · 0 评论 -
%matplotlib inline 是什么意思
使用%matplotlib命令可以将matplotlib的图表直接嵌入到Notebook之中,或者使用指定的界面库显示图表,它有一个参数指定matplotlib图表的显示方式。inline表示将图表嵌入到Notebook中。Python提供了许多魔法命令,使得在IPython环境中的操作更加得心应手。魔法命令都以%或者%%开头,以%开头的成为行命令,%%开头的称为单元命令。行命令只对命令所在的...转载 2018-08-20 16:07:29 · 90012 阅读 · 2 评论 -
Numpy 数组的创建
1、numpy.arange(相当于matlab中的 a = 0:14),建立的是列向量>>> print np.arange(15)[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]>>> print type(np.arange(15))<type 'numpy.ndarray'>>&g...原创 2018-08-05 21:09:17 · 903 阅读 · 0 评论 -
Python 产生随机数
在数据分析中,数据的获取是第一步,numpy.random 模块提供了非常全的自动产生数据API,是学习数据分析的第一步。总体来说,numpy.random模块分为四个部分,对应四种功能:1. 简单随机数: 产生简单的随机数据,可以是任何维度2. 排列:将所给对象随机排列3. 分布:产生指定分布的数据,如高斯分布等4. 生成器:种随机数种子,根据同一种子产生的随机数是相同的以下是...转载 2018-08-05 16:28:52 · 31205 阅读 · 0 评论 -
数据读取操作(Python)
pandas.read_excel()此函数与pandas.read_csv()的区别在于pandas.read_excel()可读取文档里既含字符类型又含数字类型。1、常用参数:sheet_name;header;names1)、sheet_name2)、header3)、nameAPI: http://pandas.pydata.org/pandas-d...原创 2018-08-01 11:14:15 · 784 阅读 · 0 评论 -
Python 包的相对导入与绝对导入
1、格式:绝对导入的格式为 import A.B 或 from A import B,相对导入格式为 from .A import B 或 from ..X import Y,. 代表当前模块,.. 代表上层模块,... 代表上上层模块,依次类推。2、相对导入对于包的维护优势相对导入可以避免硬编码带来的包维护问题,例如我们改了某一层包的名称,那么其它模块对于其子包的所有绝对导入就不能用...转载 2018-07-31 09:28:29 · 523 阅读 · 0 评论 -
Seaborn(2)可视化数据集的分布
可视化数据集的分布单元分布 双元分布 可视化数据集中的pairwise relationship1. 单元分布 sns.distplot() 直方图(hist)+内核密度函数(kde) 在seaborn中最简便查看单元分布的函数是distplot().该函数默认绘制直方图并拟合内核密度估计。通过调整参数可以分别绘制直方图,拟合内核密度图,地毯图等。x = np.rando...转载 2018-11-29 22:38:31 · 960 阅读 · 0 评论