
python
bigdata_zx
这个作者很懒,什么都没留下…
展开
-
python程序结构
顺承结构逻辑行就是一个完整的代码物理行就是在解析器中输入的行数多个逻辑行过短时,可以转化为一个物理行x = 1;y = 2;z = 3print(x, y, z)x = 1;y = 2;z = 3print(x, y, z)分支结构score = int(input(‘please input your score:’))if score < 60:print(‘成...原创 2018-11-06 19:02:56 · 160 阅读 · 0 评论 -
Pandas知识点梳理(一)
一、pandas简介Pandas 是基于NumPy 的一个数据分析包,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。Pandas的数据结构(Series及DataFrame)Series:一维数组,与Numpy中的一维array类似。二者与Python基...原创 2019-02-12 14:35:28 · 458 阅读 · 0 评论 -
datetime知识点梳理
datetime模块中包含以下类:类名 功能说明date 日期对象,常用的属性有year, month, daytime 时间对象datetime 日期时间对象,常用的属性有hour, minute, second, microseconddatetime_CAPI 日期时间对象C语言接口timedelta 时间间隔,即两个时间点之间的长度tzinfo 时区信息对象一、date类...原创 2019-02-12 11:02:44 · 439 阅读 · 0 评论 -
Numpy知识点梳理(一)
NumPy是使用Python进行科学计算的基础包。它的核心内容:一个强大的N维数组对象,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储...原创 2019-01-30 17:19:37 · 255 阅读 · 0 评论 -
python面向对象
Python是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的。几个概念定义:类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。方法:类中定义的函数。类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。数据成员:类变量或者实例变量用于处理...原创 2019-01-27 11:49:07 · 207 阅读 · 0 评论 -
Numpy知识点梳理(二)
接上一篇博客,接下来介绍一下数组的操作二、数组基本操作创建数组:1、直接创建np.arraya = np.array([[1,2,3],[4,5,6]])2、将现有的数据类型转换成数组 np.asarrayx = [1,2,3]a = np.asarray(x)切片、索引a = np.array([[1,2,3],[3,4,5],[4,5,6]])print (a[2,1])...原创 2019-01-31 20:48:04 · 1352 阅读 · 0 评论 -
python数据结构
今天来介绍两种最常用的python数据结构列表:1、基础方法list.append(x) 把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]。list.extend(L) 通过添加指定列表的所有元素来扩充列表,相当于 a[len(a):] = L。list.insert(i, x) 在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.inse...原创 2019-01-26 10:34:28 · 229 阅读 · 0 评论 -
python函数常见问题总结
常见的几个python函数问题总结1、传递参数对象类型首先要看参数的类型,有可变类型和不可变类型。比如列表就是可变类型,元组就是不可变类型。当参数为不可变类型时def ChangeInt( b ):b = 10print(b) #10b = 2ChangeInt(b)print( b ) #2当参数为可变类型时def ChangeInt( b ):b[0]=...原创 2019-01-25 17:36:02 · 642 阅读 · 0 评论 -
python迭代器
迭代器听起来十分神秘,其实他的实质就是一个循环遍历。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。(python的基本数据类型都可以统称为集合)常用的列表、元组、字典都可以创建迭代器,iter() 和 next()这两个方法与迭代器息息相关。假如我们想取出一个列表中的全部元素可以通过简单的循环做到:list...原创 2019-01-25 17:08:51 · 159 阅读 · 0 评论 -
seaborn画图
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplimport seaborn as snssns.barplot(x = ‘Quarter’,y = ‘GDP’,hue=‘Industry_Type’,data=Industry_GDP,color=‘b...原创 2018-11-20 12:19:02 · 533 阅读 · 0 评论 -
python一般画图方法
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mpl显示中文mpl.rcParams[‘font.sans-serif’] = [‘SimHei’]mpl.rcParams[‘axes.unicode_minus’] = Falsea[‘b’]= pd....原创 2018-11-15 20:10:06 · 560 阅读 · 0 评论 -
python基础数据分析
单样本T检验——一个连续变量与一个数值的显著性关系sm.stats.DescrStatsW(a[b].ttest_mean(0.1)) 0.1为参数双样本T检验——一个分类变量(二分类)与一个连续变量的显著性关系方差齐性检查a1 = creditcard_exp[a[b]==0][c]a2 = creditcard_exp[a[b]==1][c]levene = stats.leve...原创 2018-11-11 10:03:11 · 502 阅读 · 0 评论 -
python数据处理
重复值print(any(a.duplicated()))a.drop_dupliactes()缺失值print(any(a.isnull()))a.dropna()a.b.fillna(a.b.mean()/median()/mode()[0])异常值P1=a[b].mean()+2a[b].std()/a[b].quantile(0.75)P2=a[b].mean()-2a[...原创 2018-11-11 10:02:27 · 236 阅读 · 0 评论 -
python数据结构
创建列表a = [1, ‘2’, 3, 4]b = list([1, 2, 3])索引和切片a[0] # 访问第一个元素a[-1] # 访问最后一个元素a[:2] # 第一个到第二个元素,开始位置包含,第三个不包含a[0:] #全输出a[::] #全输出a[::3] # 第一位和第四位 步长为3a[::-1] # 倒序列表操作a = [1, 2, 3]b ...原创 2018-11-05 18:45:58 · 894 阅读 · 0 评论 -
python数据类型
Python中,单引号,双引号和三引号包围的都是字符串,如下所示:a = ‘spam egg’b = “spam egg”c = ‘’‘spam egg’’’print( ‘a 类型是 %s’ % type(a))print( ‘b 类型是 %s’ % type(b))print( ‘c 类型是 %s’ % type©)type为内置函数字符串的一些格式化输出换行符\n转义字...原创 2018-11-05 18:43:02 · 240 阅读 · 0 评论 -
python函数
defreturndef avg(x):mean_x = sum(x) / len(x)return mean_xa=avg([23, 24, 13, 34, 56, 78])全局变量与局部变量全局变量是在整个py文件中声明,全局范围内都可以访问局部变量是在某个函数中声明的,只能在该函数中调用它total = 0def sum(para1,para2):total = par...原创 2018-11-06 19:34:01 · 223 阅读 · 0 评论 -
Pandas知识点梳理(二)
接上一篇博客,接下来重点介绍一下Dataframe三、DataFrame使用DataFrame是一种二维的数据结构,非常接近于excel。它的竖行称之为 columns,横行跟前面的 Series 一样,称之为 index,也就是说可以通过 columns 和 index 来确定一个主句的位置。1、导入import pandas as pd2、建立DataFramedf1=pd.Dat...原创 2019-02-13 09:20:07 · 363 阅读 · 0 评论