
python
用智能拥抱幸福
专注于API低代码平台、人工智能应用的开发。
展开
-
python笔记30:数据分析之RFM分析
# -*- coding: utf-8 -*-#1. 概念:RFM分析是根据客户活跃程度和交易金额贡献,进行客户价值细分的一种方法.#R(Recency):近度,客户最近一次交易时间的间隔。R越大,表示客户越久未发生交易,R越小,表示客户越近有交易发生#F(Frequency):频度,客户在最近一段时间内交易的次数。F越大,表示客户交易越平凡,F越小,表示客户不够活跃#M(Monetary...原创 2019-02-13 14:57:46 · 2070 阅读 · 0 评论 -
python笔记29:数据分析之相关分析
# -*- coding: utf-8 -*-#1. 概念:相关分析(correlation analysis),是研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。#相关分析分为:#线性相关#非线性相关#这里我们主要介绍常用的线性相关,线性相关也称为直线相关,也就是当一个连续变量发生变动时,另一个连续变量相应的成线性关系变动。#线性相关关系主要采用皮尔逊(Pears...原创 2019-02-13 14:09:45 · 656 阅读 · 0 评论 -
python笔记28:数据分析之结构分析
# -*- coding: utf-8 -*-#1、概念:结构分析, 是在分组(这个分组一般是定量分组,定量分组一般看结构)以及交叉的基础上,计算各组成部分所占的比重,进而分析总体的内部特征的一种分析方法。#结构分析的结果一般以饼图呈现,如果成分较少(两个或三个),那么可以使用圆环图呈现#下面看看在pandas中如何进行占比计算:#当我们使用groupby计算出分组结果或者使用pivo...原创 2019-02-13 12:21:46 · 799 阅读 · 0 评论 -
python笔记27:数据分析之交叉分析
# -*- coding: utf-8 -*-#1、概念:交叉分析,通常用于分析两个或两个以上,分组变量之间的关系,以交叉表形式进行变量间关系的对比分析;#可以有三种情况下的交叉:定量与定量分组进行交叉;定量与定性分组进行交叉;定性与定性分组进行交叉#建议交叉的维度为两个维度即可,维度越多,越细,就越难发现规律#2、交叉计数函数:#pivot_table(values,index,co...原创 2019-02-11 17:08:06 · 2583 阅读 · 0 评论 -
python笔记26:数据分析之分布分析
# -*- coding: utf-8 -*-#1、概念:分布分析,是指根据分析目的,将数据(定量数据)进行等距或者不等距的分组(定量分组),进行研究各组分布规律的一种分析方法。#常用于用户的消费分布、收入分布、年龄分布等import numpyimport pandasdata = pandas.read_csv("D:/workspaces/python/pythonStudy/...原创 2019-02-11 15:02:09 · 1519 阅读 · 0 评论 -
python笔记25:数据分析之分组分析
# -*- coding: utf-8 -*-#1、概念:分组分析,是指根据分组字段,将分析对象划分成不同的部分,以进行对比分析各组之间的差异的一种分析方法。#定性分组:根据事物的已有类别进行划分,如性别、年龄、地区等#定量分组:即数值分组,在数据处理章节(python笔记20:数据处理之数据分组)已经学习过#2、常用的统计指标:计数、求和、平均值等#3、分组统计函数:#groupb...原创 2019-01-22 16:52:34 · 1015 阅读 · 1 评论 -
python笔记17:数据处理之字段匹配
# -*- coding: utf-8 -*-#概念:字段匹配,根据各表共有的关键字段,把各表所需的记录一一对应起来#应用场景:假如现在手上有两个表,第一个表存的是商品的基本信息,第二个表存的是商品的销售信息,两个表都有一个商品id字段,id相同就表示是同一个商品,那么,我们可以利用这个字段,将两个表进行合并#字段匹配函数:merge(x,y,left_on,right_on)#x:第...原创 2019-01-16 18:12:15 · 1763 阅读 · 0 评论 -
python笔记16:数据处理之字段合并
# -*- coding: utf-8 -*-#概念:字段合并,是指将同一个数据框中的不同列,进行合并,形成新的列。字段合并是前面学习的字段拆分的逆操作#字段合并方法:x = x1 + x2 + ...#限制:要求所有的列都是字符型数据(如果不是就需要转换)#返回值:Series 合并后的序列from pandas import read_csvdf = read_csv("D:/...原创 2019-01-16 18:07:26 · 762 阅读 · 0 评论 -
python笔记15:数据处理之记录合并
# -*- coding: utf-8 -*-#概念:记录合并,是指将两个(或多个)结构相同的数据框,合并成一个数据框#记录合并函数:concat([dataframe1,dataframe2,...])#注意要使用中括号将各数据框对象括起来import pandasfrom pandas import read_csvdata1 = read_csv('D:/python/wor...原创 2019-01-16 18:05:25 · 403 阅读 · 0 评论 -
python笔记31:数据分析之矩阵分析
# -*- coding: utf-8 -*-#1.概念:矩阵分析,是指根据事物(如产品,服务等)的两个重要属性(指标)作为分析的依据,进行关联分析,找出解决#问题的一种分析方法。#矩阵分析法在解决问题和资源分配时,为决策者提供重要的参考依据,先解决主要矛盾,再解决次要矛盾,有利于提高工作效率,有#利于决策者进行资源的优化配置。#如何使用python进行矩阵分析:import p...原创 2019-03-08 16:53:44 · 890 阅读 · 0 评论 -
python笔记32:数据可视化之散点图
相关文件下载地址:https://pan.baidu.com/s/1iOefRWY_VrgxmmkEBAdN8Q提取码:8v21# -*- coding: utf-8 -*-#1.概念:散点图(scatter diagram),是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量关系的一种图形。#一般和相关分析、回归分析结合使用#2.散点图绘图函数:plot(x...原创 2019-03-08 18:10:56 · 517 阅读 · 0 评论 -
Windows环境下为Python3.X安装basemap
http://blog.youkuaiyun.com/moxigandashu/article/details/68945845原创 2019-03-11 11:21:49 · 575 阅读 · 0 评论 -
python笔记36:数据可视化之直方图
链接:https://pan.baidu.com/s/1N17ZMhy5O-pvShc_r2sjhA提取码:9n1g# -*- coding: utf-8 -*-#1.概念:直方图(Histogram),是用一系列等宽不等高的长方形来绘制,宽度表示数据范围的间隔,高度#表示在给定间隔内数据出现的频数,变化的高度形态表示数据的分布情况。#直方图的作用主要有两个:#a.显示各组频数分布的情...原创 2019-03-11 10:50:48 · 518 阅读 · 0 评论 -
python笔记35_4:数据可视化之双向柱状图
链接:https://pan.baidu.com/s/15jQhGzVV9zgYMWxstk-FwA提取码:fb0c# -*- coding: utf-8 -*-#双向柱形图的绘图案例: 请执行代码观看效果import numpyimport pandasimport matplotlibfrom matplotlib import pyplot as pltfont = {...原创 2019-03-11 10:12:23 · 4178 阅读 · 0 评论 -
python笔记35_3:数据可视化之堆积柱状图
链接:https://pan.baidu.com/s/15jQhGzVV9zgYMWxstk-FwA提取码:fb0c# -*- coding: utf-8 -*-#堆积柱形图的绘制方法:#什么是堆积柱形图?#即把不同维度的柱子堆叠到一根柱子上(之前是平行的几根柱子),请执行代码观察效果import numpyimport pandasimport matplotlibfro...原创 2019-03-11 09:49:59 · 5559 阅读 · 0 评论 -
python笔记35_2:数据可视化之多维柱状图
链接:https://pan.baidu.com/s/15jQhGzVV9zgYMWxstk-FwA提取码:fb0c# -*- coding: utf-8 -*-#多维柱形图的绘制方法:import numpyimport pandasimport matplotlibfrom matplotlib import pyplot as pltfont = { '...原创 2019-03-11 09:47:08 · 2215 阅读 · 0 评论 -
python笔记35_1:数据可视化之一般柱状图
链接:https://pan.baidu.com/s/15jQhGzVV9zgYMWxstk-FwA提取码:fb0c# -*- coding: utf-8 -*-#1. 概念:柱形图,是一种以长方形的单位长度,根据数据大小绘制的统计图,用来比较两个或两个以上的数据,可以是时间,也可以是不同类别,所以#柱形图可以表示趋势,也可以表示不同项目间的对比,如果横轴是数值区间,还可以表示数据分布...原创 2019-03-11 09:43:21 · 409 阅读 · 0 评论 -
python笔记34:数据可视化之饼图
相关文件下载地址:https://pan.baidu.com/s/1JR1IebsEZbJEqqcOAysaSA提取码:qgsa# -*- coding: utf-8 -*-#1. 概念:饼图(Pie Graph),又称原型图,是一个划分为几个扇形的原形统计图,它能够直观地反映个体与总体的比例关系。#通常和机构分析一起结合使用。#2. 饼图绘图函数:pie(x,labels,color...原创 2019-03-08 18:41:55 · 1717 阅读 · 0 评论 -
python笔记33:数据可视化之折线图
链接:https://pan.baidu.com/s/1MW2hW8CNMOGoj1Zg9aemFw提取码:r2gc# -*- coding: utf-8 -*-#1. 概念:折线图,也称趋势图,它是用直线将各数据点链接起来而组成的图形,以折线方式显示数据的变化趋势。#折线统计图不仅可以表示项目的具体数量,又能清楚的反应事物随时间变化的情况,因此特别适合用于时间趋势的绘图#2. 折线图...原创 2019-03-08 18:20:11 · 559 阅读 · 0 评论 -
python笔记14:数据处理之随机抽样
# -*- coding: utf-8 -*-#1. 概念:随机抽样,是指随机从数据中,按照一定的行数或者比例抽取数据#随机抽样函数:DataFrame.sample(n,frac,replace=False)#n:按个数抽样#frac:按百分比抽样#注:以上两个参数只能任意设置一个#replace:是否可放回抽样,默认为False不可放回(所谓能否放回即被抽取过的数据还能不能被再次抽...原创 2019-01-15 18:45:43 · 2734 阅读 · 0 评论 -
python笔记13:数据处理之记录抽取
# -*- coding: utf-8 -*-#1. 概念:记录抽取,是指根据一定的条件,对数据进行抽取。类似excel中的过滤功能#记录抽取函数:dataframe[condition]import pandasdf = pandas.read_csv('D:/workspaces/python/pythonStudy/13.csv',sep='|')#单条件:df[df.co...原创 2019-01-15 17:11:18 · 497 阅读 · 0 评论 -
python笔记12:数据处理之字段拆分
# -*- coding: utf-8 -*-#1. 概念:字段拆分,是指按照固定的字符,拆分已有字符串#字符分割函数:split(sep,n,expand=False)#sep: 用于分割的字符串#n:分割为多少列#expand:是否展开为数据框,默认为False,但我们往往会设置为True#返回值:如果expand为True,则返回DataFrame;否则返回Seriesfr...原创 2019-01-15 17:04:22 · 1062 阅读 · 0 评论 -
python笔记19:数据处理之数据标准化
# -*- coding: utf-8 -*-#概念:数据标准化,是指将数据按比例缩放,使之落入到特定区间#0-1标准化计算公式: x* = (x-min) / (max - min)#在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。...原创 2019-01-18 10:19:28 · 457 阅读 · 0 评论 -
python笔记18:数据处理之简单计算
# -*- coding: utf-8 -*-#概念:简单计算,是指通过对已有字段进行加、减、乘、除等运算,得出新的字段import pandasdata = pandas.read_csv("D:/python/workspace/pythonStudy/18.csv",sep="|")data["total"] = data.price * data.num#问:为什么前面不...原创 2019-01-17 11:50:06 · 194 阅读 · 0 评论 -
python笔记6:数据处理之导入数据
# -*- coding: utf-8 -*-#数据一般存储在文件(csv、txt、excel)和数据库中#1. 导入csv文件(第一行是列名)from pandas import read_csv#文件的编码格式也应该是 utf-8 才行,否则报错df = read_csv( 'D:/python/workspace/pythonSt原创 2018-01-22 17:37:49 · 367 阅读 · 0 评论 -
python笔记5:向量化运算
# -*- coding: utf-8 -*-#定义:向量化计算是一种特殊的并行计算的方式,它可以在同一时间执行多次操作,通常是对不同的数据执行同样的一个或一批指令,或者说把指令应用于一个数组/向量。#1. 四则运算#规则:相同位置的数据进行运算,结果保留在相同的位置。#语法:S1 op S2#2. 函数计算#规则:相同位置的数据进行函数的计算,函数返回结果保留原创 2018-01-22 16:34:05 · 5312 阅读 · 0 评论 -
python笔记4:数据结构之DataFrame
# -*- coding: utf-8 -*-#1. 概念:数据框。用于存储多行和多列的数据集合from pandas import DataFrame#2. 定义#自动生成索引的方式:df = DataFrame({ 'age':[21,22,23], 'name':['zhangsan','lisi原创 2018-01-22 16:25:02 · 330 阅读 · 0 评论 -
python笔记3:数据结构之Series
# -*- coding: utf-8 -*-#1. 概念:系列。系列是用于存储一行或一列的数据,以及与之相关的索引的集合。系列与列表(list)非常的类似,但它多了一个索引的概念。from pandas import Series#2. 定义,可以混合定义#自动生成索引的方式:y = Series( ['a',True,1]原创 2018-01-22 16:08:08 · 1007 阅读 · 0 评论 -
python笔记2:浮点运算之越界问题
代码:# -*- coding: utf-8 -*-#浮点数运算越界问题,几乎每一种语言都会遇到:a = 4.2b = 2.1a + b # 6.30000000000001(a+b) == 6.3 # False#因此,涉及到运算时应该采用以下方式:from decimal import Decimala = Decimal('4.2')原创 2018-01-22 16:02:33 · 1331 阅读 · 0 评论 -
python笔记1:基本语法之逻辑运算
直接上代码:# -*- coding: utf-8 -*-x=1y=2z=x#输出z的值z#逻辑运算符 与 或 非True & False #执行运算并输出运算结果True | Falsenot TrueTrue and False #输出False以上就是所有代码。原创 2018-01-22 15:57:10 · 362 阅读 · 0 评论 -
python3语法笔记
俗话说只要学懂一门语言,再学习其他语言就事半功倍了。小生具有java的语法基础,因此,以java为参照,总结了python语法,主要是记录了python和java等高级语言的不同以及比较生僻的语法点。某些知识点只是提及,并未深入,具体使用时请借助百度。全文如下:没有大括号,使用TAB缩进实现大括号的功能,if else等语句后面也没有小括号,注意和其他高级语言区别句尾没有分原创 2018-01-21 18:14:53 · 2094 阅读 · 0 评论 -
python笔记20:数据处理之数据分组
# -*- coding: utf-8 -*-#概念:数据分组,根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间进行研究,以揭示#其内在的联系和规律性#cut函数:cut(series,bins,right=True,labels=NULL)#series:需要分组的序列数据#bins:划分数组(如何定义划分数组是重点)#right:分组的时候,右边是否闭合...原创 2019-01-18 10:26:25 · 3559 阅读 · 0 评论 -
python笔记21:数据处理之日期转换
# -*- coding: utf-8 -*-#概念:时间转换,是指将字符型的时间格式数据,转换为时间型数据的过程#时间转换函数:datetime = pandas.to_datetime(dateString,format)# %Y:代表年份# %m:代表月份# %d:代表日期# %H:代表小时# %M:代表分钟# %S:代表秒#时间格式化:是指将时间...原创 2019-01-18 10:32:56 · 772 阅读 · 0 评论 -
python笔记11:数据处理之字段抽取
# -*- coding: utf-8 -*-#1. 概念:字段抽取:是根据已知列数据的开始和结束位置,抽取出新的列。例如从手机号码中抽取出运营商、地区、号码#字段截取函数:slice(start,stop)from pandas import read_csvdf = read_csv('D:/python/workspace/pythonStudy/11.csv')#由于电话号码...原创 2019-01-15 16:51:20 · 1153 阅读 · 0 评论 -
python笔记10:数据处理之去除空格
# -*- coding: utf-8 -*-#strip函数作用:清除字符型数据左右的空格。#strip函数语法:stripfrom pandas import read_csvdf = read_csv("D:/python/workspace/pythonStudy/10.csv")newName = df['key'].str.lstrip() #去除左边的空格newN...原创 2019-01-15 16:47:05 · 1840 阅读 · 0 评论 -
python笔记9:数据处理之缺失值处理
# -*- coding: utf-8 -*-#概念:由于某些原因,导致数据中的某些列的值缺失,这种情况可能是正常的,也可能是不正常的。我们可以选择不处理、补齐、或删除对应的行#dropna函数作用:去除数据结构中值为空的数据。#dropna函数语法:dropna()from pandas import read_csvdf = read_csv("D:/workspaces/p...原创 2019-01-15 14:34:05 · 397 阅读 · 0 评论 -
python笔记8:数据处理之去除重复数据
# -*- coding: utf-8 -*-#1. 概念:把数据结构中,行相同的数据只保留一行。# 语法: drop_duplicates 该方法返回一个去重后的数据框对象from pandas import read_csvdf = read_csv("D:/python/workspace/pythonStudy/8.csv")#找出行重复的位置(索引值)dIndex =...原创 2019-01-14 17:30:28 · 6622 阅读 · 0 评论 -
python笔记7:数据处理之导出数据
# -*- coding: utf-8 -*-#如何把python的处理结果导出到文件中呢?#1. 导出文本文件#语法:to_csv(filePath,sep=',',index=True,header=True)#index:是否导出行索引,默认为True(虽然一般不需要)#header:是否导出列名,默认为Truefrom pandas import DataFramedf...原创 2019-01-14 16:56:28 · 771 阅读 · 0 评论 -
python3.5通过cx_Oracle连接oracle11g数据库
在下载使用cx_Oracle的时候遇到一些坑,在此记录一下:我电脑的情况:1. 之前手动安装了python2.7,并未卸载2. 安装了Anaconda(python3.5),作为我的python开发工具3. 电脑上已经装好了oracle11g数据库因此,由于我使用的是anaconda来开发,没有做其他特殊配置的情况下,编译运行环境应该是python3.5。 首先通过学习...原创 2019-01-14 16:31:37 · 2393 阅读 · 0 评论 -
python笔记24:数据分析之基本统计
# -*- coding: utf-8 -*-#1、概念:基本统计分析:描述性统计分析,用来概括事物整体状况以及事物间联系(即事物的基本特征),以发现其内在规律的统计分析方法。# 常用的统计指标:计数、求和、平均值、方差、标准差#方差:统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。#标准差:标准差是方差的算术...原创 2019-01-18 14:50:01 · 581 阅读 · 0 评论