
Python数据科学
文章平均质量分 77
Cacra
编程路上在探索。
展开
-
Python引用、浅拷贝、深拷贝 和 Numpy中的视图、副本 和 Python函数参数传递
1.Python引用、浅拷贝、深拷贝引用:在python中,对象赋值实际上是对象的引用。 当创建一个对象,然后把它赋给另一个变量的时候,python并没有拷贝这个对象,而只是拷贝了这个对象的引用。 直接赋值相当于视图(numpy),没有copy到额外的空间中。>>> t1 = tuple('furzoom')>>> t2 = t1>...原创 2018-03-08 19:57:07 · 2392 阅读 · 0 评论 -
jupyter notebook中matplotlib绘图包的中文乱码问题。
使用jupyter notebook绘图时,会出现中文乱码的问题,具体就是出现了方格,例如下图所示,分别是乱码和解决乱码后的情况。1.在jupyter notebook中输入下面代码# 找到matplotlib 加载的配置文件路径import matplotlibmatplotlib.matplotlib_fname()>>'D:\\Anaconda\\ins...原创 2018-05-19 20:22:56 · 16450 阅读 · 10 评论 -
Python数据分析实战笔记—Pandas数据读写(1)
《Python数据分析实战》本章将学习pandas从多种存储媒介(比如文件和数据库)读取数据。1.I/O API工具pandas是数据分析专用库,主要关注的是数据计算和处理。2.读取CSV和文本文件中的数据读取CSV文件:pandas中读取CSV函数:read_csv()、read_table()、to_csv()import numpy as npi...原创 2018-03-27 19:49:24 · 3307 阅读 · 0 评论 -
Python数据分析实战—用matplotlib实现数据可视化(2)
《Python数据分析实战》1.处理日期值数据处理过程中,最常见的一个问题就是日期类型数据的处理。 import datetimeimport numpy as npimport matplotlib.pyplot as pltimport matplotlib.dates as mdates#分别表示月份和日子(这个例子主要是用到月份)mothes = mda...原创 2018-04-02 19:08:56 · 870 阅读 · 0 评论 -
Python数据分析实战—用matplotlib实现数据可视化(1)
《Python数据分析实战》matplotlib优点:使用起来极其简单以渐进、交互式方式实现数据可视化表达式和文本使用LaTeX排版对图像元素控制力更强可输出PNG、PDF、SVG和EPS等多种格式1.matplotlib架构matplotlib的主要任务之一,就是提供一套表示和操作图形对象(主要对象)以及它的内部对象的函数和工具。 然而,matplotlib...原创 2018-04-01 23:38:05 · 5167 阅读 · 0 评论 -
Numpy,Series和DataFrame中的axis取值
这个问题主要是对于Numpy、Pandas或者DataFrame中的axis取值问题的疑惑,我们知道axis可以取值0或1,但是有时候axis=1时看起来有时候代表是行,有时候指的是列,具体的问题描述可以看:https://www.zhihu.com/question/58993137然后我找了两篇相关的文章总结出下面的结论:axis=0 是把columns保存下来,是上下运动axis...原创 2018-04-08 21:50:55 · 999 阅读 · 1 评论 -
Python数据分析实战笔记—深入pandas:数据处理(2)
《Python数据分析实战》1.数据转换现在,该进行数据处理的第二步了:数据转换。调整过数据的形式和结构之后,接下来很重要的一步是对元素进行转换。在数据转换过程中,有些操作会涉及重复机票无效元素,可能需要将其删除或替换为别的元素;而其他一些操作则跟删除索引相关;此外还有些步骤会涉及对数值或字符串类型的数据进行处理。删除重复元素:dframe>> c...原创 2018-03-30 22:58:57 · 575 阅读 · 0 评论 -
Python数据分析实战笔记—Pandas数据读写(2)
9.对接数据库数据往往存储于SQL类关系型数据库,作为补充,NoSQL数据库进来也流行开来。从SQL数据库加载数据,将其转换为DataFrame对象很简单。pandas提供的几个函数简化了该过程。pandas.io.sql模块提供于独立于数据库、叫作sqlalchemy的统一接口。该接口简化了连接模式,不管对于什么类型的数据库,操作命令都只有一套。连接数据库使用create_eng...原创 2018-03-30 21:05:05 · 391 阅读 · 0 评论 -
Python数据分析实战—用matplotlib实现数据可视化(4)
《Python数据分析实战》1.高级图表除去条状图、饼图等较为传统的图表,我们还可能需要用到其他形式的图表。等值线图:等值线图或等高线图在科学界很常用。这种可视化方法用一圈圈封闭的曲线组成的等值线图表示三维结构的表面,其中封闭的曲线表示的是一个个处于同一层次或z值相同的数据点。import matplotlib.pyplot as pltimport numpy ...原创 2018-04-07 20:39:46 · 1124 阅读 · 0 评论 -
Python数据分析实战—用matplotlib实现数据可视化(3)
《Python数据分析实战》1.条状图另外一种常用的图表类型为条状图。它跟直方图很相似,只不过x轴表示不是数值而是类别。用matplotlib的bar()函数生成条状图很简单。import matplotlib.pyplot as pltindex = [0,1,2,3,4]values = [5,7,3,4,6]plt.bar(index,values)...原创 2018-04-07 15:11:24 · 1321 阅读 · 0 评论 -
Python数据分析实战笔记—深入pandas:数据处理(1)
《Python数据分析实战》上一章讲解了从数据库或文件等数据源获取数据的方法。将数据转换为DataFrame格式后,你就可以对其进行处理了。数据处理的目的时准备数据,便于分析。数据处理很大程度上取决于必须进行数据分析的人员的目的,数据处理可以使要寻找的信息以更清晰的方式呈现出来。这一章,我们深入讲解pandas库在数据处理阶段的功能。数据处理又可以细分为三个阶段,数据处理的...原创 2018-03-30 09:45:20 · 646 阅读 · 0 评论 -
Python数据分析实战笔记—Pandas库简介(2)
《Python数据分析实战》1.Index对象Pandas的Series和DataFrame数据结构,它们在数据分析方面的大多数优秀特性都取决于完全整合到这些数据结构中的Index对象。跟pandas数据结构中其他元素不同的是,Index对象不可改变。声明后,它不能改变。不同数据结构共用Index对象时,该特性能够保证它的安全。Index对象的方法:idxmin()和i...原创 2018-03-19 23:56:30 · 288 阅读 · 0 评论 -
Python数据分析实战笔记—Pandas库简介(3)
《Python数据分析实战》1.函数应用和映射按列或列执行操作的函数:除了通用函数,用户还可以自己定义函数。 需要注意的是这些函数对一维数组进行计算,返回结果为一个数值。#函数定义f = lambda x:x.max()-x.min()#或者def f(x): return x.max()-x.min()#用apply()函数可以在DataFrame...原创 2018-03-22 19:34:15 · 322 阅读 · 0 评论 -
Python数据分析实战笔记—Pandas库简介(1)
《Python数据分析实战》1.Pandas:Python数据分析库Pandas是一个专门用于数据分析的开源Python库。它能够以最简单的方式提供数据处理、数据抽取和数据操作所需的全部工具。Pandas还有专门为数据分析设计的两个数据结构,Series和DataFrame。Numpy主要是处理矩阵/数组。2.Pandas数据结构—Series对象pandas库的S...原创 2018-03-18 21:13:00 · 743 阅读 · 0 评论 -
Python操作Excel模块选择
Python中操作Excel的库一般包括:xlwings、openpyxl、pandas、win32com、xlsxwriter、DataNitr、xlutils1.提醒及注意:xlutils 仅支持 xls 文件,即2003以下版本; win32com 与 DataNitro 仅支持 windows 系统;xlwings 安装成功后,如果运行提示报错“ImportError: no...原创 2018-03-11 16:46:00 · 1392 阅读 · 0 评论 -
Ubuntu下安装Anaconda和IPyhton notebook
安装Anaconda1.下载查看Ubuntu版本,是32位还是64位,到Anaconda下载对应版本。2.安装cd到对应目录下,然后运行bash Anaconda3-4.2.0-Linux-x86_64.sh一般就是一路yes了,如果Anaconda安装到环境变量里面,就可以做接下来的步骤了。#1.创建conda环境conda create -n gl-env...原创 2018-03-10 19:14:32 · 563 阅读 · 0 评论 -
Anaconda3.x下安装Graphlab-Create
1.首先,我们可以通过下载Anaconda2.x,然后按照https://turi.com/download/install-graphlab-create-command-line.html的步骤提示安装Graphlab-Create,然后控制台输入jupyter notebook就可以启动jupyter编译器了。 可以提示参考:https://www.imooc.com/article/18...原创 2018-03-02 22:42:39 · 3102 阅读 · 0 评论 -
Pandas数据合并与重塑(concat、merge和join)
关于Pandas格式数据的合并与重塑是在数据分析中经常使用的一个功能,搜集网上的资料,感觉下面的资料可以参考:https://blog.youkuaiyun.com/stevenkwong/article/category/6418234...转载 2018-04-29 09:32:11 · 463 阅读 · 0 评论