
pandas
凯旋的铁铁
咸鱼一号
展开
-
Python pandas库中的isnull()函数
isnull():判断缺失值import pandas as pdimport numpy as np df = pd.DataFrame(np.random.randn(10,6))# Make a few areas have NaN valuesdf.iloc[1:3,1] = np.nandf.iloc[5,3] = np.nandf.iloc[7:9,5] = np.nan 0 1 2 3 4转载 2020-05-19 16:53:49 · 3083 阅读 · 1 评论 -
pd.apply--对数据表应用函数
DataFrame.apply(self, func, axis=0, raw=False, result_type=None, args=(), **kwds)API返回:Series or DataFrame参数:func:函数,可应用于每个列或行。axis=0:{0 or ‘index’, 1 or ‘columns’}, default 0 函数所应用的轴,0 or ‘index’: 列,1 or ‘columns’: 行raw=False:bool, default False。res原创 2020-05-19 14:38:25 · 3063 阅读 · 0 评论 -
pdset_option ----设置指定选项的值
python的set_option选择常用1、pd.set_option(‘expand_frame_repr’, False)True就是可以换行显示。设置成False的时候不允许换行2、pd.set_option(‘display.max_rows’, 10)pd.set_option(‘display.max_columns’, 10)显示的最大行数和列数,如果超额就显示省略号,这个指的是多少个dataFrame的列。如果比较多又不允许换行,就会显得很乱。3、pd.set_option(转载 2020-05-19 09:48:18 · 1863 阅读 · 0 评论 -
深入理解series和dataframe,及其区别
一个dataframe可以看做是由多个series组成的。series可以看做一个一维的字典,而dataframe可以看作是一个二维的字典。原文链接,赞转载 2020-05-14 14:20:43 · 3045 阅读 · 0 评论 -
Pandas中loc和iloc函数用法详解(源码+实例)
loc函数:通过行索引 “Index” 中的具体值来取行数据(如取"Index"为"A"的行)iloc函数:通过行号来取行数据(如取第二行的数据)本文给出loc、iloc常见的五种用法,并附上详细代码。原文链接,超详细...转载 2020-05-14 13:40:33 · 432 阅读 · 0 评论 -
pandas.DataFrame.corr——计算列之间相关性
DataFrame.corr(self, method=‘pearson’, min_periods=1) API作用:计算列之间的相关性,不包括缺省值参数说明:method:可选值为{‘pearson’, ‘kendall’, ‘spearman’} pearson:Pearson相关系数来衡量两个数据集合是否在一条线上面,即针对线性数据的相关系数计算,针对非线性 ...原创 2020-03-05 16:50:15 · 4146 阅读 · 0 评论 -
pandas.DataFrame函数解析
class pandas.DataFrame(data=None, index: Optional[Collection] = None, columns: Optional[Collection] = None, dtype: Union[str, numpy.dtype, ExtensionDtype, None] = None, copy: bool = False) APIDataFra...原创 2020-03-03 11:42:14 · 389 阅读 · 0 评论 -
pandas.unique
APIpandas.unique(values)返回一个“独一无二”的值例如:>>> pd.unique(pd.Series([2, 1, 3, 3]))array([2, 1, 3])>>> pd.unique([('a', 'b'), ('b', 'a'), ('a', 'c'), ('b', 'a')])array([('a', 'b')...原创 2019-12-27 16:19:31 · 2605 阅读 · 0 评论 -
pandas.DataFrame
APIpandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)具有标记轴(行和列)的二维大小可变、可能异构的表格数据结构。算术运算在行和列标签上对齐。可以将其视为连续对象的类似于字典的容器。是主要的panda数据结构。Parameters:data : ndarray (structure...原创 2019-12-24 15:58:15 · 188 阅读 · 0 评论 -
pandas.Series
APIpandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)Parameters:data : array-like, Iterable, dict, or scalar valueContains data stored in Series.Changed in ve...原创 2019-12-24 15:37:02 · 168 阅读 · 0 评论 -
python利用pandas处理excel数据的应用
读取Excel文件的两种方式:数据:sheet1:46行,J列sheet2:10行,J列import pandas as pd#方法一:默认读取第一个表单path = 'C:/Users/39813/PycharmProjects/11train.xlsx'df = pd.read_excel(path)#这个会直接默认读取到这个Excel的第一个表单data = df.head...原创 2019-11-17 15:23:08 · 1030 阅读 · 0 评论 -
python 使用pandas读取excel文件
read_excel 函数官方文档:http://pandas.pydata.org/pandas docs/stable/reference/api/pandas.read_excel.html#pandas.read_excelpandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=...原创 2019-11-16 16:59:27 · 940 阅读 · 0 评论