参考来源:Vitu.AI
数据创建,读写指南
任何数据分析项目的第一步都可能是从某个文件中读取数据,因此我们需要首先考虑这一点。 在本节中,我们将介绍有关创建pandas Series和DataFrame对象的练习
官方pandas文档的IO Tools部分提供了有关此主题的全面概述
首先我们来导入pandas库
import pandas as pd
创建数据 pandas中有两个核心对象:DataFrame和Series。
DataFrame是一个表。 它包含一系列单独的条目,每个条目都有一定的值。 每个条目对应一行(或记录)和一列。
例如,请考虑以下简单的DataFrame:
pd.DataFrame({
'Yes': [50, 21], 'No': [131, 2]})
在此示例中,“0,No”条目的值为131.“0,Yes”条目的值为50,依此类推。
DataFrame条目不限于整数。 例如,这是一个DataFrame,其值为str字符串:
pd.DataFrame({
'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})
我们使用pd.DataFrame构造函数来生成这些DataFrame对象。创建新对象的语法是初始化一个字典,其键是列名(本例中为Bob和Sue),其值是条目列表。 这是构建新DataFrame的标准方法,也是你最容易遇到的方法。
字典列表的构造函数为列标签分配值,但只使用0