1、将数据存储为Excel格式
某网上书城有如下的商品数据:
goods_id goods_name goods_price goods_type goods_maker
G001 人工智能导论 19 人工智能 清华出版社
G002 数据科学导论 29 数据科学 邮电出版社
G003 机器学习导论 39 人工智能 清华出版社
G004 深度学习导论 28 人工智能 清华出版社
G005 数据科学简史 21 数据科学 机械出版社
G006 数据挖掘导学 59 数据科学 机械出版社
G007 智能制造导引 78 自动控制 机械出版社
G008 智能制造导论 99 自动控制 电子出版社
G009 自动控制导论 66 自动控制 电子出版社
G010 自动控制导引 38 自动控制 电子出版社
该数据可以输入到Excel,使用DataFrame读出,也可以直接写成DataFrame格式,如下所示。
#【1】直接将数据组织成DataFrame对象
# 忽略所有警告
import warnings
warnings.simplefilter("ignore")
import pandas as pd
# 定义数据
data = {
'goods_id': ['G001', 'G002', 'G003', 'G004', 'G005', 'G006', 'G007', 'G008', 'G009', 'G010'],
'goods_name': ['人工智能导论', '数据科学导论', '机器学习导论', '深度学习导论', '数据科学简史',
'数据挖掘导学', '智能制造导引', '智能制造导论', '自动控制导论', '自动控制导引'],
'goods_price': [19, 29, 39, 28, 21, 59, 78, 99, 66, 38],
'goods_type': ['人工智能', '数据科学', '人工智能', '人工智能', '数据科学', '数据科学', '自动控制'
, '自动控制', '自动控制', '自动控制'],
'goods_maker': ['清华出版社', '邮电出版社', '清华出版社', '清华出版社', '机械出版社', '机械出版社'
, '机械出版社', '电子出版社', '电子出版社', '电子出版社']
}
# 创建DataFrame
df = pd.DataFrame(data)
# 显示DataFrame
df
#【2】读文件方式,将数据读出并返回DataFrame对象
import pandas as