数据处理与分析实战:USDA食品数据库与FEC竞选捐款数据
1. USDA食品数据库分析
美国农业部(USDA)提供了一个食品营养信息数据库,程序员Ashley Williams将其转换为JSON格式。数据记录包含食品的各种属性,以及营养成分和份量信息。
1.1 数据加载与初步探索
使用Python的内置 json 模块加载数据:
import json
db = json.load(open("datasets/usda_food/database.json"))
print(len(db)) # 输出数据记录数量
每个记录是一个字典,包含单个食品的所有数据。例如,查看第一个记录的键和第一个营养成分:
print(db[0].keys())
print(db[0]["nutrients"][0])
可以将营养成分列表转换为 DataFrame ,并查看前几行:
import pandas as pd
nutrients = pd.DataFrame(db[0]["nutrients"])
print(nutrients.head(7))
1.2 提取关键信息
提取食品名称、类别、ID和制造商信息:
USDA与FEC数据处理分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



