红白葡萄酒问题 :哪个水平的酸度(pH 值)获得的平均评级最高?
思路:先用pd.cut() 对酸度进行划分,再用pd.groupby()对划分好的区间进行分组求评分的平均值。
import pandas as pd
df = pd.read_csv('winequality_edited.csv') #'winequality_edited.csv'这是合并后的数据
# 用 Pandas 描述功能查看最小、25%、50%、75% 和 最大 pH 值
pd.describe()['pH']
输出:
count 6497.000000 mean 3.218501 std 0.160787 min 2.720000 25% 3.110000 50% 3.210000 75% 3.320000 max 4.010000 Name: pH, dtype: float64
# 对用于把数据“分割”成组的边缘进行分组
</