数据探索:从葡萄酒口感预测到玻璃类型分类及大数据处理
1. 葡萄酒口感预测的数据探索
1.1 葡萄酒数据集概述
葡萄酒口感数据集包含约 1500 种红葡萄酒的数据。对于每种葡萄酒,有一系列化学成分的测量值,如酒精含量、挥发性酸度和亚硫酸盐等。每种葡萄酒还有一个口感得分,该得分是由三位专业品酒师评分的平均值。问题是构建一个模型,结合这些化学成分测量值来预测口感得分,使其与人类品酒师给出的得分相匹配。
1.2 数据摘要与可视化
1.2.1 代码实现
__author__ = 'mike_bowles'
#read wine data into pandas data frame
wine = pd_read_wine()
print(wine.head())
#generate statistical summaries
summary = wine.describe()
print(summary)
wineNormalized = wine
ncols = len(wineNormalized.columns)
for i in range(ncols):
mean = summary.iloc[1, i]
sd = summary.iloc[2, i]
wineNormalized.iloc[:,i:(i + 1)] = \
(wineNormalized.iloc[:,i:(i + 1)] - mean) / sd
array = wineNormalized.values
plt.boxplot(array)
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



