使用R和Python在数据处理与可视化中的应用
1. Python脚本可视化
1.1 带样条曲线的散点图
在分析两个变量之间的关系时,我们可以使用不同的算法生成曲线,而不是直线趋势线。以下是实现带样条曲线的散点图的Python代码:
# import packages
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline
# prepare dataset
dataset = dataset.sort_values(by=['UnitPrice'])
# create model
m = make_pipeline(PolynomialFeatures(degree = 5), LinearRegression())
m.fit(dataset['UnitPrice'].values.reshape(-1, 1), dataset['OrderQuantity'].values.reshape(-1, 1))
# create prediction
m.pred = m.predict(dataset.UnitPrice.values.astype(float).reshape(-1, 1))
dataset['prediction'] = m.pred
# create plot
ax = dataset.p
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



