用回归法预测乐高套装价格的基本步骤:
1、收集数据:用Google Shopping的API收集到的数据
2、准备数据:从返回的JSON数据中抽取价格
3、分析算法:可视化并观察数据
4、训练算法:构建不同的模型,采用逐步线性回归和直接的线性回归模型
5、测试算法:使用交叉验证来测试不同的模型,分析哪个效果更好
6、使用算法:目标就是生成数据模型
收集数据
Google为用户提供了一套购物的API来抓取价格,API将以JSON格式返回所需的产品信息。Python提供了JSON解析模块,我们可以从返回的JSON格式里整理出所需数据。
具体代码:
import json
from numpy import *
from time import sleep
import urllib.request
def searchForSet(retX,retY,setNum,yr,numPce,origPrc):
sleep(5)
myAPIstr='AIzaSyD2cR2KFyx12hXu6PFU-wrWot3NXvko8vY'
searchURL='https://www.googleapis.com/shopping/search/v1/public/products?key=%s&country=US&q=lego+%d&alt=json'%(myAPIstr,setNum)
pg=urllib.request.urlopen(searchURL)
retDict=json.loads(pg.read())
for i in rang