在进行数据挖掘联系的过程中,有个文件的获取需要使用到python的urllib2包,这里把脚本搞出来,对于爬取网络上的文件有一定的模板作用
import urllib2
url = 'http://aima.cs.berkeley.edu/data/iris.csv'
u = urllib2.urlopen(url)
localFile = open('d:\iris.csv', 'w')
localFile.write(u.read())
localFile.close()
上面的脚本可以提取iris数据,如下所示:
上面就是数据爬取的结果,可见urllib2函数爬取数据还是很方便的。