在进行数据挖掘联系的过程中,有个文件的获取需要使用到python的urllib2包,这里把脚本搞出来,对于爬取网络上的文件有一定的模板作用
import urllib2
url = 'http://aima.cs.berkeley.edu/data/iris.csv'
u = urllib2.urlopen(url)
localFile = open('d:\iris.csv', 'w')
localFile.write(u.read())
localFile.close()
上面的脚本可以提取iris数据,如下所示:
上面就是数据爬取的结果,可见urllib2函数爬取数据还是很方便的。
本文介绍如何使用Python的urllib2包从网络上抓取文件,通过一个具体的例子展示了如何将远程文件保存到本地。

1176

被折叠的 条评论
为什么被折叠?



