下面是一个小爬虫的整个诞生过程
from:http://blog.youkuaiyun.com/ali197294332/article/details/51584767
step 1
在本地使用Git管理工具:
step 2
在github上新建一个仓库Douban_Movie后, ssh key 说明,https://help.github.com/articles/generating-an-ssh-key/
至此我们就知道如何将代码提交到github上了,下面我们所要做的就是编程了。
step3
在本地编写程序之后就可以提交到本地git和github的服务器上了
有关程序的部分,已经放到github上了,程序其实很简单,就是爬取了豆瓣上按类别的电影排序,爬取了其中前34个类别,例如爱情,喜剧,动画等多种类别的电影,并依次获取电影的ID,名称,上映年份,类型,片长,分数,评价人数和剧情简介。
step4
python3使用MySQL数据库需要pymysql包,据说还可以使用mysql-connector,但是没用过,在https://pypi.python.org/pypi/PyMySQL3 下载pymysql包,cd进入目录下
若在python3中能导入pymysql包即代表成功,成功后就可以继续编程啦!
注:程序已经上传到github上啦,https://github.com/ichenli/Douban_Movie,大家如果没有安装数据库或者不想涉及数据库,稍加修改即可运行,代码很简单。
大家有什么不懂的或者我哪儿写错了都欢迎留言!