
python实战
文章平均质量分 85
dbuging
数据分析小白菜
展开
-
【实战】词频统计及词云图制作
写在开头最近对词云有些兴趣,就自己瞎琢磨研究一些这方面的知识,期间也遇到一些小问题,写下此篇文章留作备注吧。研究对象金庸老先生的《天龙八部》正式开始(微笑脸)统计字频 (1)先统计下小说的字频数: 天龙八部总共用字量4134个,top20的字不出意外都是一些常用词,不过“一”竟然排名第二很让我意外。# -*- coding:utf-8 -*-import rewordcount = {}原创 2017-04-11 23:03:54 · 9724 阅读 · 1 评论 -
【实战】爬虫实战-pixabay图片存储mysql
写在前面在知乎看见有不少人利用python下载了pixabay的图片,发现pixabay上的图片质量确实不错,自己页试着也写了一个小爬虫,权当练手。仅抓取照片的内容网址开发环境系统:win7 64bit 工具:python 2.7.12 IDE:pycharm 6.3正式开始url分析以第2页的url为例: 总页数:165 每页图片量:60 获取方法:GET https://pixaba原创 2017-04-13 23:14:48 · 1529 阅读 · 0 评论