
Python3爬虫实战
7900X
用力奔跑才能尽情呼吸
展开
-
第一个小爬虫:全本网小说下载
编译环境:Python3.7.0需要安装的库:requests首先第一步:获取网页的源码(测试的URL:http://quanben5.com/n/yuzui/xiaoshuo.html)import requests#获取网页的源码def get_one_page(url): try: headers = { 'User-Age...原创 2018-09-23 01:44:57 · 1419 阅读 · 0 评论 -
CSV文件乱码的解决方案:
开始是这样的:首先右键点击文件,选择打开方式为记事本;打开后,点击:文件-另存为然后变成了这样:将文件名改为:data.csv编码选择:ANSI点击保存;现在再打开看一下:因为这次的中文是繁体,所以看起来怪怪的....原创 2018-10-16 23:58:38 · 6971 阅读 · 0 评论 -
微信好友数据分析
步骤:模拟登陆微信web版获取需要的数据对数据进行分析所需第三方模块:wxpy 微信网页版接口封装Python版本,在本文中用以获取微信好友信息jieba 结巴分词的 Python 版本,在本文中用以对文本信息进行分词处理snownlp 一个 Python 中的中文分词模块,在本文中用以对文本信息进行情感判断。matplotlib Python 中图表绘制模块,在本文中用...原创 2018-10-20 16:24:05 · 661 阅读 · 0 评论