
python
如梦如幻uuu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python正则表达式指南
原文地址:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html作者:AstralWind转载出处:博客园本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。转载 2018-02-02 23:02:43 · 450 阅读 · 0 评论 -
UnicodeEncodeError: 'latin-1' codec can't encode character
刚刚导入MySQLdb库用python连接数据库时出现了'latin-1' codec can't encode character '\u9648' in position 0: ordinal not in range(256)的错误。查了很多问答和文档,发现这是因为MySQLdb通常会尝试将所有东西都编码为latin-1。但是一些我们希望存入数据库的字符和latin-1相冲突,或者超过原创 2018-02-06 22:15:23 · 2273 阅读 · 0 评论 -
爬取中国移动用户问答
最近一个好朋友在搞爬虫,问了很多问题,所以干脆直接写了一个范例。这个程序整体要两次解析网页:第一层是分析网页中的json数据来获取qtid,第二层是用qtid来解析获得问答所在的网页因为在问答网页里的数据存储是引用的数据库中的数据,所以不得已选择了低效的selenium模式没时间分析了orz 有空再分析一下吧# -*- coding:utf-8 -*-from selenium import ...原创 2018-06-06 15:40:41 · 1420 阅读 · 2 评论 -
【6】实战:利用re模块爬取淘宝商品信息
正则表达式是一种匹配字符串的工具。它提供了一系列的规则即用法,也就是给字符串定义一系列规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。原创 2019-03-29 22:06:29 · 3545 阅读 · 1 评论 -
【7】实战:爬取网易云音乐歌曲对应id并剔除无版权歌曲
通过网易云搜索页爬取对应歌曲的id除了用了基本的爬取分析以及调试之外,还涉及到一些密码学的问题原创 2019-06-02 13:01:40 · 18195 阅读 · 14 评论