
爬虫
口袋里的小小哥
菜鸡互啄
展开
-
爬虫-破解有道翻译
#!/usr/bin/python3 # -*- coding: utf-8 -*- ''' 如何 把 js 翻译成 python ''' import requests import json from pprint import pprint import time import hashlib url = "http://fanyi.youdao.com/translate_o" p...原创 2018-07-17 21:01:23 · 303 阅读 · 0 评论 -
爬虫:内涵吧 数据爬取
#!/usr/bin/python3# -*- coding: utf-8 -*-"""分析:#流程: # 1.3 访问详情数据链接获取详情页数据 # 2. 解析数据 # 3. 提取数据 # 4. 保存数据 pass页面静态化第1页 http://www.neihanpa.com/article/index_{}.html从 0...原创 2018-07-12 10:18:22 · 371 阅读 · 0 评论 -
python 爬虫解决gb2312编码格式导致中文乱码问题
解决方法: 成功解决////原创 2018-11-06 16:20:20 · 3161 阅读 · 4 评论 -
python3中将&#+数字 转化为utf-8
安装HTMLParser 修改他的源码 修改import markupbase为import _markupbase as markupbase (在源码的第11行) 修改return unichr(c)为return chr(c) python3中没有unichr,用chr即可(在源码的456行) 使用方法 from HTMLParser import HTMLParser HTMLPar...转载 2018-12-03 15:38:21 · 1779 阅读 · 0 评论