- 博客(11)
- 收藏
- 关注
原创 pyquery 的一些用法
pyquery 相关用法pyspider 的内容选择器默认已经实例化一个pyquery对象,可以直接使用pyquery的api来获取自己需要的内容。在pyquery中使用response.doc就可以直接实例化一个pyquery对象,就可以直接在里面使用pyquery方法了,html()和text()获取相应的HTML块或文本块,根据HTML标签来获取元素,例:html:'<div>&...
2018-03-14 13:03:29
491
原创 用爬虫做一个翻译“客户端”
前提前些时,要考专业英语了,看见室友一边对着百度翻译,一边复习单词,心生一想法,页面明显是动态加载出来的,我能不能抓到它返回的东西,然后提取出来,这样可以弄成以个客户端,可以试一试。观察打开百度翻译的页面,调用浏览器的开发者模式,输入一个“你好”,然后刷新,观察请求在哪里,其实挺简单的,一下子就可以看到,请求,如下图
字符编码 我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的 是还有一个编码问题。 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数 字才能处理。最早的计算机在设计时采用 8 个比特(bit)作为一个字节 (byte),所以,一个字节能表示的最大的整数就是 255(二进制 11111111=十进制 255),如果要表示更大的整数,就必须用更多的字 节。比如
2017-12-14 22:30:23
261
原创 beautifulsoup 学习
今天发现一个有意思的、值得注意的地方,先记录下来,第五行声明了一个BeautifulSoup对象,res选取了他的ol的内容,此时的res是个list,当我取出list 的值后,发现他又是一’tag‘对象,开始的soup 也是一个tag对象,也就是说,list是tag对象的集合,所以我开始,企图再次声明一个BeautifulSoup对象是会报错了,取出的contents bong不是成为了一个str
2017-11-29 21:51:07
323
原创 正则表达式
基础匹配规则\w 匹配字母数字及下划线\W 匹配非字母数字下划线\s 匹配任意空白字符,等价于 [\t\n\r\f].\S 匹配任意非空字符\d 匹配任意数字,等价于 [0-9]\D 匹配任意非数字\A 匹配字符串开始\Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串\z 匹配字符串结束\G 匹配最后匹配完成的位置\n 匹配一个换行符\t
2017-11-28 20:45:22
322
原创 py 爬虫 requests库 用法(一)//源码
In [4]: print(“hello”) hello In [3]: import requests import urllib In [7]: print(1+2) 3 测试¶In [17]: import requests res=requests.get(“http://httpbin.org/get“) print(res.text) { “args”:
2017-11-27 21:24:42
429
原创 jupyter 初步
在anaconda中,pip3可以直接安装;命令行直接打开;命令:jupyter notebook; 关于jupyter 的一些介绍(来源网上) Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码
2017-11-27 19:30:18
318
原创 python爬虫urllib库学习(源码)
####urllib库的使用import urllib.requestimport http.cookiejarfrom urllib.parse import urlparse# 复杂请求构造request对象;# respons = urllib.request.Request("https://www.python.org")# response=urllib.request.
2017-11-20 17:59:35
1251
原创 个人代码记录-学生社团管理
此文章记录代码--学生社团管理系统源码。#include "stdio.h"#include "stdlib.h"#include "string.h"#include "conio.h"void jiemian();struct student{char name[50];char sex[5];int age;char num[100
2017-05-01 22:40:02
1523
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人