
python
文章平均质量分 93
python
JokeOrSerious
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Scrapy爬虫框架——慕课嵩天老师课程学习笔记
框架理解框架结构:5+2结构spiders模块-----engine模块-----downloader模块(联网)-----scheduler模块-----item pipelines模块spiders负责接收用户请求(发给scheduler),处理downloader的response(发给item pipelines和scheduler)engine是链接其他四个模块的中介downloader负责将从scheduler收到的request联网下载,返回response给spiders原创 2020-05-16 10:59:53 · 523 阅读 · 0 评论 -
正则表达式_嵩天老师慕课学习笔记
RE regular expression正则表达式 regex正则表达式的使用过程:生成字符串(符合正则语法)--->编译成正则表达式特征-->进行匹配编译前只是一个符合正则语法的字符串,编译后才是真正的正则表达式python字符串的先验知识ASCII字符集是最早的字符集,只有128个unicode字符集包括所有语言,python3以上字符默认用unicode...原创 2020-05-04 15:44:18 · 309 阅读 · 0 评论 -
嵩天老师慕课_Python网络爬虫与信息提取_大学排名实例
此代码为嵩天老师慕课实例代码,不想全部敲的朋友可以复制部分进行学习import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: hd={'user-agent':'chrome/10'} r=requests.get(url,timeout=30,...原创 2020-05-04 10:01:14 · 476 阅读 · 0 评论 -
BeautifulSoup_嵩天老师慕课学习笔记
导入 from bs4 import BeautifulSoup 对大小写敏感(还有DataFrame)初始化(第一个参数是string形式的标签树,第二个参数是所用的解析器)soup=BeautifulSoup("<html>data</html>","html.parser")soup2=BeautifulSoup(open("D://demo.htm...原创 2020-05-04 08:48:54 · 439 阅读 · 0 评论 -
python爬虫——requests模块(嵩天慕课爬虫学习笔记)
导入 import requests下面是一个简单的例子url="http://www.baidu.com" #设置链接网址r=requests.get(url) #获取网页r.status_code #检查状态,200为成功,其它均为失败r.encoding='utf-8' #设置编码格式r.text #输出网页源代码...原创 2020-05-03 18:15:32 · 807 阅读 · 0 评论 -
Django各种路径,访问问题!!!
作为刚接触mvc设计模式的小白,被Django各种url访问搞得头昏脑涨,这里做以下总结!1.127.0.0.1:8000这是启动服务默认的网站根目录,域名2.域名下目录,例如127.0.0.1:8000/index。这会访问项目的urls.py文件,找到(path或url中)与之匹配的index,执行第二个命令。第二条命令为函数名比如第二条命令为view.index,则调用view....原创 2019-11-14 19:42:05 · 2229 阅读 · 0 评论 -
django+anaconde
Anaconda替代cmd如果你一开始安装的是anaconde,那么一些命令在电脑自带的cmd中可能无法运行。请一定用anaconde里面的"cmd",即在Anaconda Prompt中运行。例如django-admin startproject 和 django-admin startapp等命令行1. cmd中运行命令:django-admin startproject ...原创 2019-05-17 10:04:20 · 265 阅读 · 0 评论 -
爬虫笔记
urllib模块读取web数据接口 urllib.urlopen(url,data,timeout) 或参数用request对象替代 打开url地址,data访问url时传送的数据,timeout设置超时时间 read()读取url数据,下载并打印输出 urllib.urlretrieve(imgurl,filename,reporthook原创 2017-10-07 12:09:35 · 187 阅读 · 0 评论 -
正则表达式
通配符 .匹配任何字符 ?匹配任意一位字符转义,前面加\\字符集 [a-z]匹配a-z任意字符,[a-z0-9]匹配a-z,0-9任意字符 反义字符^ [^a]匹配除a外任意字符选择符 管道符号|,或 可以部分使用,h(ello|i)匹配hello和hi可选项 ?表示前面括号()内可有可无重复原创 2017-10-07 12:13:34 · 198 阅读 · 0 评论 -
python笔记
#分号不重要:后面用空格分隔代码块 ord()获取字符整数 chr()编码转化为字符 str.encode()转化为bytes bytes.decode()转化为str str()转化为str................不一定对 len()计算字节或字符数 is检查是否指向同一地址 del()释放原创 2017-10-07 12:08:32 · 277 阅读 · 0 评论 -
python建站及mydjango笔记
创建django项目 django-admin.py startproject mysite manage.py -Django项目里面的工具,通过它可以调用django shell和数据库等。 settings.py -包含了项目的默认设置 urls.py -负责把URL模式映射到应用程序。项目中创建static文件夹,存放外部文件(css、js)创原创 2017-10-07 12:05:19 · 492 阅读 · 0 评论