文章目录
HTML
- 超文本标记语言 (Hyper Text Markup Language)
- 一种标记语言
- 不是编程语言
- 使用标记标签来描述网页
- HTML 文档 = 网页
- 标签名来自于英语,很好记
例如:
<html> 描述网页的文本 </html>
<body> 可见的页面内容 </body>
<h1> 标题 </h1>
<p> 段落 </p>
HTML 与 CSS、 JavaScript
- HTML 定义网页的内容
- CSS 规定网页的布局
- JavaScript 对网页行为进行编程
CSS
CSS 指层叠样式表 (Cascading Style Sheets)
-
定义如何显示 HTML 元素
-
HTML 原本只是定义文档内容
-
CSS 来定义布局和外观
-
网页的 css一般写在< head> < /head >里面
-
在页面按 F12或 “右键”→ “检查” 打开开发者界面
-
在标签 < style> < /style> 里面的就是css层叠样式表
- {} 左边的就是选择渲染的页面中的对象
- 选择的方法很多,基本的有根据标签,根据类选择,根据 name和 id选择等等,查看CSS选择器
- {} 里面的键值对,在这里,蓝色的部分是属性,白色的部分是值
- 所以页面才会好看
CSS语法
CSS 规则由两个主要的部分构成:选择器,以及一条或多条声明
- 花括号 {}里面的是代码块,语句用 分号 隔开
- 如果一个值的中间有空格隔开,那么需要 引号 把这个值括起来
JavaScript
- JavaScript 是属于 HTML 和 Web 的编程语言
- 对网页行为进行编程
- JavaScript 和 CSS 一样是 HTML 的左膀右臂
- JavaScript 和 Java 是取名蹭热度的关系
- JavaScript 和 Python 一样是动态语言,脚本,语法也非常像
- 通过变量和函数操控、改变页面类容,增加页面的交互功能
- 在 HTML 中,JavaScript 程序由 web 浏览器执行
- 经常写在 < script> < /script> 标签中
JS语法
Python HTTP库 - Requests
Requests 与 re、 beautifulsoup
Requests
官方警告:
- 非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡
- Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用
- 安装
在 cmd 中输入:
pip install requests
-
发送请求,拿到页面响应
-
如果使用循环请求多个页面,最好在每次请求时等待一段时间,导入 random和 time,等待一段随机时间,这里先不举例
# python
import requests
# 发送请求,把回应放入变量 response中
response = requests.get('https://www.youkuaiyun.com/')
print(response)
print(response.status_code) # 状态码 200表示成功
print(type(response)
<Response [200]>
200
<class 'requests.models.Response'>
其它状态码
- 请求成功后,返回了 Response对象,有以下属性
print(dir(requests.Response))
['__attrs__', '__bool__', '__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__nonzero__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setstate__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__',
# 主要看下面的
'apparent_encoding', 'close', 'content', 'is_permanent_redirect', 'is_redirect', 'iter_content', 'iter_lines', 'json', 'links', 'next', 'ok', 'raise_for_status', 'text']
- 输出 Response对象的文本属性
print(response.text)
- 就是网页的 html文档,网页的内容基本都在<> </>标签里面
<!doctype html><html lang="zh" data-server-rendered="true"><head><title>优快云 - 专业开发者社区</title> <meta name="keywords" content="CSD