前端小结,简洁易懂

本文概述了HTML、CSS和JavaScript的基础知识,强调它们在网页构建中的作用。此外,详细介绍了Python的Requests库用于HTTP请求,结合正则表达式和BeautifulSoup解析网页内容,并展示了如何将提取的数据保存为CSV文件。最后提到了更复杂的网页交互技术,如网络API、请求头、Cookies以及自动化工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

HTML

  • 超文本标记语言 (Hyper Text Markup Language)
  • 一种标记语言
  • 不是编程语言
  • 使用标记标签来描述网页
  • HTML 文档 = 网页
  • 标签名来自于英语,很好记
例如:
	<html> 描述网页的文本 </html> 
	<body> 可见的页面内容 </body> 
	<h1> 标题 </h1> 
	<p> 段落 </p> 

HTML 与 CSS、 JavaScript

  • HTML 定义网页的内容
  • CSS 规定网页的布局
  • JavaScript 对网页行为进行编程

在这里插入图片描述

CSS

CSS 指层叠样式表 (Cascading Style Sheets)

  • 定义如何显示 HTML 元素

  • HTML 原本只是定义文档内容

  • CSS 来定义布局和外观

  • 网页的 css一般写在< head> < /head >里面

  • 在页面按 F12或 “右键”→ “检查” 打开开发者界面

在这里插入图片描述

  • 在标签 < style> < /style> 里面的就是css层叠样式表

    • {} 左边的就是选择渲染的页面中的对象
    • 选择的方法很多,基本的有根据标签,根据类选择,根据 name和 id选择等等,查看CSS选择器
    • {} 里面的键值对,在这里,蓝色的部分是属性,白色的部分是值
    • 所以页面才会好看

在这里插入图片描述

CSS语法

CSS 规则由两个主要的部分构成:选择器,以及一条或多条声明

  • 花括号 {}里面的是代码块,语句用 分号 隔开
  • 如果一个值的中间有空格隔开,那么需要 引号 把这个值括起来

花括号包围声明

JavaScript
  • JavaScript 是属于 HTML 和 Web 的编程语言
  • 对网页行为进行编程
  • JavaScript 和 CSS 一样是 HTML 的左膀右臂
  • JavaScript 和 Java 是取名蹭热度的关系
  • JavaScript 和 Python 一样是动态语言,脚本,语法也非常像
  • 通过变量和函数操控、改变页面类容,增加页面的交互功能
  • 在 HTML 中,JavaScript 程序由 web 浏览器执行
  • 经常写在 < script> < /script> 标签中

在这里插入图片描述

JS语法

JS 教程 & 案例

 

Python HTTP库 - Requests

Requests 与 re、 beautifulsoup

Requests

官方警告:

  1. 非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡
  2. Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用
  • 安装
在 cmd 中输入:
	pip install requests
  • 发送请求,拿到页面响应

  • 如果使用循环请求多个页面,最好在每次请求时等待一段时间,导入 random和 time,等待一段随机时间,这里先不举例


# python
import requests

# 发送请求,把回应放入变量 response中
response = requests.get('https://www.youkuaiyun.com/')
print(response)
print(response.status_code)  # 状态码 200表示成功
print(type(response)


<Response [200]>
200
<class 'requests.models.Response'>

其它状态码
在这里插入图片描述

  • 请求成功后,返回了 Response对象,有以下属性
print(dir(requests.Response))

['__attrs__', '__bool__', '__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__nonzero__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setstate__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 

# 主要看下面的
'apparent_encoding', 'close', 'content', 'is_permanent_redirect', 'is_redirect', 'iter_content', 'iter_lines', 'json', 'links', 'next', 'ok', 'raise_for_status', 'text']

  • 输出 Response对象的文本属性
print(response.text)
  • 就是网页的 html文档,网页的内容基本都在<> </>标签里面

<!doctype html><html lang="zh" data-server-rendered="true"><head><title>优快云 - 专业开发者社区</title> <meta name="keywords" content="CSD
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值