html基础
- 常用标签
<!DOCTYPE html>
<!--
!DOCTYPE - 版本说明
-->
<!--
html基本结构
head - 头部
body - 内容
-->
<!--
标签语法:单标签和双标签
<标签名></标签名>
<标签名 /> <标签名>
-->
<html>
<head>
<!-- 设置编码方式 -->
<meta charset="utf-8" />
<!-- 设置网页标题 -->
<title>网页标题</title>
<!-- 设置网页图标 -->
<!--
link 导入外部文件
rel 设置导入文件的作用 icon- 图标 stylesheet-样式表
type 设置被导入的文件的类型:文件类型/文件后缀 image/png
href - 被导入的文件路径
-->
<link rel="icon" type="image/png" href="./img/01.png" />
</head>
<body>
<h1>hello world</h1>
<p>这是一个段落</p>
<span>行内文字1<span>
<span>行内文字2<span>
<!--
br 换行
空格 (一个像素)
  空格 (一个空格)
-->
<p>
这是一个段落<br>
这是一个段落  
</p>
<p>这是一个段落  </p>
<p><b>段落</b></p>
<!--
加粗: b / strong
斜体 : i /
-->
<p><i>段落</i></p>
<!-- 图片标签 -->
<img src="img/02.png" />
<img src="img/01.png" title="鼠标悬停时显示的文字" alt="图片加载失败的时候显示的文字">
<!-- target _self 再当前页面显示新的页面 / _blank在新的窗口显示 -->
<a href="https://www.baidu.com" target="_blank">百度</a>
<br>
<a href="https://www.baidu.com">
百度
<img src="img/01.png" />
</a>
</body>
</html>
- 表单相关标签
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>表单标签</title>
</head>
<body>
<!-- 表单标签 -->
<!-- 用来对表单中相关标签进行重置和提交,单独使用无价值 -->
<form action="" method="post">
<!-- 表单相关标签 -->
<!-- 2.1 input 标签
type 默认text 普通文本输入框
-->
普通文本输入框:<input type="text" name="" id="username" value="" placeholder="请输入姓名" /><br />
<!--
value属性 - 输入框中的内容
placeholder - 输入提示信息
-->
密码输入框:<input type="password" name="" placeholder="请输入密码" /><br />
<!--
单选按钮需要通过label标签来提供选项,当label的for和input的id一直,点击label可以选中input
如果希望选项中有且只有一个选项处于选中状态,需要将多个选项的name属性设置成相同的值
-->
单选按钮:<input type="radio" name="sex" id="sex1" value="男" checked="checked" /><label for="sex1">男</label>
<input type="radio" name="sex" id="sex2" value="女" /><label for="sex2">女</label><br>
复选按钮:<input type="checkbox" name="" id="ball1" value="" /><label for="ball1">篮球</label>
<input type="checkbox" name="" id="ball2" value="" /><label for="ball2">足球</label>
<input type="checkbox" name="" id="ball3" value="" /><label for="ball3">羽毛球</label>
<br>
普通按钮:<input type="button" name="" id="" value="普通按钮" /><br>
<!-- 重置同一个form标签里的内容 -->
重置按钮:<input type="reset" name="" id="" value="重置" /><br>
颜色选择器:<input type="color" name="" id="" value="" /><br>
文件选择:<input type="file" name="" id="" value="" /><br>
时间选择:<input type="time" name="" id="" value="" /><br>
日期选择:<input type="date" name="" id="" value="" /><br>
本地日期时间选择:<input type="datetime-local" name="" id="" value="" /><br>
</form>
<!-- 多行文本输入框 -->
<textarea rows="20" cols="600" placeholder="请输入评论内容" ></textarea>
<!-- 下拉列表 -->
城市选择:<select name="city">
<option value="成都市">成都市</option>
<option value="达州市">达州市</option>
<option value="南充市">南充市</option>
<option value="巴中市">绵阳市</option>
<option value="攀枝花">攀枝花</option>
</select>
<!-- 列表 -->
<!-- 有序列表 -->
<ol>
<li>Python</li>
<li>java</li>
<li>h5</li>
<li>ui</li>
<li>物联网</li>
</ol>
<!-- 无序列表 -->
<ul>
<li>Python</li>
<li>java</li>
<li>h5</li>
<li>ui</li>
<li>物联网</li>
</ul>
<!-- div标签 -->
<div id="">
</div>
</body>
</html>
-
requests的使用
import requests # 1.获取指定网页数据 (发送请求且返回) response = requests.get('https://www.sohu.com/') # 设置编码方式 response.encoding = 'utf-8' # 2.获取请求内容 print(response) # <Response [200]> # 在请求成功的时候获取王国也源代码 # if response.status_code == 200: # print(response.text)
作业
"""
Time:2021/5/24 16:47
Author:Spectre
"""
import requests
# 1.获取指定网页数据 (发送请求且返回)
response = requests.get('https://www.sohu.com/')
# 设置编码方式
response.encoding = 'utf-8'
# 2.获取请求内容
print(response) # <Response [200]>
# 在请求成功的时候获取王国也源代码
# if response.status_code == 200:
# print(response.text)
import re
from re import *
re_str = r'(?s)<div class="focus-news">.*<div class="right sidebar">'
result1 = re.findall(re_str,response.text)
# re_str2 = r'title=\"[\u4e00-\u9fa5]+\" | title=\"[\u4e00-\u9fa5]+[·、 ][\u4e00-\u9fa5]+\"'
re_str2 = r'title=.+?"'
# re_str2 = r'<a href=".*".*</a>'
result2 = re.findall(re_str2,str(result1))
print(result2)
re_str3= r'<a href=".*?"'
result3 = re.findall(re_str3,str(result1))
print(result3)
# print(len(result2))
# len(result3))