除了爬取个人简介页面之外,我还学习了什么是HTML,
•指的是超文本标记语言(HyperText Markup Language),它是用来描述网页的一种语言。
•HTML不是一种编程语言,而是一种标记语言(markup language)。
•所谓超文本,有2层含义:
•它可以加入图片、声音、动画、多媒体等内容(超越了文本限制)。
它还可以从一个文件跳转到另一个文件,与世界各地主机的文件连接(超级链接文本)
•HTML页面也称为HTML文档。
<html> html文件开始
<head> html文件的头部开始
<title>html文件的标题</title>
</head> html文件的头部结束
<body> html文件的主体开始
html文件的主体内容……
</body> html文件的主体结束
</html> html文件结束
接下来是div和span的解释。
•<div>标签:是一个区块容器标记,<div>之间是一个容器,可以包含段落、表格、图片等各种HTML元素。
•特点:块级标记,独占一行,换行
•属性:align 控制对齐方式
•属性值:left(向左)默认值, center(居中),right(向右)
•<span>标签:没有实际意义,为了应用样式
•特点:行内标记,位于一行并排显示,不换行
还有有序列表、无序列表、超链接、图片标记、表格标记、表单标记等等。需要特别注意的是表单标记提交的方式
–get:将表单的内容附加到提交地址后面,对提交信息的长度进行了限制,不能超过8192个字符。
post:将用户在表单中填写的数据包含在表单的主体中,一起传送到服务器上的处理程序中,没有字符限制
979

被折叠的 条评论
为什么被折叠?



