HTML-1.1-HTML的介绍

本文深入探讨了HTML的基础知识,包括其定义、作用、历史变迁及网络术语,并详细讲解了计算机编码体系,如ASCII、ANSI、GBK、Unicode、UTF-8等,以及如何避免乱码问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一:HTML概述

  • html全称为 HyperText Markup Language,超文本标记语言
    • 不是一种编程语言,是一种描述性的标记语言,用来描述超文本中内容的显示方式
      • 比如字体颜色和大小
  • html是一个纯文本文件(就是用txt文件改名而成的),用一些标签来描述文字的语义
    • 这些标签在浏览器里面是看不到的,所以称为“超文本”,超文本标记语言
  • 学习html的标签对
    • 标签对能给文本不同的语义
    • h1标签是为了给文本增加主标题的语义
  • 注意:
    • HTML语言不是一个编程语言(有编译过程),而是一个标记语言(没有编译过程),HTML页面直接由浏览器解析执行

二:HTML的作用

  • HTML是负责描述文档语义的语言
    • 除了语义,其他什么都没有

三:HTML的历史

  • HTML2.0
  • HTML3.2
  • HTML4.0
  • XHTML1.0
    • 目前网页中常用
    • XHTML:Extensible Hypertext Markup Language,可扩展超文本标记语言
    • XHTML的主要目的是取代HTML,是HTML的升级版本
    • XHTML和HTML4.0的标记基本一致
    • XHTML是严格的、纯净的HTML
  • XHTML1.1
  • XHTML2.0
  • HTML5

四:HTML的网络术语

  • 网页
    • 有各种标记组成的一个页面叫做网页
  • 主页(首页)
    • 一个网站的起始页面或者导航页面
  • 标记
    • <p>称为开始标记,</p>称为结束标记,也叫标签
      • 每个标签都规定好了特殊含义
  • 元素
    • <p>内容</p>称为元素
  • 属性
    • 给每一个标签所做的辅助信息
  • XHTML
    • 符合XML语法标准的HTML
  • dhtml
    • dynamic,动态的
      • javascrip + css + html 合起来的页面就是一个dhtml
  • http
    • 超文本传输协议,用来规定客户端浏览器和服务端交互时数据的一个格式
  • SMTP
    • 邮件传输协议
  • ftp
    • 文件传输协议

五:计算机编码的介绍

  • 计算机只能处理二进制数据,不能直接存储文字

1、ASCII码

  • 是由美国发发布的,用一个字节(8位二进制)来表示一个字符,共可以表示2^8=256个字符
    • 只能表示0-9,a-z,A-Z特殊符号

2、ANSI编码

  • 每个国家为了显示本国的语言,都对ASCII码进行了扩展
  • 用2个字节(16位二进制)来表示一个汉字,共可以表示2^16=65536个汉字
  • 中国的ANSI编码是GB2312编码(简体),对6763汉字进行编码,含600多特殊字符
  • 日本的ANSI编码是JIS编码
  • 台湾的ANSI编码是BIG5编码(繁体)

3、GBK

  • 对GB2312进行了扩展,用来显示罕见,古老的汉语文字
  • 现在已经收录2.1万左右
  • 并提供了1890个汉字码位
  • K的含义就是“扩展”

4、Unicode编码(统一编码)

  • 用4个字节(32位二进制)来表示一个字符,效率太低
  • 字母A用ASCII表示的话一个字节就够了,可是用Unicode编码的话,得用4个字节表示,造成了空间的极大浪费
    • A的ASCII是65,a的ASCII是97,大小写字母相差32
    • 小写字母排在大写字母后面
    • A的Unicode编码是 0000 0000 0000 0000 0000 0000 0100 0000

5、UTF-8(Unicode Transform Format)编码

  • 根据字符的不同,选择其编码的长度
    • 一个字符A用1个字节表示
    • 一个汉字用2个字节表示

6、中文能够使用的两种字符集

  • UTF-8
    • UTF-8 是国际通用字库,里面涵盖了地球上所有的人类的语言文字
      • 阿拉伯文、汉语
        鸟语
  • GBK
    • GBK是对GB2312进行了扩展,是国标,是中国的字库,里面仅涵盖了文字和一些常用外文
      • 日文片假名和常见的符号
  • 字符规模
    • UTF-8(字全) > GB2313(只有汉字)

7、避免乱码

  • 我们用meta标签声明的当前这个html文档的字符,一定要和保存的文件编码类型一样,否则乱码
  • 当我们不设置的时候,sumblime默认类型就是UTF-8
  • 一旦更改为GB2312的时候,就一定要记得设置一下sunlime的保存类型
    • 文件 -> set File Encoding to -> Chinese SimplFied(GBK)

8、UTF-8和GB2313的比较

  • 保存大小
    • UTF-8(更臃肿,加载更慢) > GB2312(更小巧,加载更快)
  • UTF-8:字多,有各种国家的语言,但是保存尺寸大,文件臃肿
    • 每个汉字多一个byte,所以5000个汉字,多5kb
    • 新华网藏语频道,保证字符集的数量
  • GB2312:字少,只有中文和少数外语和符号,但是尺寸小,文件小巧
    • QQ网、网易、搜狐,追求显示速度

六:HTML颜色介绍

1、颜色表示

  • 纯单词表示
    • red, green, blue, orange, gray
  • 10进制表示
    • rgb(255,0,0)
  • 16进制表示
    • #FF0000, #0000FF, #00FF00

2、RGB色彩模式

  • 自然界中所有颜色都可以用红、绿、蓝(RGB)这三种颜色波长的不同强度组合而得,这就是人们成说的三原色原理
  • RGB三原色也叫加色模式,当把不同光的波长加到一起的时候,可以得到不同的混合色
    • 红+绿=黄色, 红+蓝=紫色, 绿+蓝=青
  • 在数字视频中,对RGB三原色进行了8位编码就构成了大约1678万种颜色
    • 这就是真彩色,所有显示设备采用的是RGB色彩模式
  • RGB各种256级(0-255)亮度,256级的RGB色彩总共能组合出约1678万种色彩
    • 256 *256 *256=16777216
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值