立即学习:https://edu.youkuaiyun.com/course/play/27328/370719?utm_source=blogtoedu
字符是各种文字和符号的总成,包括国家文字、标点符号、图形符号、数字等。
字符集(character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见的字符集有ascii、sb2312、gb18030、gbk、unicode等
ascii:最简单的西文编码方案,主要用于显示现代英语和其他西欧语言。使用一个字节表示,可表示128字符
gb2312:国家标准简体中文字符集,兼容ascii。使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字
gbk:gb2312的拓展,加入付ifantizi的支持,兼容gb2312.使用2个字节表示,可表示21886个字符
gb18030:解决了中文,日语,朝鲜语等的编码,兼容gbk。采用变字节表示(1ascii,2,4字节)。可表示27484个文字
unicode:国际标准编码字符集,为世界650中语言进行统一编码,兼容iso-8859-1.unicode字符集有多个编码方式,分别是utf-8,utf-16和utf-32
utf8mb4比utf8能多表示emoji
show character set 展示可支持的字符集
数据库:
create database databaseName charset utf8 collate utf8_general_ci
表:
create table tableName(...) default charset =utf8
字段:
create table tableName(...,name varchar(50) not null charset utf8,...)