Windows下txt文件的字符编码

本文详细介绍了在Windows操作系统下保存TXT文件时可选择的多种编码格式,包括ANSI、Unicode及其变种、UTF-8等,并解释了这些编码的区别及应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在Windows操作系统下保存txt文件,可选编码有:

ANSI

Unicode

Unicode big endian

UTF-8

 

ANSI

对于0x00-0x7F字符则1个字节代表一个字符。这是ASNI编码与Unicode编码最大的区别。

使用0x80-0xFF范围的2个字节代表一个字符。用来各自文字的延伸。

不同国家和地区制定不同的标准,于是有了GB2312,BIG5,JIS等各自编码标准。

这种使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。

在简体中文系统下,ANSI 编码代表 GB2312 编码。

在日文操作系统下,ANSI 编码代表 JIS 编码。

 

PS:

ANSI编码下,当txt文档中一切字符都在 [C0,DF]、 [80,BF] 这个范围时,notepad都无法确认文档地格式。 而"联通"就是0xC1AACDA8,刚好在上面地范围内,所以不能正常显现。

 

Unicode(统一码、万国码、单一码)

UTF-LE8

UTF-LE16

UTF-LE32

 

Unicode big endian

UTF-BE8

UTF-BE16

UTF-BE32

 

big endian和little endian是CPU处理多字节数的不同方式。

例如“汉”字的Unicode编码是6C49。

那么写到文件里时,究竟是将6C写在前面,还是将49写在前面?

将6C写在前面,就是big endian。

将49写在前面,就是little endian。

 

UTF-8

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值