python字符编码

一.文本编辑器和python解释器

##1.文本编辑器存取文件的原理(nodepad++,pycharm,word)
  打开编辑器就打开了启动了一个进程,是在内存中的,所以在编辑器编写的内容也都是存放与内存中的,断电后数据丢失。因而需要保存到硬盘上,点击保存按钮,就从内存中把数据刷到了硬盘上。在这一点上,我们编写一个py文件(没有执行),跟编写其他文件没有任何区别,都只是在编写一堆字符而已。
##2. python解释器执行py文件的原理 ,例如python test.py
   第一阶段:python解释器启动,此时就相当于启动了一个文本编辑器
   第二阶段:python解释器相当于文本编辑器,去打开test.py文件,从硬盘上将test.py的文件内容读入到内存中
   第三阶段:python解释器解释执行刚刚加载到内存中test.py的代码
  
总结:
python解释器是解释执行文件内容的,因而python解释器具备读py文件的功能,这一点与文本编辑器一样
与文本编辑器不一样的地方在于,python解释器不仅可以读文件内容,还可以执行文件内容

二.字符编码的定义

计算器只能识别高低电平(1和0),而人写的是人能识别的代码。字符到数字的过程相当于将代码翻译成计算机能识别的二进制数字的过程,而将二进制数字和字符一一对应的标准就是字符编码

三.字符编码的发展

1.ASCII:

基于英语的标准,一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256个字符。ASCII最初只用了后七位,127个数字,已经完全能够代表键盘上所有的字符了,后来为了将拉丁文也编码进了ASCII表,将最高位也占用了。

2.GBK:

基于中文的标准,:2Bytes代表一个字符
各国定制了符合自己国家语言的编码,日本把日文编到Shift_JIS里,韩国把韩文编到Euc-kr里

3.unicode和utf-8:

为了避免多国语言的冲突,产生了unicode和utf-8。
unicode:统一用2Bytes代表一个字符,2**16-1=65535,可代表6万多个字符,兼容万国语言。但对于通篇都是英文的文本来说,这种编码方式无疑是多了一倍的存储空间。
特点:简单粗暴,所有字符都是2Bytes,优点是字符->数字的转换速度快,缺点是占用空间大,内存中使用unicode。

utf-8:对英文字符只用1Bytes表示,对中文字符用3Bytes。
特点:精准,对不同的字符用不同的长度表示,优点是节省空间,缺点是:字符->数字的转换速度慢,因为每次都需要计算出字符需要多长的Bytes才能够准确表示,硬盘或者网络传输使用utf-8

四.字符编码的使用

1.流程

这里写图片描述

在文本编辑器或者python解释器写入内容是以unicode格式保存在内存中,当保存时,就是对内容进行encode操作,将unicode格式转化为utf-8格式(python3中默认,也可以自己指定为GBK或者其他格式),读文件时,对硬盘中的二进制码进行decode操作,转化为unicode格式读到内存中(存时用什么格式,读时要采用相同格式,否则会出现乱码)

2.python2和python3的区别

(1)python2中有两种字符串类型str和unicode
str类型
当python解释器执行到产生字符串的代码时,会申请新的内存地址,然后将字符串encode成文件开头指定的编码格式。在python2中,str就是编码后的结果bytes,str=bytes,所以在python2中,unicode字符编码的结果是str/bytes。
unicode类型
当python解释器执行到产生字符串的代码时,如果在字符串前加小写字母u,会申请新的内存地址,然后将字符串以unicode的格式存放到新的内存空间中。
对于print需要特别说明的是:当程序执行时,print(x) 这一步是将x指向的那块新的内存空间(非代码所在的内存空间)中的内存,打印到终端,而终端仍然是运行于内存中的,所以这打印可以理解为从内存打印到内存,即内存->内存,unicode->unicode。 对于unicode格式的数据来说,无论怎么打印,都不会乱码,即python3中的字符串与python2中的
u’字符串’,都是unicode,无论如何打印都不会乱码。
(2)python3中也有两种字符串类型str和bytes
str类型是unicode,即存在内存中的类型。
bytes是bytes,即默认存在硬盘中的类型,由unicode格式encode(utf-8或GBK等等)而来。

<think>好的,我现在要解决用户在IAR编译器中遇到的错误:“incomplete type is not allowed”。首先,我需要理解这个错误的含义和常见原因。根据我的知识库,这个错误常发生在代码中使用了未完全定义的类型,比如结构体或联合体声明了但未定义,或者前向声明了某个类型但没有提供完整的定义。 首先,我应该检查用户代码中是否有结构体或联合体的声明但没有定义的情况。比如,如果有一个结构体声明为`struct MyStruct;`,但没有后续的完整定义,那么在需要该结构体大小或成员的地方,编译器就会报这个错误。这时候,需要用户补全结构体的定义,包括成员变量。 其次,检查是否在头文件中只声明了类型而没有包含定义。例如,如果在头文件中使用前向声明,但在使用该类型的源文件中没有包含实际的定义头文件,这也会导致错误。此时,需要确保在使用类型的地方包含了正确的头文件,或者将前向声明替换为完整的定义。 另外,还要考虑typedef的问题。如果用户使用了typedef创建别名,但原始类型未完全定义,同样会引发错误。例如,`typedef struct MyStruct MyType;`之后,如果尝试使用MyType但MyStruct尚未定义,就会出错。需要确保在使用typedef之前,原始类型已经被完整定义。 此外,数组声明中的类型不完整也是一个常见原因。比如声明数组时,如果元素类型未完全定义,编译器无法确定数组的大小,导致错误。需要检查数组声明中的类型是否已经完整定义。 可能还有其他情况,比如在C和C++混合编程时,如果没有正确使用extern "C",或者在头文件中遗漏了必要的包含,也可能导致类型不完整。需要用户检查这些方面。 接下来,我需要将这些可能的原因整理成清晰的解决步骤,并给出具体的代码示例,帮助用户理解如何修改。同时,根据用户提供的引用内容,虽然引用[1]和引用[2]是关于其他错误的,但用户可能希望看到类似的结构,即分点说明解决方案,并引用相关资源。 最后,生成相关问题,帮助用户进一步了解可能相关的编译错误,比如类型未定义、前向声明问题等。这样用户可以有更全面的认识,预防其他类似错误的发生。</think>### IAR编译器错误'incomplete type is not allowed'解决方案 该错误表示代码中使用了**未完全定义的类型**,编译器无法确定其内存布局或成员信息。以下是具体原因及解决方法: #### 1. 结构体/联合体未定义完整 若声明了结构体但未定义成员,在实例化时会报错: ```c struct MyStruct; // 前向声明不完整 struct MyStruct var; // 错误:使用未完成类型 ``` **解决方案**:补全类型定义 ```c struct MyStruct { int id; char name[20]; }; ``` #### 2. 头文件包含缺失 当跨文件使用类型时,需确保定义可见: ```c // file.h struct Data; // 前向声明 // file.c struct Data { // 实际定义 int value; }; ``` **解决方案**:在使用该类型的文件中包含定义头文件 ```c #include "file.c" // 包含实际定义 ``` #### 3. typedef别名问题 使用typedef时原始类型必须完整: ```c typedef struct Node NodeT; // 前向声明 NodeT* ptr; // 允许指针声明 NodeT instance; // 错误:不完整类型 ``` **解决方案**:先完成类型定义再typedef ```c struct Node { int data; struct Node* next; }; typedef struct Node NodeT; ``` #### 4. 数组声明不完整 数组元素类型必须完全定义: ```c struct Element; struct Element arr[10]; // 错误:元素类型未定义 ``` **解决方案**: ```c struct Element { int type; float value; }; struct Element arr[10]; // 合法 ``` #### 调试建议 1. 在IAR工程中搜索错误行号定位问题代码 2. 使用Go to Definition功能追踪类型定义 3. 检查所有头文件包含链 4. 确认没有循环依赖的头文件 编译器需要知道类型的完整信息才能: - 计算sizeof大小 - 分配内存空间 - 访问成员变量 - 进行类型对齐 [^1]: 类似类型转换错误可参考浮点转整型的类型适配问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值