指针变量占用内存的大小

本文详细解析了指针大小与CPU寻址位数之间的关系,并解释了不同配置下指针大小的变化原因。指出指针大小并非由字长决定,而是取决于当前CPU运行模式的寻址位数。

转自:http://blog.sina.com.cn/s/blog_4fd9844201010n3v.html

     应该说这是一个非常基础的问题,教科书上说指针大小和机器字长相同,即32位机指针长度为4字节!但是对不对呢?为什么是这样?

  搜了一下相关资料。。。居然发现回答不统一,很多人也同样是糊里糊涂。

下面对这个问题做一个系统的整理和分析:

  首先,介绍几个基本概念:(主要摘自百度百科)

  字长:在同一时间中处理二进制数的位数叫字长。通常称处理字长为8位数据的CPU叫8位CPU,32位CPU就是在同一时间内处理字长为32位的二进制数据。二进制的每一个0或1是组成二进制的最小单位,称为一个比特(bit)。

  一般说来,计算机在同一时间内处理的一组二进制数称为一个计算机的“字”,而这组二进制数的位数就是“字长”。字长与计算机的功能和用途有很大的关系,是计算机的一个重要技术指标。字长直接反映了一台计算机的计算精度,为适应不同的要求及协调运算精度和硬件造价间的关系,大多数计算机均支持变字长运算,即机内可实现半字长、全字长(或单字长)和双倍字长运算。在其他指标相同时,字长越大计算机的处理数据的速度就越快。早期的微机字长一般是8位和16 位,386以及更高的处理器大多是32位。目前市面上的计算机的处理器大部分已达到64位。

  字长由微处理器(CPU)对外数据通路的数据总线条数决定。

  最小可寻址单位:内存的最小可寻址单位通常都是字节。也就是说一个指针地址值可对应内存中一个字节的空间。

  寻址空间:寻址空间一般指的是CPU对于内存寻址的能力。CPU最大能查找多大范围的地址叫做寻址能力,CPU的寻址能力以字节为单位 (字节是最小可寻址单位),如32位寻址的CPU可以寻址2的32次方大小的地址也就是4G,这也是为什么32位寻址的CPU最大能搭配4G内存的原因,再多的话CPU就找不到了。

  这里CPU的寻址位数是由地址总线的位数决定,32位CPU的寻址位数不一定是32位,因为32位CPU中32的意义为字长。

  有关寻址范围计算解释,对于32位寻址的CPU,其地址值为32位的二进制数,所以可以表示的最大地址为2的32次方(即4G,最大内存空间为4GB,这里G表示数量、GB表示容量)。同时我们不难看出,一个指针的值就是一个32位的二进制数,32位对应4字节(Byte)。所以,指针的大小实际上是由CPU的寻址位数决定,而不是字长

 

再来分析一下如下的情况:

  32位处理器上32位操作系统的32位编译器,指针大小4字节。
  32位处理器上32位操作系统的16位编译器,指针大小2字节。  
  32位处理器上16位操作系统的16位编译器,指针大小2字节。
  16位处理器上16位操作系统的16位编译器,指针大小2字节。

这从结果看起来指针的大小和编译器有关??

  实际不是这样的,有这样的结果是因为以上几种情况,处理器当前运行模式的寻址位数是不一样的,如下:

  Intel 32位处理器32位运行模式,逻辑寻址位数32,指针也就是32位,即4个字节
  Intel 32位处理器16位虚拟机运行模式,逻辑寻址位数16,指针也就是16位,即2个字节

  编译器的作用是根据目标硬件(即CPU)的特性将源程序编译为可在该硬件上运行的目标文件。如果一个编译器支持某32位的CPU,那么它就可以将源程序编译为可以在该CPU上运行的目标文件。该源程序中指针大小也会被编译器根据该CPU的寻址位数(如32位)编译选择为4字节。

 

  综上可得:指针大小是由当前CPU运行模式的寻址位数决定!

<think>嗯,用户问的是如何在Python中获取变量占用内存大小。这个问题我之前了解过一些,但可能需要更详细的整理。首先,我得回想一下有哪些常用的方法。 首先,Python标准库中有没有相关的模块呢?对了,sys模块里有个getsizeof函数。这个函数可以返回对象的字节大小。不过需要注意的是,像列表、字典这样的容器类型,getsizeof只会返回容器本身的大小,不会包括里面元素所占用内存。比如说,一个列表里面有很多元素,每个元素的大小需要单独计算,然后总和起来加上列表本身的大小才是总内存占用。所以用户如果直接对列表使用sys.getsizeof,得到的结果可能比实际小很多。 那有没有第三方库可以更准确地计算内存占用呢?我记得有一个叫pympler的库,里面的asizeof函数可以递归计算容器内所有元素的内存大小。这样的话,对于嵌套结构的数据会更准确。不过需要用户先安装这个库,可能不是所有人都愿意这么做。 另外,还有objgraph模块,不过这个可能更多用于内存泄漏的检测,虽然也能查看内存信息,但可能不太直接。所以可能还是sys和pympler更常用。 接下来,我应该考虑用户的使用场景。如果用户只是需要快速查看简单变量内存大小,sys.getsizeof就足够了。但如果需要处理复杂的数据结构,比如嵌套列表或字典,可能需要推荐pympler的asizeof方法。同时,还要提醒用户注意,不同的Python解释器和版本可能会有差异,比如在64位系统和32位系统下,指针大小不同,会影响结果。 另外,可能有些用户不知道如何安装第三方库,所以需要给出安装命令,比如pip install pympler。然后通过示例代码来演示两种方法的不同之处,这样用户能更直观地理解。 还要注意一些常见的误区,比如对于字符串或数字,直接使用sys.getsizeof是准确的,但对于容器,必须递归计算。例如,一个包含多个整数的列表,每个整数的大小需要单独计算,再加上列表本身的开销。 最后,应该总结一下两种方法的适用场景,帮助用户根据需求选择合适的方法。同时提醒他们,内存计算可能因为Python的内存管理机制(如引用计数、内存池)而复杂化,实际内存占用可能与计算结果有差异。</think>在 Python 中获取变量占用内存大小,可以通过以下两种方法实现: --- ### 方法 1:使用 `sys.getsizeof` **适用场景**:简单数据类型(如整数、字符串)或浅层容器 ```python import sys # 示例 1:基础类型 num = 42 print(f"int 类型占用内存:{sys.getsizeof(num)} 字节") # 输出 28 字节(Python 3.10) # 示例 2:字符串 s = "Hello" print(f"字符串占用内存:{sys.getsizeof(s)} 字节") # 输出 54 字节 # 示例 3:列表(仅容器本身) lst = [1, 2, 3] print(f"列表容器本身的内存:{sys.getsizeof(lst)} 字节") # 输出 88 字节 ``` ⚠️ **注意**: - `sys.getsizeof` 只计算对象直接占用内存,不会递归计算容器内元素的占用(如列表中的元素)。 --- ### 方法 2:使用 `pympler.asizeof`(推荐) **适用场景**:复杂数据结构(如嵌套字典、列表) 需先安装库: ```bash pip install pympler ``` 示例代码: ```python from pympler import asizeof # 示例 1:简单列表 lst = [1, 2, 3] print(f"列表总内存:{asizeof.asizeof(lst)} 字节") # 输出 248 字节(包含元素) # 示例 2:嵌套字典 data = { "users": [ {"id": 1, "name": "Alice"}, {"id": 2, "name": "Bob"} ] } print(f"嵌套字典总内存:{asizeof.asizeof(data)} 字节") # 输出 1360 字节 ``` ✅ **优点**: - 递归计算所有子元素的内存 - 支持自定义对象、类实例等复杂结构 --- ### 关键原理说明 1. **对象开销** Python 中每个对象都有固定开销(如引用计数、类型指针),例如一个空列表占用 56 字节(CPython 3.10)。 2. **容器类型的特殊性** ```python # 空列表:56 字节 # 含 3 个整数的列表:56 + 3*28 = 140 字节(理论值) # sys.getsizeof([1,2,3]) 实际输出 88(仅容器) ``` 3. **字符串内存优化** Python 会对短字符串进行驻留(intern),相同内容的字符串可能共享内存。 --- ### 总结建议 - 简单场景用 `sys.getsizeof` - 复杂场景用 `pympler.asizeof` - 注意 Python 解释器的内存管理特性(如预分配、共享引用)可能导致测量值与实际物理内存不一致。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值