二进制数据与数据库基础:存储、操作与应用
在数据处理的世界里,数据的存储和读取方式至关重要。有时候,我们需要将数据以人类难以直接阅读的格式存储,主要有以下三个原因:
1. 大小因素 :像字符串 “10239472” 长度为 8 字节,而它所代表的 32 位整数在内存中仅需 4 字节。对于小数据集而言,这可能无关紧要,但在处理大数据集,或者数据需要在磁盘与内存、不同计算机之间传输时,这就变得十分关键。
2. 速度考量 :对整数 34 和 56 进行加法运算,只需一次机器操作;而对字符串 “34” 和 “56” 所代表的值进行加法运算,则需要数十次操作。大多数读写文本文件的程序会使用类似 int 或 float 这样的函数将文件中的值转换为二进制数据。如果需要多次处理数据,避免反复支付转换成本是很有必要的。
3. 缺乏更好的方式 :虽然可以将图像表示为 ASCII 艺术,但对于声音或视频,这样做虽然可行,但并不明智。
无论最终如何存储数据,都需要有人将数字温度计的信号转换为数字。这些信号通常以 1 和 0 的流形式到达,而前面提到的位运算几乎肯定会用于进行转换。
读写二进制数据
在 Python 中,若使用 open("filename", "r") 打开文件进行读取,Python 会假定我们要从文件中读取字符串。它会进行以下操作:
- 向操作系统询问默认字符编码(通常是 UTF - 8)。
- 使用该编码将字节转换为字符。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



