python中seek和tell加上readline遇到的坑

本文探讨了在不同系统间进行文件读取时遇到的问题,特别是在使用readline和seek方法定位文件行时出现的字节偏差现象。通过分析,发现跨系统文件换行符的不同( 与 )导致了这一问题,并提出了解决方案:采用rb模式读取文件,避免系统间的自动换行符转换,确保文件读取的一致性和准确性。

------------------------------------制作背景---------------------------------------

在一开始打算写一个记录行号位置的在数据库的一个小方法

方便以后继续读取这个文件时,可以快速找到文件对应位置

主要用于大文件读写

主要思路大概是如下,首先第一次遍历,记录下行号为1W的字节位置,比如1W行字节位置在x,2W行的字节位置在y

那么在数据存储 1 ----x,2---y,然后下一次想读取第2W行,就可以直接seek(y)然后进行读取

【如果要读取比如两万一千行,也可以直接seek(y),然后一行行readline过去,也可以直接readlines过去,大概就是readlines(3W的字节位置 - 2W的字节位置),直接读取1W行进内存然后自己选择需要的行】

这个主要是思考用于超大文件读取对应行的思路,一般超大文件要么不再进行改动,要么就是末尾增加字符,对于这种字节存储对应行数,不会有太大影响

------------------------------正篇---------------------------------------

在使用readline遍历行号的时候遇到了一个问题

主要就是readline后tell出地址后,用seek转移到对应位置,然后输出的文字不符合

代码如下

filename = "as.log"
with open(filename, 'r') as logFile:
    f = open(filename, 'r')
    for i in range(10):
        logFile.readline()
        temp = logFile.tell()
        print temp
        print logFile.read(1)
        f.seek(temp)
        temp = f.tell()
        print temp
        print f.read(1)
        print
    f.close()

部分运行结果如下

两者tell的地址相同,但是read的东西不同

我就?????

后来发现每过一行,输出的东西位置都会偏差1字节

当时感觉是换行符没有读取到?

后来多次思考

最后阅读这个博客得出一个结论

https://blog.youkuaiyun.com/peng__dada/article/details/79138171

因为我测试读取的文件的书写系统,和我测试代码的系统是不一样的

因此换行符不同

/r/n与/n之间有差距,在r的模式下,会产生自动的替换,因为这个替换把/r/n替换成/n(或者相反,懒得验证了),因此会每读取一行有1字节的偏差

有这个猜想后,根据上面地址的博客

把模式改成不会自动替换的rb模式

结果如下

果然结果正常了

得出结论,如果是跨系统进行文件读取等,需要留意,采用rb模式,不然不同系统的区别会有一些坑

<think>好的,用户想了解Pythonseek函数的用法、使用方法示例。我需要根据提供的引用内容来组织回答。首先,我需要明确seek函数的基本功能,即移动文件指针的位置。引用1提到seek()函数用于移动文件指针到指定位置,而tell()用于获取当前位置。引用3详细说明了参数:offset是偏移的字节数,whence决定起始位置,0是文件开头,1是当前位置,2是文件末尾。 接下来,我需要解释参数的具体含义。whence参数的不同值对应的起始位置需要明确说明,可能还要注意在文本文件二进制文件中这些值的可用性。例如,引用3指出当以文本方式打开文件时,whence只能为0,这可能需要在注意事项中提到。 然后,使用示例部分,用户提供的引用2有一个例子,其中使用了f.seek(0)来回到文件开头。我可以引用这个例子,说明seek(0)的效果。同时,可能需要补充其他例子,比如不同的whence值offset值的组合,比如从文件末尾移动,或者从当前位置移动。 还要注意,用户可能需要知道常见的应用场景,比如重新读取文件内容,或者跳过部分数据。另外,错误处理方面,比如移动超出文件范围是否会导致异常,可能也需要提及。 在结构上,应该先介绍函数的作用参数,再分点详细说明每个参数,然后给出示例代码,并解释每个步骤的效果。最后总结注意事项常见问题。 需要确保回答符合用户的问题,即使用方法、参数解释示例。同时要参考提供的引用内容,正确引用来源,比如引用1、2、3中的信息。检查是否有遗漏的关键点,比如文件打开模式对seek的影响,或者不同Python版本中的行为差异。 最后生成相关问题,帮助用户深入理解,比如处理大文件时的应用,或与readline的配合使用等。</think>### Pythonseek函数详解 #### 一、核心功能 `seek()`函数用于控制文件对象的读写位置指针,实现类似“书签跳转”的操作。通过调整指针位置,可以重复读取文件内容或跳过指定字节的数据[^1][^3]。 #### 二、参数解析 函数定义:`file.seek(offset, whence=0)` - **offset**:偏移字节数(可为正/负值) - **whence**:基准位置(支持三种模式) | 值 | 模式 | 适用场景 | |----|-------------------|----------------------------| | 0 | 文件开头(默认) | 文本/二进制文件 | | 1 | 当前位置 | **仅二进制文件** | | 2 | 文件末尾 | **仅二进制文件** | > 注意:文本模式下使用`whence=1`或`2`会导致`io.UnsupportedOperation`错误 #### 三、使用示例 ##### 1. 基础用法 ```python with open('demo.txt', 'rb+') as f: # 初始位置 print(f.tell()) # 输出: 0 # 跳转到第5字节处 f.seek(5) print(f.read(3)) # 读取第5-7字节 # 相对当前位置回退2字节 f.seek(-2, 1) print(f.read(2)) # 重复读取第5-6字节 # 跳转到末尾前3字节 f.seek(-3, 2) print(f.read()) # 读取最后3字节 ``` ##### 2. 文本文件重置(引用自示例代码[^2]) ```python def rewind(f): f.seek(0) # 重置到文件开头 current_file = open('data.txt') print_all(current_file) # 完整读取 rewind(current_file) # 重置指针 print(current_file.readline()) # 再次读取第一行 ``` #### 四、注意事项 1. 二进制模式下支持全功能定位 2. 文本模式定位后可能因编码问题导致读取错位 3. 使用`f.seek(0, 2)`可快速跳转到文件末尾获取文件大小
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值