在使用GitPython包准备爬git文件遇到了好多问题,现记录下解决方案
情况1
File “D:\Anaconda\lib\subprocess.py”, line 1238, in _readerthread
buffer.append(fh.read())
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 41: illegal multibyte sequence
解决方案:
这个只需要点进subprocess.py 的init处修改encoding="utf-8"即可
情况2

这问题需要进去找用到的endswith的函数,根据报错信息我们需要的是字符串而不是字节类型
发现这里的参数是newline,然后去找newline的定义或者赋值

看到这里就明白了,报错的原因是走了else使得newline成了字节类型,不过为啥不能成字节类型作为参数,还要加这个else具体原因就不得而知,可能就是为了报个错?接着我们去找universal_newlines的定义处

原本是False的,我已经修改成了True,当修改完之后,再修改了会儿自己代码的问题,就会发现程序快乐的跑起来了。
这篇博客记录了在使用GitPython进行Git文件操作时遇到的两个问题及其解决方案。首先,针对'gbk'编码错误,通过修改`subprocess.py`中的`init`方法,将`encoding`设置为`utf-8`来解决。其次,由于参数 newline 被错误地转换为字节类型,导致程序无法正常运行。通过查找和修改涉及`endswith`函数的代码,确保`universal_newlines`为`True`,使程序能顺利运行。这两个修复步骤帮助博主成功地解决了问题,使得GitPython包在Windows环境下能够正常工作。





