昨天在研究pandas时候读了一个页面的表格,它出现了很有意思的不对称的[list]结构,也就是说,读出来的信息不注意是发现不了,它是list[1]一段页面开头文字,list[2]是真的表格,list[3]是页面结尾,我一直没想明白怎么把这个莫名长的开头和结尾给去除了,突然发现这个是个list的时候很兴奋,也用type进行了测试,确实是个list,这个情况下,OK,我就取出了list[2]进行DataFrame处理,就解决了表格问题,下一步就是对数据储存到数据库的处理了,所以一定要注意type的问题。
一些小问题(pandas)
在使用Pandas处理网页表格数据时,遇到了一种特殊的不对称[list]结构,通过识别其为list类型并提取list[2]部分,成功解析表格并准备进行数据库储存。此过程强调了检查数据类型的重要性。

被折叠的 条评论
为什么被折叠?



