初学python遇到的问题大全

本文分享了作者使用Python进行数据爬取的经历,包括解决etree模块兼容性问题、使用pandas处理数据以及Python语法规范等常见问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我真的是一个超级超级无敌小白,最近关注了一个特别好的数据分析的公众号,定时会给一些有趣的数据分析和代码,因此准备在国庆实践一下的,结果一拖就是一周到了今天……上午终于实现python爬取数据了。

    • 关于python的配置,网上一抓一大把(配置太久,我都忘了……),我用的是sublime text来写
    • 在sublime text中运行python(需要交互的话),需要通过tools -> sublimeREPL -> python -> RUN current files
    • 第一个问题出现在此处:
      page = requests.get(url.format(i)).content
      selector = etree.HTML(page)
      这个etree在lxml包里,但是最新版本(4.4)的包(通过 pip install lxml直接安装的)里面已经没有了,因此我用的是 3.7.3版本的(我的python是3.6.1版本的),通过百度知道的方法安装即可。
      注意:page需要加“.content”,目的是将Unicode的类型转化为Bytes,因为etree.html()只能处理string类型的
    • 第二个问题:因为要使用数据框架,所以需要引入pandas包(使用里面的DataFrame函数)——如果直接install会很慢,可以使用豆瓣源”pip install -i https://pypi.douban.com/simple pandas“ (可以直接将默认设为豆瓣源,)
    • 第三个问题:python语法非常严格,对于空格要求也很严格:IndentationError: unexpected indent 这句话的意思就是:出现了没必要的缩进,找到地方,把空格删掉就好了
    • 现在回头一看,其实就这么几个小问题……竟然花了很多时间……
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值