第一道题(错误最离谱,更新出的问题就是代码是写的真的少)
思路
1requests+ BeautifulSoup 这个两个技术点,查找数一个表格里面的数字,这个核心的点就是考虑0索引的位置
核心的小问题
1requests记得添加s
2headers记住了
3ua中的key和value格式,key一定不要带冒号
4验证结果各种测试用例都去试一下
第二道题
思路
1首先通过request获取到网页
2之后使用jieba分词器进行分词
核心的小问题
1如果遇到不认识的标签一定要已经有的标签往下面找一定要变通
2比赛的时候一定要包全不全,不全的情况下一定要包给添加完毕,这是首要检查的任务
3方法一定要多敲,差不多的方法都要牢记在脑袋中
第三个问题(花费了我三个小时)
思路(花费时间的关键点)
0读清楚题目
1通过requests拿到请求到网页,获取到网页的信息
2通过bs4中BeautifulSoup,首先通过名字配合标签,定位到标签,之后再通过BeautifulSoup中向上查找父节点查找以及兄弟目录查找到需要数据
3解析数据,因为有的数据是带有万的,有的数据是直接有数据
核心问题有三点
1出现问题的时候可以print一下喊他打印到控制台
2当所有的逻辑都对的上的时候,如果在出现问题,不妨再去认真读题(浪费了三十分钟)
3一定要有自主学习的能力,自己找视频看文章差资料,比如如何处理带万的数据
4一定要考虑全面不要只有一个if而不考虑另外一个elseif的结果或者另外的结果
5全局全量,使用混乱的时候,可以换一种解决思路,比如把值传入进去
最核心的问题
1思维必须要灵活,使用先有的知识灵活的运用把问题结局,报错的信息可以print打印出来看一下
2一定要读清楚题目,一定要阅提三遍的好习惯,就像你做功能,总要了解需求吧
3在把代码放到比赛网站进行提交的时候一定要检查包是否导入完毕
4request请求完成之后编码格式真的有必要

被折叠的 条评论
为什么被折叠?



