- 博客(11)
- 资源 (1)
- 收藏
- 关注
原创 爬取淘宝商品名称及价格
问题:使用request库和re库爬取淘宝网某种商品信息,并打印出其名称和价格 分析: 1.确定淘宝网搜索商品网址及robots协议 2.分析实现步骤: A:使用request库爬取信息 B:使用re库查找信息-findall()函数 C:打印 3.明确实现难点:分页 在确定淘宝网搜索商品网址为:https://s.taobao.com/search?q=?...
2018-06-09 22:27:02
1317
转载 [转载]UserAgent整理
User Agent是浏览器用于 HTTP 请求的用户代理头的值。更换User Agent能更好的模拟出不同的系统和浏览器信息。AndroidNameUser AgentNexus 7 (Tablet)Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like G...
2018-06-08 23:00:38
616
原创 抓取福布斯排行榜
问题:使用request库和BeautifulSoup抓取福布斯排行榜,并将其按照表格形式打印出来 网址:https://www.phb123.com/renwu/fuhao/20802.html 实现:import requestsfrom bs4 import BeautifulSoupimport bs4def getText(url): headers = {'us...
2018-06-07 20:37:34
711
转载 百度大牛总结十条Python面试题陷阱
问题1:请问如何修改以下Python代码,使下面的代码调用类A的show方法?[python] view plain copy print?class A(object): def show(self):&n...
2018-06-06 22:27:23
767
转载 深入浅出:大妈也能看懂的大数据分布式计算
本文是一篇科普性质的文章,希望能通过一个通俗易懂的例子给大家讲清楚大数据分布式计算技术。大数据技术虽然包含存储、计算和分析等一系列庞杂的技术,但分布式计算一直是其核心,想要了解大数据技术,不妨从 MapReduce 分布式计算模型开始。如果你想了解大数据的学习路线,想学习大数据知识以及需要免费的学...
2018-06-05 21:19:31
5192
原创 抓取中国大学排名榜
问题:抓取最好大学网上中国大学排名榜。网址:最好大学网 实现输出: 要求:使用requests库和BeautifulSoup库实现。# scrapy the rank of China universityimport requestsfrom bs4 import BeautifulSoupimport bs4# 获取内容def getText(url): he...
2018-06-04 16:13:56
408
原创 python 100例之例四
题目:输入某年某月某日,判断这一天是这一年的第几天? 解题思路:看到该题的第一反应,是python的calendar函数,但是日历函数中并没有日期计算方法和比较方法,想到了python的datetime函数,在datetime日期时间处理函数中有datetime、date、time三种方法,都有加减功能。输入的是日期,应该用date方法来处理。在处理的过程中本来想直接输入日期,然后将该日期和该年的
2017-11-30 15:20:28
221
原创 python 100例之例三
题目:一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少? 解题思路:此题表面信息量少之又少,看上去很不好解。并且只是说一个整数,并没有给边界,所以自定义边界值为1000,设该数字为x.继续阅题,貌似突破口只有完全平方数,回忆数学中完全平方数的特性,看起来也没有什么明显的突破口。再思考,既然是完全平方数,那么是否可以判断sqrt()后的结果为int类型呢?查阅
2017-11-29 16:35:08
577
原创 python 100例之例二
题目:企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%;20万到40万之间时,高于20万元的部分,可提成5%;40万到60万之间时高于40万元的部分,可提成3%;60万到100万之间时,高于60万元的部分,可提成1.5%,高于100万元时,超过100万元的部分按1%提成,从
2017-11-28 20:02:22
240
原创 python 100例之例一
题目:有1、2、3、4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? 解题思路:第一步,将四个数字组成三位数,百位、十位、个位都有可能出现四个数字中的一个,总共有64种,使用嵌套for循环即可以实现;第二步,在三位数字中去重,即百位出现的数字不能出现在十位、个位,同理十位出现的不能出现在百位、个位,个位出现的不能出现在百位、十位,用程序表示如百位为a,十位为b,个位为c,则a!=b
2017-11-27 12:37:48
1419
原创 修改了JS页面,Appscan重新测试时仍能够扫描出问题
项目要求进行安全扫描,指定使用神器Appscan。在扫描过程中报出一个高级安全漏洞,基于 DOM 的跨站点脚本编制。报错页面是一个js页面,代码如下: 将问题报给开发后,开发将该行删除,使用浏览器访问发现,该js代码已更新,如下: 但是在Appscan重新测试时,仍报出同样问题,仍是该行代码。 反复查找原因,仍未找到解决办法。最终重新手动探索,再次测试时,发现没有该问题了。对比两次探索
2017-10-26 17:40:39
2550
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人