
爬虫
浪子私房菜
这个作者很懒,什么都没留下…
展开
-
【无敌浪子】python爬取足球赛事数据
python爬虫前言某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码。我拍腿正坐,一个想法油然而生:“生活已然很无聊,不如再无聊些叭”。于是,我决定开一个专题,便称之为无敌浪子的无聊小发明。 妙…啊~~~一、代码分析前几天实验室中貌美如花的老师问我可以做爬虫嘛,凭借大学学过爬虫一点皮毛要说会哦, 于是凭借本人精通java开发,利用java语言便可轻松地对网页数据进行爬取并处理。一、首先定义相关网页配置文件// 设置指定键对值的系原创 2020-11-29 14:14:07 · 4714 阅读 · 1 评论 -
python爬虫之requests and BeautifulSoup
1. 爬虫的本质是什么?模拟浏览器的行为,爬取网页信息2. requests**2.1 get请求**无参数实例import requestsret = requests.get("http://github.com/timelime.json")print(ret.text)有参数实例import requestsret = requests.get("http://httpbin.org/get",params={'key':1})print(ret.text)**2.原创 2020-08-12 15:29:28 · 436 阅读 · 0 评论 -
python爬虫基础知识及前期准备
python爬虫基础知识及前期准备学习爬虫有一小段时间了,于是决定把自己学爬虫时所学的,写过的代码以及看过的文档记录下来,权当小结。第一次写这些,如果有错误,请多指教。首先我们需要了解一下什么是爬虫。根据百度百科上给出的定义,” 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。“简单来说,爬虫类似手动下载网页信息,比如小说、歌曲。说到这,或许会有疑问,既然这样,干嘛还去敲代码,直接人工处理不好吗?话是这么说原创 2020-08-11 17:32:35 · 336 阅读 · 0 评论