
网络爬虫与数据分析
文章平均质量分 80
李恩泽
敬畏耶和华是智慧的开端;认识至圣者便是聪明(箴九10)。我不是依靠自己的小聪明,我要专心仰赖耶和华,做一个技术的极客!
展开
-
招商银行fintech选拔课题---《基于微博爬虫的舆情分析》上
最近参加了招商银行总行的fintench精英技术训练营的选拔赛,在通过笔试后,进入了课题研究的环节。因为前段时间学习了一段时间Python,所以选择了《基于微博爬虫的舆情分析》这一课题。该课题的具体要求如下:课题背景: 请设计微博爬虫,获取微博上最近N天(N<=10)内与招商银行相关的热点新闻与用户意见,代码可根据输入的天数返回最新的微博信息。在已收集的数据中对提及的重点内容(招行相关产品原创 2017-05-06 10:25:19 · 4924 阅读 · 4 评论 -
招商银行fintech选拔课题---《基于微博爬虫的舆情分析》下
这一篇,我主要介绍一下对爬虫后的微博数据,根据关键词,进行抽取和分析。舆情分析思路流程 信息抽取爬虫得到微博信息存储在weiboData.xls这个EXCEL文件中,我抽取的是5017-05-02开始的最近10天的信息,一共691条微博信息。要想进行舆情分析,就必须对爬虫信息进行抽取。我通关关键词正则匹配的方式,从爬虫得到原创 2017-05-06 11:01:06 · 5529 阅读 · 0 评论