- 博客(2)
- 收藏
- 关注
原创 Python爬虫-澎湃新闻标题,内容及评论,分词及去停用词,存入Excel
**爬取要求**来自一次作业,要求根据所给事件搜索相关新闻,爬取新闻标题,内容及评论(5条)部分,存入excel,在对其进行分词及去停用词,存入新的excel,因此初次接触选取澎湃新闻为目标,事件“海南一4岁男童被遗忘校车内离世”点开其中一个,容易在局部搜索中定位到标题和内容却发现在爬取过程中,此url下不存在评论内容为当前url为通过全局搜索发现评论内容存放于发现末尾数字一致,考虑截取数字,按固有形式拼接至‘contid=’之后,以此获取评论页url,定位评论代码:from .
2020-10-30 20:06:59
2181
原创 graphviz安装失败-解决方法之一
**1、官网下载graphviz后,安装完成,配置环境bianliang**2.进入cmd,输入dot -version后发现未成功安装测试了网上各种解决方案后没有成功,最后发现是文件缺失问题 导入config6 文件到graphviz安装目录bin下文件可自行创建,以下是文件代码# This file was generated by "dot -c" at time of install.# You may temporarily disable a plugin by removi
2020-10-16 13:42:06
4626
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人