
Python爬虫
geekfly
知识改变命运
展开
-
Mac OS安装PhantomJS及Selenium中调用
1. PhantomJS是什么?说人话就是:无界面浏览器PhantomJS是一个基于webkit的JavaScriptAPI。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。任何你可以在基于webkit浏览器做的事情,它都能做到。它不仅是个隐形的浏览器,提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等,同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。PhantomJS的用处可谓非原创 2021-08-20 11:51:52 · 732 阅读 · 0 评论 -
Python3.6+Beautiful Soup+csv 爬取豆瓣电影Top250
豆瓣电影 Top 250:https://movie.douban.com/top250?start=0&filter=Beautiful Soup:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html注:本文获取内容全部使用Beautiful Soup的select方法,使用css选择器。有html...原创 2019-04-10 20:55:27 · 2129 阅读 · 3 评论 -
Python3.6+jieba+wordcloud 爬取豆瓣影评生成词云
在上一篇介绍了如何通过Python爬虫抓取豆瓣电影榜单。Python3.6+Beautiful Soup+csv 爬取豆瓣电影Top250此篇博客主要抓取豆瓣某个电影的影评,利用jieba分词和wordcloud词云生成影评词云。下文以电影无名之辈为例:https://movie.douban.com/subject/27110296/comments?start=0&limit=...原创 2019-04-13 16:30:06 · 1844 阅读 · 0 评论