
爬虫
拉一酱
这个作者很懒,什么都没留下…
展开
-
文字云图数据画像
文字云图数据画像所需模块jieba、numpy、WordCloud、PIL目标对某视频下的一百条评论进行画像(已经提前将100条评论进行收集,存为txt文档)文字形状为c.jpg(自备)的形状,云朵状from wordcloud import WordCloudimport jiebaimport numpyimport PIL.Image as Imagedef word_jieba(text): #使用精确模式进行分词 wordlist_jieba=jieba.原创 2021-08-15 19:56:41 · 261 阅读 · 0 评论 -
爬虫(二):爬取京东商品信息写入csv文件
爬虫(二)爬取JD商品信息写入csv文件所需模块:csv、sys、time、selenium原创 2021-08-13 19:20:37 · 1477 阅读 · 0 评论 -
爬虫(一):爬取租房信息并写入excel中
爬取租房信息并写入excel中以链家为例```pythonimport requestsfrom lxml import etreeimport timeimport randomimport openpyxlclass LianjianSpider(object): def __init__(self): #定义要爬取的url self.url = 'https://gz.lianjia.com/zufang/tianhe/pg{}/#cont原创 2021-08-11 09:52:31 · 798 阅读 · 0 评论