
知乎
qq_42839893
这个作者很懒,什么都没留下…
展开
-
文本信息挖掘之词云、LDA主题模型——排名在前 1% 的高中生是靠天赋还是靠努力?(知乎)
最近各地的高考成绩刚出,看到各地状元那神仙般的成绩,不由得让我想起知乎上一个一直热度不减的问题——“排名在前 1% 的高中生是靠天赋还是靠努力?”借着上次爬知乎的代码(链接: link.),简单爬了1000多条数据。数据的链接在这里:接下来,就用LDA主题模型来简单探究一下吧!导包import pandas as pdimport reimport jiebaimport matplotlib.pyplot as pltfrom wordcloud import WordCloudfr原创 2020-07-30 21:18:53 · 1284 阅读 · 2 评论 -
python集成代码实现八爪鱼爬取知乎的所有功能+数据预处理
链接: link.上一篇文章(链接在上面)是对每一部分进行较为详细的说明,这一篇文章将介绍爬取的集成好的代码块,以及对爬取来的数据进行预处理。1.python集成代码实现八爪鱼爬取知乎的所有功能```python#!/usr/bin/env python# coding: utf-8import osimport pandas as pdfrom selenium import webdriverfrom lxml import etreeimport timeimport jieba原创 2020-07-30 20:49:42 · 2609 阅读 · 0 评论 -
对标八爪鱼!知乎爬虫集成代码实现!(2020年7月29日)
看知乎这里的各种问题还挺有趣的,心血来潮想研究一下。《爬虫狗头保命》《稍微装一下B》听朋友说八爪鱼这款软件挺好用的,想着瞅一下看看。然而然而!!!看到这里我们郁闷了,旗舰版???接着我就去官网瞅了瞅价格,一个月299?我想想哔哩哔哩会员+爱奇艺会员+知乎会员不过。。@八爪鱼采集器@刘宝强(八爪鱼CEO)二位大爷,我想想哔哩哔哩会员+爱奇艺会员+知乎会员不过。。没有体验版的,对一般群众实在很难说很友好/哭看了看自己日渐消瘦的钱包,还是自己爬吧!接下来我将实现八爪鱼上关于知乎爬虫原创 2020-07-29 11:29:43 · 1699 阅读 · 1 评论