- 博客(4)
- 收藏
- 关注
原创 python晋江文学城数据分析——简单的可视化(pyecharts)
本节用pyecharts对一些非数值的数据进行初步的较为简单的可视化。
2023-04-10 10:21:45
2876
6
原创 python晋江文学城数据分析——标签关联规则分析(Apriori算法+R语言)
在学R语言购物篮分析,突然联想到虽然标签算不得商品,但和商品很相似,可以看看作者设置标签时喜欢把什么标签放一块。由于前文一直用的是python,所以准备接着用python,但是整体弄下来后,发现在可视化方面python完全没有R语言多样,所以也用R语言做了关联规则分析。1python 参考python数据分析 - 关联规则Apriori算法_python apriori算法_你干嘛,哎呦!的博客-优快云博客 分析只针对标签这一属性下的数据。
2023-04-07 16:36:21
1678
2
原创 python晋江文学城数据分析(一)——爬虫(BeautifulSoup正则)
回忆性文章,其实过程中遇到过很多问题和困难,但暂时只想起这些了。待改善的地方:1)爬取太慢,爬取250页花费近10个小时,看网上有多进程、多线程可以加快爬虫时间,之后有时间当学习改进;2)正则表达式不够精确,部分详情页爬取出来不是目的数据,因为错误的数据量不多,后续数据处理采取了直接删除的办法,之后可以在爬虫阶段尝试改进;
2023-04-06 18:34:55
7213
21
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人