- 博客(306)
- 资源 (4)
- 收藏
- 关注
原创 2021最漂亮的5张可视化图
Link: https://towardsdatascience.com/the-10-best-data-visualizations-of-2021-fec4c5cf6cdbAutho...
2021-11-17 08:30:00
1197
原创 用matplotlib绘制体重变化十年趋势图
author: Quantified Bobsrc: https://www.quantifiedbob.com/body-composition-data-visualization/每...
2021-10-30 08:00:00
1753
原创 Shifterator库 | 词移图分辨两文本用词风格差异
以往对比两个文本数据差异,比较简单的技术实现方法是生成两文个词云图,但是词云图无法直观显示词语层面的权重。Shifterator包提供了构建词移图的功能,垂直条形图可以量化哪些词会导致两个...
2021-10-28 08:30:00
918
1
原创 视频专栏课 | Python网络爬虫文本分析
试看&购买支持开票先试看再购买可免费试看22节,含全部python语法、部分爬虫、个别文本分析为何要学Python?在科学研究中,数据的获取及分析是最重要的也是最棘手的两个环节!在...
2021-10-20 11:26:36
1306
3
原创 SmartScraper | 简单、自动、快捷的Python网络爬虫
腾讯课堂 | Python网络爬虫与文本数据分析SmartScraper使页面数据抓取变得容易,不再需要学习诸如pyquery、beautifulsoup等定位包,我们只需要提供的ur...
2021-10-14 08:00:00
669
原创 DataShare | 6000+个股票的每日财经新闻
整理自https://www.kaggle.com/miguelaenlle/massive-stock-news-analysis-db-for-nlpbacktestshttps://...
2021-10-07 07:50:00
897
原创 文本分析方法在《管理世界》(2021.5)中的应用
开学特惠|Python网络爬虫与文本分析案例文献胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156...
2021-09-02 08:30:00
2136
原创 connector-x | 让数据从DB高速导入到DataFrame中
开学特惠|Python网络爬虫与文本分析ConnectorX 使您能够以最快和最节省内存的方式将数据从数据库加载到 Python 中。你需要的是一行代码:importconnector...
2021-08-27 20:10:00
2205
原创 TFIDF | 有权重的计算文本情感得分
2021暑期 | Python数据挖掘暑假工作坊腾讯课堂 | Python网络爬虫与文本分析在论文Kai Li, Feng Mai, Rui Shen, Xinyan Yan, Measu...
2021-07-21 15:42:43
2293
2
原创 wordexpansion包 | 新增词向量法构建领域词典
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊腾讯课堂 | Python网络爬虫与文本分析一、项目意义情感分析大多是基于情感词典对文本数据进行分析,所以情感...
2021-07-19 14:37:03
2310
6
原创 中文金融情感词典发布啦 | 附代码
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊可以使用cnsenti库中的自定义方法,计算年报或财经类社交媒体的文本情绪。姚加权,冯绪,王赞钧,纪荣嵘,张维...
2021-07-14 14:20:00
10077
2
原创 whatlies包 | 简单玩转词向量可视化
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊whatlies可以与spacy语言模型结合,可视化词向量。安装zh_core_web_md、en_core_...
2021-07-08 18:48:16
503
原创 Clumper库 | 其他数据分析
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper前期文章Clumper | dplyr式的Python数据操作包Clumper库 | 常用的数据...
2021-07-01 20:00:00
201
原创 Clumper库 | Groupby具体案例用法
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper前期文章Agg聚合描述性统计方法agg如下图,可以理解成三个步骤,即group->spli...
2021-06-30 14:49:33
264
原创 Clumper库 | 常用的数据操作函数
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊前天分享了Clumper | dplyr式的Python数据操作包,其实Clumper有点跟之前的plyd...
2021-06-29 08:30:00
298
原创 Clumper | dplyr式的Python数据操作包
2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper可以用来处理嵌套样式的json数据结构。安装!pip3installclumper为了展示...
2021-06-23 13:56:20
236
原创 最好用的15个Typora主题
Typora简介Typora是一个所见即所得的Markdown格式文本编辑器,支持Windows、macOS和GNU/Linux操作系统,拼写检查、自定义CSS样式、数学公式渲染(通过Ma...
2021-06-03 08:30:00
29084
6
原创 companynameparser中文公司名称分词工具
companynameparser中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。安装pip3installcompanynameparser==0...
2021-05-23 15:37:19
1839
1
原创 addressparser中文地址提取工具
addressparser中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射。!pip3installaddressparser==0.2.1省市区提取默认采用全文模式,...
2021-05-22 10:30:30
2654
原创 multistop ~ 多语言停用词库
一、cnstopwords停用词表, 同时支持中英德等15种语言。 https://github.com/thunderhit/multistop二、安装pip3installmu...
2021-05-14 08:30:00
657
1
原创 hiResearch 定义自己的科研首页
Hi Research参考GreatDanton 项目,丢弃庞杂丑陋的收藏夹, 打造简洁科研首页。每个人都可以自定义自己的浏览器首页,替换默认浏览器首页/起始页。该项目可在任何现代浏览器上...
2021-05-11 08:30:00
487
原创 来自kaggle最佳数据分析实践
翻译: 大邓作者: Bex T标题: Weekly Awesome Tricks And Best Practices From Kaggle链接: https://towardsdev....
2021-05-09 08:30:00
836
原创 语法最简单的微博通用爬虫weibo_crawler
weibo_crawle可以做轻度的微博数据采集。一、支持爬虫用户信息抓取用户微博抓取(全量/指定时间段)用户社交关系抓取(粉丝/关注)微博评论抓取基于关键词和时间段(粒度到小时)的微博抓...
2021-04-30 21:22:44
3393
1
原创 使用Hugo快速搭建个人博客
之前分享过一期Hugo的教程,这次换了模板,感觉颜值提高了很多。之前的教程使用的 主题是academic, 本文教程依然是基于academic展开。大家如果学会了,可以换成别的模板。1. ...
2021-04-23 09:00:00
733
原创 使用streamlit上线中文文本分析网站
cnsenti App这是使用streamlit库将中文情感分析[cnsenti部署到网络世界,可在线提供简单的中文文本的情绪及情感计算。streamlit库(https://docs....
2021-04-14 09:00:00
2671
原创 SciencePlots | 科研样式绘图库
安装!pip3installSciencePlotstips:SciencePlots库需要电脑安装LaTex,其中MacOS电脑安装MacTex https://www.tug.o...
2021-04-06 09:00:00
1487
2
原创 B站视频 | Python自动化办公
Python自动化办公Python自动化办公视频课,原价99元,现在可全部免费观看,视频观看地址准备篇1.想象力丰富的自动化场景2.展示自动群发邮件软件简单文件处理篇1.批量更改文件名2...
2021-03-26 09:00:00
253
原创 2021寒假赋能!Python网络爬虫与文本分析直播课
Python网络爬虫与文本分析课在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家...
2021-02-06 00:06:50
979
2
原创 akshare库 | A股股票价格指数数据获取
腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~A股函数类型功能ak.stock_sse_summary()数据总貌当日上海证券交易所-股票数据总貌ak.stock_szse_...
2020-12-10 12:30:29
10634
原创 akshare库 | 初识Python金融经济大数据库
腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~AkShare是基于 Python 的财经数据接口库, 目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品...
2020-12-09 12:48:37
3960
原创 pdf2docx库 | 转文件格式,支持抽取文件中的表格数据
腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~今天在知乎看到如何免费地、完整地把 PDF 转换为 Word?近几年【pdf转word】在百度指数中呈上升趋势,由于pdf文件本...
2020-12-06 09:00:00
2219
原创 爬虫实战 | 采集&可视化知乎问题的回答
腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~问题链接https://www.zhihu.com/question/432119474/answer/1597194524爬...
2020-12-02 08:00:00
754
原创 实操 | 复习Pandas一些常用操作
腾讯课堂 | Python网络爬虫与文本分析我挺喜欢看B站up主-老师好我叫何同学 , 所以今天就用bsite库采集一下何同学的视频信息及评论数据,每个视频的评论以csv文件存储于dat...
2020-10-26 09:00:00
521
原创 pyttsx3库 | 2行代码将文本转音频
腾讯视频 | Python网络爬虫与文本分析pyttsx3简介pyttsx3是一个款将文本转为语音的Python包,不同于其他Python包,pyttsx3真的可以文本转语音。安装pip...
2020-10-19 09:00:00
1222
原创 bsite库 | 采集B站视频信息、评论数据
腾讯课堂 | Python网络爬虫与文本数据分析一、简介bsite是用于采集B站用户视频列表页、视频评论数据的python包。二、安装pipinstallbsite三、使用方法3...
2020-10-16 11:41:58
3372
3
原创 五步写爬虫 | 采集大众点评数据采集实战
腾讯课堂 | Python网络爬虫与文本数据分析任务采集 http://www.dianping.com/shanghai/hotel爬虫设计阶段类型问题需要做到1请求网页数据在哪里?发...
2020-10-13 16:56:11
2911
转载 40000字 Matplotlib 实操干货,真的全!
预备通知 | Python数据挖掘与Stata应用能力提升与实证前沿国庆工作坊导读Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出...
2020-09-22 09:00:00
279
转载 带你来看全国3000所高等院校分布
截至2020年6月30日,全国高等学校共计3005所,其中:普通高等学校2740所,含本科院校1272所、高职(专科)院校1468所;成人高等学校265所。本名单未包含港澳台地区高等学校...
2020-09-21 15:11:07
6234
1
转载 用Python分析18万条《八佰》影评,看看观众怎么说?
腾讯课堂 |Python网络爬虫与文本分析大家好,我是J哥。最近《八佰》这部电影比较火,上映仅15天就已斩获22亿票房。对于沉寂了半年、影院上座率仍限定在50%的电影市场而言,这样的成...
2020-09-19 09:00:00
1952
4
转载 Pandas学习笔记之时间序列总结
早起导读:pandas是Python数据处理的利器,时间序列数据又是在很多场景中出现,本文来自GitHub,详细讲解了Python和Pandas中的时间及时间序列数据的处理方法与实战,建...
2020-09-11 09:00:00
1539
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人