- 博客(4)
- 收藏
- 关注

原创 详解pandas数据分析之groupby分组聚合(基于电商平台数据)
该篇文章基于电商的商品数据信息,详细介绍pandas数据分析之分组聚合的方法与技巧(保密起见,只展示部分数据)。分组聚合结果展示:文章目录:一、导入pandas包并读取数据集数据数据字段说明二、分组1、生成分组对象2、查看分组对象类型3、查看分组对象的方法(函数)4、查看分组数量5、查看各分组6、查看各分组索引7、查看各分组的唯一识别标签...
2018-12-18 22:29:02
2225
1
原创 NLTK文本预处理与文本分析
本文主要介绍Python中NLTK文本分析的内容,咱先来看看文本分析的整个流程:原始文本 - 分词 - 词性标注 - 词形归一化 - 去除停用词 - 去除特殊字符 - 单词大小写转换 - 文本分析一、分词使用DBSCAN聚类算法的英文介绍文本为例:from nltk import word_tokenizesentence = "DBSCAN - Density-Based Spat...
2019-03-22 19:44:47
1386
转载 词性标注的词性说明
1. CC Coordinating conjunction 连接词2. CD Cardinal number 基数词3. DT Determiner 限定词(如this,that,these,those,such,不定限定词:no,some,any,each,every,enough,either,neither,all,both,ha...
2019-03-21 22:28:58
865
原创 python连接mysql与sql server数据库及相应的模块封装
一、Python连接MySQL数据库及模块封装1、连接模块封装步骤:首先建立名为“db_sql” 的文件夹,在文件夹下再建立名为“db_mysql”的“.py"文件,在改文件下编辑如下代码”:import pymysqlimport pandas as pddef execute_sql(sql): localhost = "72.106.100.12" us...
2019-02-21 20:50:45
1755
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人