
Python数据分析
牧羊人sss
python
展开
-
Python异常值分析
异常值分析是检验数据是否有录入错误以及含有不合常理的数据。忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称为离群点,异常值的分析也称为离群点分析。(1)简单统计量分析可以先对变量做一个描述性统计,进而查看哪些...原创 2019-12-14 15:31:30 · 1000 阅读 · 0 评论 -
Python数据分析与挖掘实战
一、数据挖掘1.数据挖掘定义:从海量数据(包含文本)中挖掘出对企业有潜在价值的趋势、知识或规则,并利用这些知识或规则进行建立模型,对预测型决策进行指导的过程。2.数据挖掘的流程:2.1、数据抽取:要重点关注数据的质量,可以进行同环比、逻辑、日期、平衡关系校验。2.2、数据探索:主要包括 相关性分析、、、2.3、数据预处理:2.4、模型建立:2.5、模型评价:3.数据挖掘的工具:...原创 2019-12-12 09:56:34 · 356 阅读 · 0 评论 -
爬取豆瓣《小丑》短评做词云图
一、抓取小丑的豆瓣短评网址:https://movie.douban.com/subject/27119724/reviews?start=20每一页20个评论,我总共抓取了3060条评论:分别抓取了评论用户的名称、短评的内容,点赞数目以及用户链接抓取内容保存为文本格式,用pandas进行读取后如下所示:import pandas as pdtable=pd.read_table('...原创 2019-12-11 11:00:56 · 540 阅读 · 0 评论 -
numpy基础
1.生成数组1.1使用array函数生成数组import numpy as npdata1=[[4,3,5,2],[4,7,5,9]]np.array(data1)1.2生成特殊数组#创建全为0的数组np.zeros((3,4))#创建全为1的数组np.ones((3,3))2.改变数组类型2.1 astype函数改变类型data.dtype#dtype查看数组类...原创 2019-12-08 16:49:11 · 213 阅读 · 0 评论 -
jieba.analyse的使用:提取关键字
① jieba.analyse.extract_tags 提取关键字:第一个参数:待提取关键词的文本第二个参数:返回关键词的数量,重要性从高到低排序第三个参数:是否同时返回每个关键词的权重第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词print("***案例1***"*3)txt='那些你很冒险的梦,我陪你去疯,折纸飞机碰到雨天终究会坠落,伤人的话我直说,因为...转载 2019-12-11 10:52:16 · 10496 阅读 · 3 评论 -
pandas记载
pandas记载你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。1.构造Series和DataFrame对象Series和DataFrame是pandas的基本对象,下面来演示下如何构造它们:import pandas as pd#构造series对象obj_...原创 2019-08-07 15:18:38 · 159 阅读 · 0 评论