
数据分析
文章平均质量分 60
白十月
商科转码的成长记录~~奥力给!
展开
-
相关系数计算,热力图绘制,代码实现
两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。公式的分母是变量的标准差,**这就意味着计算皮尔森相关性系数时,变量的标准差不能为0(分母不能为0),**也就是说你的两个变量中任何一个的值不能都是相同的。如果没有变化,用皮尔森相关系数是没办法算出这个变量与另一个变量之间是不是有相关性的。皮尔森系数对数据的要求比较高,............原创 2022-08-03 19:53:49 · 3553 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(15)
15Numpy数组1数组生成2Numpy数组的基本属性Numpy数组的基本属性主要包括数组的形状、大小、类型和维数3Numpy数组的数据获取4Numpy数组的数据预处理5Numpy数组重塑6Numpy数组合并原创 2022-01-26 23:35:18 · 1787 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(14:典型数据分析案例)
为什么要报表自动化提高工作效率减少错误什么样的报表适合自动化使用频率高开发时间短需求变更频率低流程标准自动发送电子邮件smtplb用来建立和断开与服务器连接的工作email设置与邮件本身相关的内容,比如收件人、发件人、主题...原创 2022-01-24 23:47:25 · 1994 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(13:)
对比excel,轻松学习python数据分析(13:)原创 2022-01-22 20:44:11 · 493 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(11:多表连接、12:时间序列)
11.1表的横向拼接表的横向拼接就是在横向将两个表依据公共列拼接在一起。merge()11.2表的纵向拼接表的纵向拼接是与横向拼接相对应的,横向拼接是两个表依据公共列在水平方向上进行拼接,而纵向拼接是在垂直方向进行拼接。12 结果导出1.导出为.xlsx文件2.导出为csv文件3.将文件导出到多个sheet...原创 2022-01-20 22:47:34 · 587 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(8:数据运算、9:时间序列)
第八章 数据运算1.算术运算两列相加两列相减两列相乘两列相除任意一列加/减一个常数值,这一列中的所有值都加/减这个常数值任意一列乘/除一个常数值,这一列中的所有值都乘/除这一常数值2.比较运算比较是在列与列之间进行3.汇总运算count 非空值计算1.某一个区域中非空(单元格)数值的个数2.直接在整个数据表上调用 count()函数,返回的结果为该数据表中每列的非空值的个数3.默认求每一列的非空数值的个数4.当axis参数等于1时,求取每一行的非空数值的个数5.也可以原创 2022-01-18 23:25:29 · 1315 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(6:数据选择、7:数值操作)
第六章 数据选择1.列选择a)普通索引# 列选择# 普通索引df_01 = df_0[['时间','会员收入(万元)']]b)位置索引用iloc# 位置索引 使用iloc,选中的列要用[]框起来df_02 = df_0.iloc[:,[0,6]]c)切片索引iloc 后的方括号中逗号之前的部分表示要获取的行的位置,只输入一个冒号,不输入任何数值表示获取所有的行;逗号之后的方括号表示要获取的列的位置,列的位置同样是也是从0开始计数。# 切片索引 iloc[A:B,C:D]df_原创 2022-01-16 17:07:47 · 630 阅读 · 0 评论 -
对比excel,轻松学习python数据分析(读书笔记4-5章)
第四章1.导入数据a)导入.xlsx 格式excelread_excel( )导入指定sheet: 设定sheet_name参数,来指定要导入哪个Sheet的文件。行索引index_col:表示用.xlsx文件中的第几列做行索引,从0开始计数。列索引header:将本地文件导入DataFrame时,默认使用源数据表第一行作为列索引,也可以通过设置header参数来设置列索引指定导入列usecols: 本地文件列数太多,又不需要那么多列时,就可以通过设定usecols参数来指定要导入的列b原创 2022-01-14 11:57:13 · 614 阅读 · 1 评论 -
对比excel,轻松学习python数据分析(读书笔记1-3章)
利用合适的工具,在统计学理论的支撑下,对数据进行一定程度的预处理,结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点。原创 2022-01-11 17:20:18 · 1275 阅读 · 0 评论 -
图数据库neo4j使用
零、预备备:启动数据库本机数据库版本 Neo4j 3.5.13以管理员身份运行控制台(win+A+X),在命令窗口切入到主目录%NEO4J_HOME%\bin执行neo4j.bat console进入网址 http://localhost:7474/browser/一、图数据库介绍图数据库存储各种数据只用了几个简单的概念:1)节点 - 图数据记录相似的节点可以有不同的属性,属性可以是字符串、数字或布尔2)关系 - 连接节点关系总是有方向的3)属性 - 命名的数值属性是简单的名/值对原创 2021-11-01 16:05:35 · 1021 阅读 · 0 评论 -
论文数据统计笔记
导入package并读取原始数据import seaborn as sns #用于画图from bs4 import BeautifulSoup #用于爬取arxiv的数据import re #用于正则表达式,匹配字符串的模式import requests #用于网络连接,发送网络请求,使用域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画转载 2021-01-14 00:54:31 · 194 阅读 · 0 评论 -
数据存储:对dataframe类,使用to_csv()将中文数据写入csv文件
实例data.to_csv('traindata.csv',encoding='utf-8-sig')#写入中文写入中文文本,使用encoding=‘utf-8-sig’,否则会乱码原创 2020-08-13 11:15:36 · 4358 阅读 · 1 评论 -
python按照步长切片 操作[::2]
插空取数:测试1:s = 'abcdefg's2 = s[::2]print(s2)结果为:aceg测试2:s = 'abcdefg's2 = s[::3]print(s2)结果为:adg原创 2020-07-09 16:11:37 · 4084 阅读 · 0 评论 -
数据分析入门方法和推荐的自学网站
今天看到一篇不错的经验分享,在这里记录一下SQL的题库 :https://sqlzoo.net/wiki/SQL_Tutorial/zhpython 的项目:https://www.kesci.com/home/columnpython的基础:https://www.kesci.com/home/project/5c77a063359730002bfc903b知乎上的数据分析专栏:https://zhuanlan.zhihu.com/data300...原创 2020-05-14 20:23:10 · 510 阅读 · 0 评论