- 博客(13)
- 收藏
- 关注
原创 奔奔数据分析
数据来源于网络;使用工具:python,navicat, MySQL,excel分析分为3块:1.数据预处理:异常值,重复值,缺失值,(线性回归填充)2.数据分析:描述型统计分析(MySQL),渠道&平台分析产品TOP分析3.RFM(k-means),同期群分析(新用户留存,客单价),流失周期数据概貌:一张excel表,来源某电商平台,购买订单明细表,以下是字段:1.在做分析前先对数据进行预处理:逐一字段,争对,异常值,缺失值,重复值进行分析这里提一下,chanelID,和pa
2021-05-29 16:41:18
392
原创 竞赛电商数据分析
电商数据分析数据来源京东竞赛,数据实在太多了,只取了行为表的最后7天的数据,即2018-04-09——2018-04-15的数据,分析思路来自于一本书——《硅谷增长黑客实记》,如果说之前都是小孩子过家家,现在基本上算是入门数分这行了。整篇分析分为4个大的部分,1.基本的描述性统计分析,2.用户留存的探索,(包括天然使用周期的平均值作为留存的单位),3.RFM模型,4.用户漏斗这次代码放的会少一些,主要阐述分析思路1.导包import numpy as np import pandas as pd
2020-11-02 00:19:18
1384
原创 简单ab测试与分析
某打车公司简单分析目的:结合学校获得的统计方法,用作AB测试的入门。数据来源K-lab,此次博客用于记录与探索,分为两个部分;1.对于整体的运营分析,2.初窥AB测试1.日常导包读入数据import numpy as np import pandas as pd import matplotlib.pyplot as pltimport matplotlibimport seaborn as sns import datetimeimport mathfrom sklearn.line
2020-10-07 16:15:53
1434
1
原创 K-Means算法基本实现
K-Means 算法1.呈现import numpy as np import pandas as pd import matplotlib.pyplot as pltimport matplotlibimport seaborn as sns import datetimeimport mathfrom sklearn.linear_model import LinearRegressionfrom sklearn.cluster import KMeansmatplotlib.rc
2020-09-24 20:19:31
358
原创 简单一元线性回归实现python
简单一元线性回归实现python#线性回归梯度下降import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport seaborn as sns import datetimefrom sklearn.linear_model importLinearRegressionmatplotlib.rcParams['font.family']='kaiti' df=pd.r
2020-09-22 18:40:48
446
原创 学生成绩管理系统sql实现
课设学生成绩管理系统——SQL代码部分create table student(s_name char(25) not null,s_sex char(10) not null default ‘男’,s_id int not null ,c_name char (25) constraint st_xh foreign key references class(c_name),pr
2020-09-15 20:33:01
3902
2
原创 某电商平台数据分析报告(2)
某电商平台数据分析报告(2)1.分析背景:某电商平台现有2016全年销售数据。数据来源:互联网2.分析思路:整体运营情况(GMV,实际支付总额,订单数,用户数),销售趋势(销售全年走势,复购率,客单价,产品欢迎度,最优价格区间),渠道(流量来源,使用设备),用户行为(城市,一周订单数,RFM)3.分析过程3.1 整体运营情况:...
2020-04-27 19:24:37
3861
原创 某电商平台数据分析报告(1)
某电商平台数据分析报告(1)——代码部分1.说明:撰写代码更为精进,质量更高,将多次调用的方法和参数打包为函数,一改往日代码冗长的风格。2.1引入第三方库:import numpy as np import pandas as pd import matplotlib.pyplot as pltimport matplotlibimport seaborn as sns impor...
2020-04-25 13:08:02
3129
原创 新冠病毒数据分析报告
新冠病毒数据分析报告数据链接:https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset/kernels1.概述:数据开始日期2020/1/22,数据截止日期2020/3/22。首先对整体做出大概分析和展现,再分别对中国和其他国家做出描述性分析2.基本特征: 图(1)...
2020-03-31 22:23:27
19464
1
原创 简单词云制作流程
*词云制作目的:爬取前100名大学并且制作词云1.使用存储数据库为MongoDB数据库,创建代码如下:class bug(object): clent=pymongo.MongoClient("Localhost",27017) zhongji=clent.zhongji bug=zhongji["bug"] spider1=bug["spider1"] ...
2020-03-23 16:28:35
1173
原创 泰坦尼克号数据分析报告
泰坦尼克号数据分析报告数据链接:https://www.kaggle.com/c/titanic/data观察数据 图(1)由图可知,在age/cabin/Embark 字段中有缺失,在之后的分析中会做相应的处理。基本特征由图2.3.4可知,共有人数891人,男性577人,女性314 人,生还人数有342人占总人数的38%,其中男性...
2020-03-22 20:52:54
6413
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人