自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 ARIMA模型进行销量预测

销量预测是基于时间序列而进行的分析,而ARIMA(自回归积分滑动平均)模型是一种广泛应用于时间序列分析的预测工具。ARIMA模型通常表示为ARIMA(p, d, q),其中:p:自回归项的阶数。ARIMA(p, d, q)模型意味着时序被差分了d次,且序列中的每个观测值都是用过去的p个观测值和q个残差的线性组合表示的。如果你是一个销售的领导,你是否有这样的疑问,如何制定销售目标才是合理的?4、对于差分的序列进行平稳性检验和白噪声检验,只有平稳非白噪声的序列才能进行ARIMA预测。6、建立模型,进行预测。

2024-12-25 18:40:58 357

原创 基于RFM模型的用户价值分析

RFM模型是一种通过用户的R消费间隔(Recency)F消费频率(Frequency)、M消费金额(Monetary)三项指标来衡量用户价值的手段。核心思想是通过交易环节中最核心的三个指标来评估客户的活跃度、忠诚度和贡献度之类的指标。这些指标可以帮助企业快速的识别高价值用户、低价值以及十分有潜力的用户,并且针对不同的客户群体进行个性化的营销策略。R按照由小到大的顺序,取前20%的客户给5分,次20%的客户给4分以此类推。F和M由大到小取前20%给予5分,次20%的客户给4分,以此类推。

2024-12-23 18:13:17 379

原创 话说相关分析

要判断变量间的相关程度,主要看相关系数的大小,相关系数一般在-1与1之间,一般而言,如果0≤∣r∣<0.3,就认为两个变量之间不相关;相关分析,指对两个或多个指标进行分析,评估它们两两之间联系或相互影响的程度,通过了解这些变量是如何相互影响的,进而推测潜在的因果关系或共同的变化趋势。相关分析在业务中有广泛的应用,但是相关分析时数据易受异常值的影响,使用时注意它的局限性。通过相关分析,可以评估广告投放与销售额之间的关系,了解广告效果的实际影响。产品销售分析,通过相关分析,找到影响销量的因素。

2024-12-19 14:43:22 175

原创 用户行为分析

电商中很重要的专题数据分析是用户行为分析,本案例就是通过用户行为数据分析。还有通过漏斗分析发现从用户点击到用户购买各个环节的转化率分析。1每日pv,uv,平均访问量趋势。2分析日点击趋势与访客数量趋势。5日购买人数及购买人数分析。3分时段日活跃用户分析。4分析三日留存率趋势。

2024-12-17 23:12:12 133

原创 数据分析案例|航空公司客户价值分析

因消费金额指标在航空公司中不适用,故选择客户在一定时间内累积的飞行里程M 和客户乘坐舱位折扣系数的平均值 C 两个指标代替消费金额。此外,考虑航空公司会员加入时间在一定程度上能够影响客户价值,所以在模型中增加客户关系长度 L ,作为区分客户的另一指标,因此构建出 LRFMC 模型。广泛用于分析客户价值的是RFM模型,它是通过三个指标(最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary))来进行客户细分,识别出高价值的客户。

2024-11-28 10:45:44 256

原创 python爬取58同城的新房信息

python爬取58同城中长沙的新房信息

2024-07-10 21:14:05 352

原创 BOSS招聘中数据分析岗位分析

data=data[data['职位'].str.contains('数据分析',na=True)&~data['职位'].str.contains('兼职',na=True)&~data['职位'].str.contains('实习',na=True)]#筛选数据分析且不包含兼职的岗位。data['s_mean']=(data['s_max']+data['s_min'])/2#计算平均薪资。data['s_min']=data['薪资'].str.extract('(\d+)')#取出最低薪资。

2024-07-10 20:48:29 1811

原创 爬取boss直聘数据分析岗位招聘信息

poss爬取boss中某城市的数据分析岗位的招聘信息

2024-07-04 11:24:53 582

原创 stata有序逻辑回归

Logistic回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据,也可以为定量数据,但要求Y必须为定类数据,如果Y有多个选项,并且各个选项之间可以对比大小,例如,1代表“不愿意”,2代表“无所谓”,3代表“愿意”,这3个选项具有对比意义,数值越高,代表样本的愿意程度越高,那么应该使用多元有序Logistic回归分析。案例:根据年龄、是否患有糖尿病,来分析哪些因素对BMI产生影响,而BMI分为正常、偏高、肥胖三类,为有序变量,因此采用的是有序逻辑回归。步骤:首先进行平行性检验。

2024-05-24 22:44:18 4678 1

原创 灰色关联分析

曲线越接近,相应序列之间的关联度就越大,反之就越小。这种方法的核心在于按照一定规则确立随时间变化的母序列,把各个评估对象随时间的变化作为子序列,求各个子序列与母序列的相关程度,依照相关性大小得出结论。分析序列(又称比较序列、子序列):影响系统行为的因素组成的数据序列,类似于因变量X,此处记为(x1,x2,…注意maxmax是求整个数列与参考数列的差值的最大值,反之求差值的最小值。(4)计算灰色关联度,灰色关联度越大,绩效越好,反之,绩效越差。关联度的排序是f4>f5>f7>f3>f6>f8>f1>f2。

2024-05-22 08:29:40 250

原创 爬取信用中国里面的行政处罚

result字段名为行政处罚文书号、处罚决定日期、处罚内容、处罚金额、违法事实、处罚机关、公司名称,行政处罚次数。file_path=r'E:\Data analyze\python\行政处罚爬虫/'#路径需要按实际修改。writer = pd.ExcelWriter('统计.xlsx')# 写入Excel文件。src_workbook=file_path+r'行政处罚(名单).xls' #表格名称也要更改。# keyword = input("输入爬取的公司全称必须是全称")

2024-05-21 15:54:26 1022

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除