
数据分析
文章平均质量分 91
SummerStoneS
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
p value and confidence level
假设原假设是对的,观测数据求出的统计量在原假设的分布下的概率,p value是我们能得到比观测值算出的统计量还极端的概率;如果要拒绝原假设,那么alpha至少要比p大,alpha也是一类错误,即原假设是对的,但是拒绝了原假设(本来没效果,说有效果)原创 2025-01-26 11:54:27 · 954 阅读 · 0 评论 -
建模数据预处理--数据检查、变量标准化、分布变换、构造特征、特征筛选
一、数据检查1)缺失值有时候是null,有时候全是0,这个需要比想象中更仔细,因为取数的同学们有时候会默认填充0,有时候是因为数据库迁移,产品刚刚发布所以太远的数据没有等原因造成的,这些需要及时确认对于有些变量仅对特定的人有值,(比如说理财的产品偏好,当然只有买了理财的人才会有偏好数据可以分析),可以给没有这个值的人填充一个数值,可以是999这样这个字段不会取到的大值(但是要注意在模型...原创 2019-08-09 12:09:28 · 764 阅读 · 0 评论 -
快消品季度销量排序预测-线性回归预测分析
问题定义:每季第8周要对明年这个季的每款产品的13周销量(一个季度)做排序,即今年要对明年售出的产品按照销量从大到小的排序做预测(但目前并不是以明年该季度的销量作为衡量预测准确度的标准,而是以今年对明年该季的下单数据作为标准,即给工厂下单lock capacity的产品订单排序,下订单的环节叫OBR(order booking review),一般提前开售日期9个月,从OBR到开售还会新增个别...原创 2019-09-03 22:59:51 · 2306 阅读 · 0 评论