- 博客(11)
- 问答 (2)
- 收藏
- 关注
原创 样本方差为什么除(n-1)?验证一下那个更准确
实际上,样本方差可以理解成是对所给总体方差的一个无偏估计。n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本协方差和样本标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。用python随机生成一个一百万数据的总体,然后进行1000次抽样,每次抽50个数据。1.先导入需要用到的包import pandas as pd import numpy as npimpor
2022-05-26 18:38:56
570
原创 MYSQL窗口函数,数据分析好轻松
可分为两大类:专用窗口函数、常用聚合函数专用窗口函数ROW_NUMBER() OVER(PARTITION BY …ORDER BY …)当前行在组内的序号,不管是否出现重复项,不间断连续排序号,如1,2,3,4,5......DENSE_RANK() OVER(PARTITION BY …ORDER BY …)不间断组内排序,重复项序号会相同,如1,1,2,2,3......RANK() OVER(PARTITION BY …ORDER BY …)间断组内排序,重复项序
2022-05-25 13:36:29
308
原创 Error: cannot import name ‘delayed‘ from ‘sklearn.utils.fixes‘
问题:调用 from imblearn.over_sampling import SMOTE 出现报错报错:cannot import name ‘delayed‘ from ‘sklearn.utils.fixes‘首先:依赖库要求:imblearn需要依赖某些Python模块(下面是最新版0.7.0的依赖要求)python (>=3.6)numpy (>=1.13.3)scipy (>=0.19.1)scikit-learn (>=0.23)keras 2
2022-04-10 18:21:44
3569
1
原创 jupyter 主题设置与jupyter常用插件
jupyter 默认的主题我实在是用的很不习惯,所以我安装完成第一件事就是换一个心仪的主题。我们可以通过命令行窗口或 Anaconda Prompt 窗口安装 jupyter 主题pip install jupyterthemes
2022-03-12 22:20:27
1531
原创 手搓函数,实现train_test_split一样的数据集划分
在机器学习训练算法模型之前,我们一般都需要对数据集进行划分为训练集和测试集。训练集用作机器学习训练得出算法模型,而测试集用来对训练出来的模型进行检验。在sklearn中可以从sklearn.model selection中调用train_test_split函数方法实现数据集的划分。1、train_test_split今天我们来手搓一个函数实现train_test_split一样的数据集划分。话不多说,我们直接先上代码!from random import randrangefro.
2022-03-04 17:28:39
1691
原创 自写函数实现特征预处理之标准化
标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异等对模型的影响。标准化数据通过减去均值然后除以方差(或标准差),这种数据标准化方法经过处理后数据符合标准正态分布,即均值为0,标准差为1,转化公式:通过函数要怎么实现呢?公式较为复杂我们可以采取拆分的方法逐一完成。1、先计算平均值 data = [[5, 6, 3], [4, 6, 8], [6, 9, 7]]def data_mean(data):
2022-02-26 23:48:34
456
原创 SaaS常用指标及计算方法
一、常用指标1、MRR/ARR(M:month,A:year)RR:经常性收入(Recurring Revenue)是未来持续可获得的收入,SaaS 而言,经常性收入来自客户的订阅,具有稳定、可预测、高度确定的特点。主要按月合同及少量的年度合同,采用 MRR(Month Recurring Revenue 月度经常性收入)。MRR 用于衡量每月订阅收入,如果有一些年度订阅,除以 12,再分摊到每月来计算 MRR 按年合同及少量的多年合同 ,采用 ARR(Annual Recurring Rev
2021-08-24 18:28:48
3765
空空如也
不通过pyspark,如何直接把dataframe的内容写入到目标hive表。
2023-04-20
虚拟环境下shell脚本调用python脚本
2023-04-18
oracle如何利用正则去除字符串中括号及括号里内容?只能是首个括号
2023-03-16
请大家看一眼是哪有错误,字段名和表名是没错的。
2022-03-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人