- 博客(9)
- 资源 (3)
- 收藏
- 关注
原创 pandas数据处理与分析实战
01批量读取指定路径下文件,将需要合并相同格式的csv文件放入一个文件夹内,直接调用即可。涉及企业内部数据,数据不公开,欢迎评论指正或私聊。02数据准备,使用merge内连接表格,匹配数据。03根据业务需求,筛选并分组计算数据。sheet2数据展示(客户名称已码)sheet1数据展示。sheet3数据展示。sheet4数据展示。sheet5数据展示。
2024-05-02 15:56:03
499
2
原创 爬虫——Xpath和Beautifulsoup实例
(由于是一年前写的代码,可能网站开发更新会有一些变动,代码仅供参考),如有不准确欢迎评论区讨论,致谢~的用法,后续会整理一些之前写过的实例。,包括点击公司名称后跳转的子页面表格。本篇通过一个案例分享。
2024-01-17 15:10:09
556
原创 平稳与非平稳序列的拟合及预测
时间序列分析基于R,主要包括建模步骤;单位根检验——DF检验、ADF检验;模型识别;参数估计——矩估计、极大似然估计、最小二乘估计;模型检验——模型的显著性检验、参数的显著性检验;模型优化——问题的提出、AIC准则、BIC准则;序列预测。
2022-05-09 22:05:47
5268
3
转载 使用决策树进行个人信用风险评估
最近在学习机器学习分类算法,本文转载于Ashmore的博客,数据集及原文链接放于文末决策树方法介绍决策树简介决策树(decision tree)是一种基本的分类与回归方法。如下图所示的流程图就是一个决策树,长方形代表判断模块(decision block),椭圆形成代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引出的左右箭头称作为分支(branch),它可以达到另一个判断模块或者终止模块。我们还可以这样理解,分类决策树模型是一种描述对实例进行分类的树形
2022-04-20 21:58:40
1758
原创 应用线性回归预测医疗费用
公司为了赚钱,保险需要募集比花费在受益者的医疗服务上更多的年度保费,因此,保险公司投入了大量的时间和金钱来研发能精确预测医疗费用的模型。医疗费用很难估计,因为花费最高的情况是罕见的而且似乎是随机的。但是有些情况对于特定的群体还是比较普遍存在的。例如,吸烟者比不吸烟者得肺癌的可能性更大,肥胖的人更有可能得心脏病。此分析的目的是利用病人的数据来预测这部分群体的平均医疗费用。这些估计可以用来创造一个精算表,根据预期的治疗费用来设定年度保费价格是高一点还是低一点。1.收集数据为了便于分析,我们使用一个模拟数
2022-04-19 23:07:50
5350
3
原创 《时间序列分析》
时间序列分析基于R学习小结第一章~第三章文章目录时间序列分析基于R学习小结一、第一章时间序列分析简介1、输入指令的规则2、赋值指令的写法一、第一章时间序列分析简介1、输入指令的规则通常一行只编辑一条指令,如果一行内要编辑多条指令,可以用分号来分隔不同的指令,就可以将多条指令一次性执行了。【例1-1】赋值x=3x=\sqrt{3}x=3,y=20.3y=2^{0.3}y=20.3,计算x+y的值,并在二维坐标轴中标注点(x,y)(x,y)(x,y)的位置。#例 1-1> x=sqr
2022-04-13 22:01:58
642
2
原创 汽车价格离群值检测案例
《数据科学导引》汽车价格离群值检测案例第二章案例4(评论可以私发数据表)文章目录《数据科学导引》汽车价格离群值检测案例前言一、数据集描述二、导入数据集并切分三、特征提取并构建线性回归模型四、离群值检测五、标准化对离群值检测的影响六、测试集的验证七、在测试集上使用LOF进行离群值检测前言离群点(Outliers),简单而言就是离其余数据点非常远的数据点。它们会极大的影响后续的分析结果,甚至产生有误导的分析结果。Vast向3个行业的出版商、市场和搜索引擎提供数据,这三个行业包括汽车、房地产和休闲、
2022-03-29 00:29:36
3034
3
原创 如何使用LaTeX制作表格
LaTeX制作表格今天真的是学到了!先看代码~当然我们现在导言区引入宏包:\documentclass{ctexart}\usepackage{amsmath}\usepackage{amssymb}\usepackage{booktabs}\usepackage[table ]{ xcolor}\usepackage{latexsym}\usepackage{longtable}在正文区设置表格格式:\begin{document}\begin{table}[htbp]%注释1
2020-12-16 15:04:48
5828
原创 搞定数学建模论文——快速上手texstudio
前言首先,texstudio不能单独使用,我们需要安装miktex或者latex,安装之后,我们就可以在texstuidio界面的编辑区编辑论文了,它可以根据我们的命令对论文进行排版。在开始之前,我们需要设置一下:第一步,打开“选项”—“设置Texstudio(第一个)”—“常规”—“语言”,下拉选择“zh_CN”,就转换成了中文模式;第二步,打开“构建”—“默认编译器”,下拉选择“XeLaTex”;第三步,打开“编辑器”—“默认字体编码”,下拉选择“UTF-8”;最后,点击右下角的“确认”。
2020-12-14 21:42:39
1809
《时间序列分析-基于R》课程的所有数据
2023-04-06
数据分析师轻松上路——拆解方法(MECE法则)
2022-04-22
决策树与朴素贝叶斯算法原理
2022-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人