自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 《深入浅出统计学》学习笔记(三)

11 章:讲总体与样本估计,介绍点估计量,说明样本均值、方差可估计总体对应值,提及比例和均值抽样分布及相关概率计算。12 章:阐述置信区间概念与求解步骤,介绍 t 分布,以及小样本、总体方差未知时用其构建置信区间的方法。13 章:说明假设检验的原假设、备择假设等概念,讲检验步骤、拒绝域、p 值,分析两类错误及控制方式与检验功效。14 章:介绍卡方分布定义和自由度,说明其在假设检验中的应用,含检验步骤、期望频数和自由度计算,用于衡量实际与期望频数差异。15 章:讲用散点图判断变量相关性,介绍线性回归求最佳拟合

2025-11-05 09:01:25 490

原创 《深入浅出统计学》学习笔记(二)

本文是《深入浅出统计学》第6-10章的学习笔记,重点介绍了概率与统计中的关键概念和应用。主要内容包括:1)排列组合的三种类型(独立、圆形、类别)及其计算公式;2)几何分布、二项分布和泊松分布的定义、区别及实际应用案例;3)正态分布的特点、计算方法和近似替代条件;4)统计抽样中的总体、样本概念,以及各种抽样方法(简单随机、分层、整群等)的操作要点和偏倚规避。笔记通过丰富的例题解析和对比表格,清晰呈现了不同概率分布和抽样方法的适用场景与计算技巧,为统计学基础学习提供了实用参考。

2025-11-01 22:05:47 1354

原创 《深入浅出统计学》学习笔记(一)

第 1 章为统计学入门,介绍数据类型(定性 / 定量)、数据收集方法,搭建统计学基础认知框架;第 2 章聚焦描述性统计,讲解均值、中位数、众数等集中趋势指标,及极差、方差等离散程度指标的计算与应用;第 3 章引入概率基础,涵盖概率定义、加法 / 乘法法则,结合案例解析事件概率求解;第 4 章深入概率分布,介绍离散型分布(如二项分布),说明分布特征与适用场景;第 5 章转向正态分布,讲解其图形特征、标准正态分布转换及在实际问题中的概率计算,为后续统计分析铺垫基础。

2025-10-27 14:25:10 937

原创 Excel基础知识 - 导图笔记

【Excel学习笔记分享】本文整理了王佩丰老师Excel基础课程的系统学习笔记,包含12大章节的思维导图与实操案例。内容涵盖:1)基础操作如密码设置、窗口重排;2)核心功能包括智能填充、数据透视表、VLOOKUP等函数应用;3)进阶技巧如OFFSET动态图表、PowerQuery数据处理;4)数组函数与可视化图表制作。通过详细的操作步骤和常见问题解析,帮助读者系统掌握Excel技能,提升办公效率。适合各阶段学习者参考使用,欢迎交流指正。

2025-10-06 14:25:02 1335

原创 制冷剂中表压对应温度值的获取(Selenium)

本文介绍了一个使用Python爬取Danfoss公司RefTools工具中R32制冷剂压力-温度数据的项目。通过Selenium模拟浏览器操作,自动点击页面数字按钮输入压力值,获取对应的温度数据。文章详细讲解了实现思路、代码编写过程,包括元素定位、数值输入验证、数据存储等关键步骤。该项目适合作为爬虫学习练手案例,提供了完整的代码实现,并展示了从-10到10范围内的数据爬取方法。最后作者欢迎读者提出改进建议,并希望分享的内容对学习有帮助。

2025-09-23 15:00:32 843

原创 热泵KeyMark认证的数据爬取

本文分享了爬取欧盟KeyMark热泵认证数据的Python爬虫实现思路。KeyMark认证包含热泵产品的性能参数、能效等级等关键数据,对行业分析、企业对标和消费者选购具有重要价值。文章详细介绍了如何突破iframe框架限制,通过XPath精准定位并提取网页中的认证信息,包括产品基本参数、不同工况下的性能数据等。针对数据错乱、指标名称不固定等复杂情况,作者设计了11种算法进行处理。最终实现了386个指标的自动化采集,并将原始数据整理为结构化表格。该项目完整代码需联系作者获取,适合作为爬虫技术进阶练手案例

2025-09-15 15:48:13 1070

原创 「案例项目」目录汇总

本文汇总了作者「案例项目」专栏下的实际项目案例目录,包含数据分析、管理系统等不同领域的实践项目。每个项目都包含背景、思路、技术实现和结果总结,部分涉及敏感信息的项目仅提供咨询或付费服务。后续将持续更新不同应用场景的案例,欢迎读者交流讨论

2025-08-26 10:28:58 422

原创 PID算法公式理解&案例演示(附Python代码)

本文通过温度控制案例,通俗讲解PID算法的原理与应用。文章首先介绍PID控制器的比例(P)、积分(I)、微分(D)三个环节的数学原理和作用:P项快速响应当前误差,I项消除稳态误差,D项预测误差变化趋势。随后以一个一阶温度系统为例,提供完整Python代码,逐步演示各参数调整对控制效果的影响。通过对比不同参数组合下的温度变化曲线,直观展示PID算法如何通过误差反馈实现精确控制。文章还分析了PID算法在一阶和二阶系统中的差异表现,并给出参数调整建议

2025-07-29 16:42:57 1642

原创 竞品分析的六大步骤

在这个“产品同质化严重、市场竞争加剧”的时代,想打造一款有竞争力的产品,仅靠拍脑袋或模糊认知已经远远不够。竞品分析,已成为产品经理、市场人员乃至决策层不可或缺的核心能力。本篇文章将带你深入掌握一套实战性极强的「竞品分析六步法」:从明确目标、精准选品,到构建分析维度、数据收集与对比,再到深度整理和策略输出,逐步搭建起一套结构化、可复用的分析模型。不管你是初入职场的新手,还是想系统梳理方法的中高级从业者,这篇文章都能帮你理清思路、落地实操,真正让竞品分析从“做了等于没做”,变成“做了就能用”。

2025-06-05 16:15:35 1944

原创 各国使用语言情况与网站搜索概况

全球语言多样性丰富,数百种语言在不同国家和地区发挥着重要作用。英语作为国际通用语,是全球最多国家的官方语言,覆盖北美、欧洲、非洲、亚洲及大洋洲多个国家。法语则主要分布在欧洲、非洲及若干海外领地,拥有约40多个使用国家。西班牙语主要集中在欧洲和拉美20多个国家,是世界上第二大母语。此外,葡萄牙语、德语、意大利语、日语、韩语、越南语、泰语、波兰语及马来语等,也分别在特定区域拥有显著影响力。了解这些语言的分布,有助于企业和技术人员制定更有效的国际化战略和产品本地化方案。

2025-05-30 15:44:16 3281

原创 PowerBI基础知识 - 思维导图

本文介绍了PowerBI作为微软推出的商业智能工具,在数据整理、分析和可视化方面的重要作用。文章以思维导图为核心框架,详细拆解了PowerBI的核心技能树,包括数据导入、M函数使用、数据模型构建、DAX表达式应用以及各种可视化图表的创建与操作。通过具体步骤和示例,帮助读者构建清晰的学习路径,提升数据洞察能力。文章还强调了学习过程中的互动与反馈,鼓励读者在发现问题时提出建议,共同进步。最后,作者表达了对未来持续分享学习资料和精彩内容的期待,希望与读者共同探索数据库的奥秘,提升数据管理能力。

2025-05-12 16:16:51 1348

原创 波士顿矩阵(象限法思维)介绍说明&问题分析

文章介绍了象限法在数据分析中的应用,通过将业务数据映射到二维坐标系中,直观呈现复杂数据关系,帮助快速识别问题并指导决策。文章以“重要与紧急”为例,展示了如何将日常任务分类到四个象限中,以提高工作效率。此外,文章还介绍了波士顿矩阵,通过“销售增长率”与“市场占有率”分析产品类型,为企业战略提供参考。最后,文章以“日活下降、销售额下降”为例,展示了如何通过维度分析法定位问题核心,并制定针对性策略。

2025-05-12 16:06:09 1379

原创 Python雷达图 - 忽略缺失值

本文探讨了雷达图中缺失数据的处理方法,重点介绍了跳过缺失值直接绘制雷达图的技术方案。文章首先分析三种常见缺失值处理方式:零值填充、统计拟合填充和直接忽略。针对雷达图场景,作者提出采用跳过缺失值的方法,通过保留有效数据点并闭合连线来保持图表结构完整性。文章详细解析了核心代码逻辑,包括数据有效性判断、角度计算和数值闭合处理,并提供了一个产品性能对比的案例实现。这种方法避免了不当填充带来的偏差,确保不完整数据也能进行公平比较,为数据分析提供了新的技术思路。

2025-04-03 16:01:56 792

原创 Pandas基础知识 - 导图笔记【三】

本文系统介绍了Pandas数据处理的核心功能,重点讲解了数据合并、日期处理和时间序列操作三大模块。内容包含:1)merge()和concat()实现不同数据合并方式;2)to_datetime()日期转换、dt对象属性提取和日期区间统计;3)date_range()生成时间序列、resample()重采样以及移动窗口计算等时间序列处理方法。通过实际代码示例演示了各类操作的具体应用场景,帮助读者掌握Pandas数据处理的关键技巧,提升数据分析效率。文章提供了配套的思维导图和代码资源,建议按顺序运行以确保代码正

2025-03-16 14:21:48 1082

原创 Flowith AI 五大优势&案例呈现

Flowith: 画布式AI协作平台颠覆传统交互模式 Flowith是一款由华人团队开发的创新型AI协作平台,通过"画布式交互"打破了传统AI线性对话的局限。其核心优势包括: 自由画布设计:支持多元素自由布局与连接,实现非线性思维表达; 多线程处理:可同时运行多个任务节点,大幅提升复杂任务处理效率; 知识生态共建:用户创作内容自动沉淀为可复用模板,形成20万用户共建的知识库; 多模态协作:支持20+主流AI模型自由切换与协同工作; 成本优化:采用分层算力策略,比同类产品节省60%成本

2025-03-16 14:05:27 2127

原创 Pandas基础知识 - 导图笔记【二】

本文系统介绍了Pandas数据处理的核心功能,包括数据排序/排名、计算(求和/均值/方差等)、格式化(小数位/百分比)、分组聚合、行列转换等操作。通过思维导图和代码示例展示了Pandas的常用API使用方法,如sort_values()、groupby()、agg()等函数,并提供了电商销售数据等实际案例。文章强调代码需按顺序执行,配套资源包含完整数据集和源码,适合希望提升Pandas应用能力的数据分析人员学习参考。

2024-10-06 12:01:05 1276

原创 教师与授课信息管理系统(Python+MySQL)

本文分享了一个基于 Python 和 MySQL 的信息管理系统,以教师与授课关系表设计,此项目曾是课程期末作业且获 90 多分。文中涵盖安装 pymysql 库、连接数据库、创建数据表、创建游标对象等步骤。还详细介绍了页面菜单及增加、修改、删除、查询数据等功能。作者非计算机专业,深知小白学习难点,如不懂代码、没思路、代码不运行及不知报错位置等。该系统功能实用,步骤清晰,对学习 Python 与数据库交互者有很大吸引力。

2024-10-06 11:18:18 970 1

原创 Pandas基础知识 - 导图笔记【一】

本文介绍了Pandas数据处理的核心知识,包括Series和DataFrame的创建、索引操作、数据导入导出、数据清洗(重复值处理、缺失值填充、异常值检测)以及索引重置等实用技巧。通过思维导图形式系统梳理了Pandas常用功能,结合代码示例演示了数据增删改查、条件筛选、行列操作等关键方法,并提供了多种数据清洗方案。文章特别强调了数据质量处理的重要性,详细讲解了3σ原则、箱线图检测等异常值处理方法,以及均值、众数、插值等多种缺失值填补技术,适合数据分析和Python编程学习者快速掌握Pandas的核心应用。

2024-09-27 21:08:28 886

原创 Python基础知识 - 导图笔记【四】

本文是一份Python学习笔记,主要涵盖面向对象编程、模块与包、文件处理三大核心内容。面向对象部分详细介绍了类的组成、实例化、三大特征(封装、继承、多态)及特殊方法;模块与包章节讲解了模块导入、包管理及常用内置模块;文件处理部分包含文件读写操作、OS模块应用等实用技巧。笔记采用理论+代码示例的形式,适合Python初学者系统学习,作者作为自学人士特别标注了学习难点和注意事项

2024-09-26 21:58:08 793

原创 Python基础知识 - 导图笔记【三】

本文是一份Python学习笔记,重点整理了字符串操作和函数相关的核心知识点。主要内容包括: 字符串驻留机制及查询、大小写转换、对齐、劈分、判断等操作 字符串格式化、编码转换、比较、切片等高级用法 函数创建与调用,参数传递方式(位置/关键字参数) 可变参数、默认参数等参数定义方式 变量作用域(局部/全局变量) 递归函数原理与实现 常见异常类型及try-except异常处理机制 笔记以自学者的视角整理,包含大量代码示例和详细解释,适合Python初学者参考学习

2024-09-26 21:51:08 398

原创 Python基础知识 - 导图笔记【二】

Python基础的重要性不言而喻,它是掌握这门强大编程语言的关键。扎实的基础知识能够帮助初学者快速理解更复杂的编程概念和技术。因此,精通Python基础不仅能够提高编程效率,还能为深入学习高级技术打下坚实的基础,是每个程序员成长道路上的重要一步。本文是在学习Python基础知识时所做的笔记和思维导图。可供给新人在学习过程中使用的资料,我是靠自学而来,非计算机专业,懂得初入学者的在学习中的难点痛点。

2024-09-25 20:38:58 374

原创 Python基础知识 - 导图笔记【一】

本文是一份Python基础学习笔记,涵盖初学者需要掌握的核心知识点。主要内容包括:1)基础语法(print函数、转义符、保留字、注释变量);2)数据类型(整数、浮点数、布尔、字符串及类型转换);3)运算符(算术、赋值、比较、布尔、位运算);4)流程控制(if选择结构、for/while循环结构及break/continue语句);5)循环应用(累加、水仙花数等案例)。笔记采用思维导图形式,配合代码示例,特别适合自学Python的非计算机专业学习者。作者分享了学习资源和经验,欢迎读者交流指正

2024-09-25 20:34:24 286

原创 Pandas基础知识 - 思维导图

Pandas是Python中一个非常强大的数据处理库,广泛应用于数据分析、数据清洗和数据可视化等领域。它提供了丰富的数据结构和操作方法,使得处理表格数据变得更加简单高效。本篇思维导图旨在帮助读者快速了解和掌握Pandas的基本概念、常用功能和操作技巧。通过这张思维导图,您将能够更加系统地学习和应用Pandas,提升数据处理的效率和质量。

2024-09-23 21:07:00 956

原创 房屋价格预测分析(可视化+GSRF)

实际上分析其实不仅仅这几个,由于时间和精力的原因,还有几个角度没有编写出来,若感兴趣学习的朋友可以翻到最下面。

2024-09-23 20:49:19 1793

原创 Python基础知识 - 思维导图

本文分享了Python基础学习笔记和思维导图,强调基础学习的重要性,适合编程新手参考。作者以自学经验为基础,整理了清晰的学习资料,建议读者下载图片放大查看详细内容。文章最后呼吁点赞收藏关注,并预告将持续分享更多学习资源。全文突出了Python基础知识对编程入门的关键作用,为非科班出身的学习者提供了实用指导。

2024-09-22 14:59:16 434

原创 医药电商销售分析(数分+ARIMA)

在当前这个数据驱动的时代,数据分析已经成为了各个行业决策过程中至关重要的一环。本文是“2022年全国大学生数据分析大赛”的一个比赛题目。虽然时间已经过去一段时间,但这篇文章仍具有学习和分享的价值,可以给那些刚踏入数据分析领域的人提供一个学习和思考的机会项目。希望这篇文章能对您的学习和工作有所帮助,同时也期待与大家一起交流和探讨!

2024-09-22 14:19:10 1629

原创 股票量化回测分析(金死叉策略)

在金融市场中,股票价格的波动受到多种因素的影响,包括经济数据、公司业绩和政策变化等。为了分析和预测股票价格的走势,投资者可以借助各种技术指标和分析方法,如:金叉死叉、相对强弱指标(RSI)和移动平均线(MACD)等技术指标。这些指标可以辅助投资者识别股票价格的趋势和反转点,从而指导投资者进行买卖决策。然而,需要注意的是,技术指标和分析方法并不能完全预测股票价格的走势,它们只是提供了一种辅助工具。技术指标也可能存在滞后性和误导性的问题,因此投资者应谨慎使用,并结合基本面分析和市场情绪等因素进行综合判断。

2023-07-11 11:47:04 2755 1

《深入浅出统计学》学习笔记

特殊说明:《深入浅出统计学》的学习笔记在本人博客文章里已经发表了,分为了三篇文章。这pdf是总的学习笔记,因为是在飞书做的,所以写在csdn的格式有点乱以及部分重点没有用颜色标。这总的pdf是从飞书原版笔记导出来的,因此观感是更好!!! 内容概要:本文档为《深入浅出统计学》的学习笔记,系统梳理了统计学核心知识点,涵盖数据的图形化表示、集中趋势与离散程度的度量、概率论基础、常见概率分布(几何、二项、泊松、正态)、抽样方法、参数估计、置信区间构建、假设检验、卡方检验以及相关与回归分析。重点强调了频数与百分比的结合使用、定性与定量数据的区别、异常值对均值的影响、方差与标准差的深层含义、条件概率与贝叶斯定理的应用、中心极限定理的核心思想,以及相关关系与因果关系的根本区别。 适合人群:具备高中及以上数学基础,正在学习统计学或数据分析的初学者,包括在校大学生、刚进入数据分析领域的职场新人,以及希望通过自学掌握实用统计技能的爱好者。 使用场景及目标:①帮助读者快速理解和掌握统计学基本概念与方法,构建系统的知识框架;②指导读者在实际工作中正确选择和应用统计工具,如使用箱线图评估数据稳定性、利用假设检验验证业务猜想、通过回归分析探索变量关系;③澄清常见的统计误区,如‘平均数’的歧义、‘相关即是因果’的谬误,提升数据解读能力。 阅读建议:建议读者结合实例动手计算和绘图,尤其是对概率分布、置信区间和假设检验等抽象概念,通过反复练习加深理解。在学习过程中,应重点关注不同统计方法的前提条件和适用场景,避免误用。对于复杂的推导过程,可先把握其直观意义和应用逻辑,再逐步深入细节。

2025-11-05

银行卡电信诈骗危险预测分析(DTM+GSCV)

诈骗行为无处不在,随之社会的进步,科技的发展,诈骗手段也在不断的提升。作为众多诈骗手段之一的:银行卡电信诈骗,也是不容忽视的。为此,我们将对其进行相关的模型建立,进行危险预测 (1)掌握使用Pandas库实现数据预处理和统计分析。 (2)掌握使用Matplotlib库实现常用图表的绘制。 (3)掌握多种机器学习分类模型原理和实现过程。 (4)掌握对各种机器学习模型进行优化,通过交叉验证、网格调优对不同模型的参数进行调整,寻找最优解,将多个最优模型进行进一步比较。 (5)掌握通过对 precision(预测精度)、recall(召回率)、f1-score(F1分数值)进行计算,给出选择某一种预测模型的理由。

2025-09-11

医药电商销售分析(数分+ARIMA)

随着国家政策的逐步开放,越来越多的药品可以在网络上购买, 医药电商平台蒸蒸日上,受新冠疫情的影响,线下药店购买困难,更 让医药电商进入了更多消费者的视野,各大药企也纷纷加大力度布局 医药电商领域。但电商模式与线下零售有所不同,如何更好的经营医 药电商成为药企急需解决的问题。本题采集了天猫维生素类的药品, 请针对维生素药品进行数据的清洗、分析与挖掘 1.对店铺进行分析,一共包含多少家店铺,各店铺的销售额占比如何?给出销售额占比最高的店铺,并分析该店铺的销售情况。 - 2.对所有药品进行分析,一共包含多少个药品,各药品的销售额占比如何?给出销售额占比最高的10个药品,并绘制这10个药品每月销售额曲线图。 - 3.对所有药品品牌进行分析,一共包含多少个品牌,各品牌的销售额占比如何?给出销售额占比最高的10个品牌,并分析这10个品牌销售较好的原因? - 4.预测天猫维生素类药品未来三个月的销售总额并绘制拟合曲线,评估模型性能和误差

2025-09-12

Python基础知识(思维导图+学习笔记).zip

压缩包里含有丰富的Python基础的资源和代码,思维导图全程是手打上去,本人非计算机专业,自学数据分析,目前工作岗位是大数据分析;这些基础的内容分享给大家,我明白自学数据分析的不易,内涵许多自己在学习过程的注释,后期我会在自己的博客文章里慢慢的发表内容,对于心急学习的伙伴们就可以下载提取学习,希望可以给各位带来帮助! 文章里包涵了:print函数,转义符,保留字,变量三部分,整数类型int( ),浮点类型float( ),布尔类型bool( ),字符串类型str( ),类型转换,算术运算符,赋值运算符,比较运算符,布尔运算符,运算符优先级,选择结构,循环语句,字典,元组,集合,列表,字符串,函数创建,函数返回值,参数总结,变量的作用域,Bug,常见的异常类型,try...except...else...finally结构,面向对象,类的组成,对象实例化,动态绑定,三大特征,模块和包,文件处理,with语句,os模块,os.path模块

2024-09-25

Pandas基础知识(思维导图+学习笔记).zip

压缩包里含有丰富的Pandas的资源和代码,它不仅包含了丰富的Pandas知识和代码示例,还附有我亲手绘制的思维导图。虽然我并非计算机专业出身,但我通过自学数据分析,最终在大数据分析师的岗位上找到了自己的位置。这些基础内容是我在学习过程中积累的心得与经验,现在我愿意分享给同样热爱数据分析的朋友们。我深知自学数据分析的道路充满挑战,因此我在学习资料中加入了大量个人注释,希望能够帮助后来者更好地理解和掌握相关知识。随着时间的推移,我会在我的博客上逐步发布更多内容,但对于那些渴望立即开始学习的朋友们,现在就可以下载这个压缩包,提前获取学习材料。我希望这些资源能够对你们有所帮助,让你们在数据分析的道路上少走弯路,更快地达到目标。让我们一起努力,探索数据的奥秘,挖掘数据的价值! 文章里包涵了:对象创建,数据导入,数据提取,数据增删改,数据清洗,重置索引,数据格式化,数据计算,排序和排名,分组聚合,数据移位,数据转化,日期数据,数据导出,数据合并,时间序列等内容~

2024-09-25

股票量化回测分析(金死叉策略)

在金融市场中,股票价格的波动受到多种因素的影响,为了分析和预测股票价格的走势,投资者可以借助各种技术指标和分析方法。本文旨在通过建立机器学习模型策略对股票价格进行回测的分析,以帮助投资者评估和优化投资策略,从而减少投资风险。 选取了铭普光磁(SZSE.002902)股票,采用了贝叶斯优化调整xgboost模型的超参数,得到了最优的模型参数组合:colsample_bytree:0.8308;learning_rate:0.3443;gamma:0.2381;max_depth:4.0。最后测试集得到的精确度:0.53,效果相对一般,但也不错。 根据对测试集的预测结果进行策略买卖回测,增加了买卖交易的手续费---万一免五。一共进行了63次的买入和卖出,最后由初始资金100000元赚取到为179519.77元,共赚取了79519.77元。为了更好评估该模型回测的效果,计出夏普比率为15.6349,最大回撤为30.24% 这一研究对于股票策略的优化和改进具有一定的参考价值。回测结果仅仅是对过去一段时间的模拟,不能保证未来的表现。因此,在实际应用中,需要谨慎对待回测结果,并不断优化和调整策略。

2024-09-25

房屋价格预测分析(可视化+GSRF)

通过密切关注时事变化以及大量的资料翻阅,我们致力于查找出那些对房屋销售和价格产生影响的关键指标。一般来说,大部分销售和房价的影响因素都是较为类似的,然而,也存在部分影响指标需要通过深入的数据分析才能得出。 为了准确找出影响房屋销量和总价格的指标,我们对 “house 文件数据” 进行了全面的预处理操作。首先,针对数据中的缺失值,我们采用了合理的填充方法,确保数据的完整性。接着,我们对每个指标进行了数量分布以及与房屋总价格关系的可视化。 基于问题二得出的影响房屋总价格的特征指标,我们选择了网格搜索随机森林(GSRE)算法进行房屋总价格的预测。随机森林算法具有强大的预测能力和鲁棒性,能够有效地处理高维度数据和非线性关系。而网格搜索则可以帮助我们对模型进行参数优化选择,以得出更好的预测效果。 为了方便深入了解分析过程和结果,提供了丰富的资源: 1.源代码(完整的数据分析流程代码,便于复现分析结果); 2.上万的完整论文(深入探讨了数据分析的各个方面,包括指标选择、数据预处理、模型建立与优化等); 3.处理前后的数据(分享了原始数据及经过处理后的数据); 4.参考文献。

2024-09-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除