- 博客(15)
- 收藏
- 关注
原创 脱发因素可视化分析及机器学习预测
摘要: 该研究分析了可能导致脱发的多种因素,包括遗传、荷尔蒙、医疗状况等12个变量。数据预处理包括标准化列名、处理缺失值和二值转换。可视化分析显示:49.7%的样本存在脱发,脱发人群平均年龄更高。斑秃、甲状腺问题等医疗状况与脱发显著相关。研究采用随机森林、XGBoost等方法构建预测模型,为脱发风险识别提供数据支持。
2025-06-24 10:17:01
881
原创 国际超市电商销售数据分析
国际超市销售数据分析报告摘要 本报告采用"人、货、场"三维分析法,结合时间维度,对某国际超市销售数据进行了深入分析。在客户维度上,Consumer客户群体贡献了最大利润(49.8%),尤其在科技产品领域表现突出;产品维度显示Phones和Copiers两类产品贡献超30%利润,但家具类产品中的Tables出现亏损;区域维度分析揭示不同市场的销售特点。研究还应用帕累托法则识别了核心客户群体。分析工具方面,特别推荐使用BI工具进行多维度的可视化探索。基于分析结果,报告提出了优化产品结构、调整
2025-06-11 11:50:00
1007
原创 EEMD-LSTM模型择时策略 --- 2. 量化回测
我们已经得到了一个使用前七天的数据预测下一天收盘价数据的模型, 由于该方法将于量化中最为常见的进行比较。
2025-06-10 09:38:00
984
原创 EEMD-LSTM模型择时策略 --- 1.EEMD分解与LSTM模型搭建
量化思路介绍:EEMD分解 + LSTM预测数据方面: 分为训练集, 验证集与测试集测试集为题目指定的2022年至2024年4月30日数据, 即后562条数据验证集为后762至562条数据, 主要目的是控制模型早停, 避免过拟合测试集为前2717条数据, 即去掉验证集与测试集的数据主要原理:二. 数据读取与预处理1.数据读取2.数据类型转换四. 训练并保存LSTM模型模型在验证集上的mape为0.61, 测试集上的mape为0.66, 从图中也可以看出模型预测效果
2025-06-10 09:36:41
966
原创 关于房间传感器监测数据集的探索
上述的分析可能会有不好或者不精准的地方,希望各位读者朋友们帮忙指出。在我阅读完数据来源中的论文时发现,上述的分析方法和逻辑跟原始研究背景和问题敲定有很大偏差,(这里我只能苦笑了),以下是原数据论文阅读理解9.1 问题定义与研究背景核心问题:通过非侵入式传感器数据准确估计房间内人数,优化HVAC系统能源效率。研究动机:传统方法依赖侵入式设备(如摄像头、WiFi)存在隐私问题,且现有研究多集中于占用检测(是否有人),而非具体人数估计。9.2 实验设计与数据采集传感器部署。
2025-06-09 09:55:01
845
原创 基于LSTM的机场天气分析及模型预测
本数据集提供了英国希思罗机场1979 - 2023年的每日天气观测数据(STAID: 1860)。数据来自欧洲气候评估和数据集(ECA&D),包括多个天气参数,如温度、降水、日照等。根据红色的预测线和蓝色的真实线对比来说,有一定的准确率,真实值高的时候预测值也高,但是预测值波动幅度没有真实值大。先使用One-Hot进行季节编码再使用MinMaxScaler进行标准化。数据文件中包含了若干评估数据质量的字段,如。使用回归插值进行缺失值填充。
2025-06-09 09:47:55
840
原创 基于数据可视化学习的卡路里消耗预测分析
运动能量消耗数据分析摘要 研究分析了用户运动数据与热量消耗的关系,数据集包含性别、年龄、身高、体重、运动时长、心率和体温等指标。通过数据可视化发现:运动持续时间与卡路里消耗呈强正相关(r=0.89),心率与卡路里消耗也呈正相关(r=0.87)。男性平均消耗略高于女性,但统计检验显示差异不显著(p>0.05)。特征工程处理后,采用随机森林和梯度提升回归模型预测热量消耗,模型表现良好。分析表明,延长运动时间和提高心率是增加能量消耗的有效方式,为制定个性化健身计划提供了数据支持。
2025-06-06 10:47:22
1161
原创 angjie Magic深度解析:基于仓颉编程语言的LLM Agent开发新范式
Cangjie Magic是首个基于仓颉编程语言的LLM Agent开发平台,提供三大创新技术:专用Agent DSL语言、高效MCP通信协议和智能规划引擎。其DSL语法简洁,支持声明式编程和自动类型推断,可将传统200行代码简化为30-50行。MCP协议在性能测试中优于gRPC和HTTP/2,吞吐量达12,500 msg/s。平台还集成改进的HTN规划算法,在电商客服等场景中实现响应时间从45秒降至8秒的突破。开发者可通过交互式REPL和可视化工具快速调试,社区正积极构建包括可视化编排、Agent市场等生
2025-06-06 10:13:50
3107
原创 基于Attention U-Net与SAR影像的滑坡识别
摘要 本研究提出了一种基于Attention U-Net和SAR数据的滑坡快速检测方法。针对传统光学影像在恶劣天气条件下的局限性,该方法利用SAR数据全天候观测优势,结合改进的深度学习模型实现滑坡识别。模型采用Attn-U-Net架构,通过引入注意力机制增强特征提取能力,并使用Dice系数作为评估指标。实验部分展示了模型构建的关键代码,包括注意力门控块、卷积块等核心组件,以及依赖库安装步骤。该方法为灾害应急响应提供了不受天气影响的可靠技术方案。 (字数:149)
2025-06-06 09:52:59
1276
原创 跨模态智能脑肿瘤检测
脑肿瘤的早期检测和诊断对患者的治疗效果至关重要。随着医疗成像技术的进步,**计算机断层扫描(CT)和磁共振成像(MRI)**已成为最常用的脑部影像学检查方法。这些成像技术能够提供关于脑部结构和病变的关键信息,帮助医生准确地诊断肿瘤类型和位置。然而,传统的人工诊断依赖医生的经验,且常常受到主观因素的影响,特别是在复杂或早期的肿瘤案例中,准确性和效率可能受到限制。因此,利用机器学习和深度学习技术对这些医学图像进行自动化分析,成为近年来医学影像领域的一个重要研究方向。
2025-06-05 16:15:16
920
原创 基于深度卷积神经网络的水果蔬菜图片分类预测
本次主要使用的为深度卷积神经网络,对36种水果蔬菜图片进行模型训练,预测可视化等首先对数据集进行分析查看,数据集包含2个G的图片,包含3个文件夹,分为训练集、测试集、验证集其次对数据集图像进行预处理,具体使用为图像增强接下来使用增强后的数据集对深度卷积神经网络模型进行训练,卷积神经网络对多分类图像处理还是比较强的最后使用训练的模型使用测试集进行预测评估,随机选取图像可视化结果并展示。
2025-06-05 09:22:54
1322
原创 基于CNN的多种类蝴蝶图像分类
本文基于卷积神经网络(CNN)实现了75种蝴蝶的图像分类。研究使用了6,499张训练图像和2,786张测试图像,首先通过数据可视化分析了类别分布情况。采用ImageDataGenerator进行数据增强和预处理,构建了包含3个卷积层、3个池化层和2个全连接层的CNN模型,并添加Dropout层防止过拟合。实验结果表明,该方法可以有效进行多类别蝴蝶图像分类。
2025-06-04 11:24:16
745
原创 小红书消费情况分析
本文分析了小红书用户购买行为数据,通过多元线性回归模型探究影响用户消费金额的关键因素。研究发现:参与平台活动的用户消费金额更高;第三方消费呈现两极分化趋势;用户历史消费金额与当前消费金额呈正相关。分析过程包括数据清洗(处理缺失值和重复值)、单变量与购买金额的散点分析,以及建立预测模型。结果表明,现有变量能够较好地预测用户消费金额,可为企业精准营销提供数据支持。
2025-06-04 09:46:58
517
原创 电商产品评论数据情感分析
本文基于电商平台用户评论数据,通过文本预处理、情感分析和LDA主题建模等方法,挖掘用户对产品的评价特征。研究首先进行评论去重、数据清洗、分词和词性标注,去除停用词后提取含名词的评论。通过词云分析发现"安装""售后""服务"等词高频出现,表明用户关注重点。采用词典匹配法进行情感倾向分析,结合知网情感词表将评论分为正面和负面两类。最终运用LDA主题模型提取评论关键主题,识别用户需求、产品优缺点,为产品改进提供数据支持。该方法有效实现了电商评论的情感挖掘
2025-06-03 14:58:57
1104
2
原创 2025全球库存动态追踪系统
摘要 本文基于全球产品库存数据,通过Python进行了数据处理、分析和可视化。首先对原始数据进行清洗,处理日期字段、拆分产品尺寸和颜色/尺寸信息。数据分析显示产品价格差异显著(10.22-499.97),库存波动较大(1-100件),保修期集中在1-3年。可视化方面,展示了各品类价格分布、库存-尺寸热力图、产品生命周期分布等关键信息。特别通过聚类分析方法,揭示了产品生命周期特征。研究结果为库存管理优化提供了数据支持,帮助识别产品类别特征和区域库存分布合理性。
2025-06-03 14:42:49
986
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人