- 博客(55)
- 收藏
- 关注

原创 最全的 数据分析/机器学习/深度学习/数据挖掘 项目实战集合
1、关于房间传感器监测数据集的探索2、EEMD-LSTM模型择时策略 — 1.EEMD分解与LSTM模型搭建3、EEMD-LSTM模型择时策略 — 2. 量化回测4、国际超市电商销售数据分析5、基于问卷调查数据的多元统计数据分析与预测(因子分析、对应分析与逻辑回归)6、手写文本识别7、语音情感识别8、电商会员门店消费数据分析9、糖尿病风险预测模型分析与构建10、基于卷积神经网络(CNN)和ResNet50的水果与蔬菜图像分类系统11、学生抑郁情况可视化分析及预测
2025-02-21 09:50:35
230
原创 适合各个层次的 7 个计算机视觉项目【1】:植物病害检测
植物病害检测是计算机视觉在农业领域的一个重要应用。您将学习如何加载、处理和扩充数据集,构建深度神经网络模型,并在数据集上训练模型。该项目有助于理解图像分类,并通过实现早期病害检测为可持续农业做出贡献。.4f。
2025-03-25 19:59:08
242
原创 电商产品评论数据情感分析
针对用户在电商平台上留下的评论数据,对其进行分词、词性标注和去除停用词等文本预处理。基于预处理后的数据进行情感分析,并使用LDA主题模型提取评论关键信息,以了解用户的需求、意见、购买原因及产品的优缺点等,最终提出改善产品的建议一些电商平台为了避免一些客户长时间不进行评论,往往会设置一道程序,如果用户超过规定的时间仍然没有做出评论,系统就会自动替客户做出评论,这类数据显然没有任何分析价值。由语言的特点可知,在大多数情况下,不同购买者之间的有价值的评论是不会出现完全重复的,如果不同购物者的评论完全重复,那么这些
2025-03-20 20:06:29
1050
原创 基于CNN的多种类蝴蝶图像分类
这次这个基于cnn的图像分类,获得了高于 70% 的准确率。可以加载我保存好的模型进行预测试试,感兴趣的还可以继续调参训练# 若需要完整数据集以及代码请点击以下链接。
2025-03-17 20:17:34
597
原创 基于深度卷积神经网络的水果蔬菜图片分类预测
本次主要使用的为深度卷积神经网络,对36种水果蔬菜图片进行模型训练,预测可视化等首先对数据集进行分析查看,数据集包含2个G的图片,包含3个文件夹,分为训练集、测试集、验证集其次对数据集图像进行预处理,具体使用为图像增强接下来使用增强后的数据集对深度卷积神经网络模型进行训练,卷积神经网络对多分类图像处理还是比较强的最后使用训练的模型使用测试集进行预测评估,随机选取图像可视化结果并展示。
2025-03-17 14:03:35
501
原创 跨模态智能脑肿瘤检测
脑肿瘤的早期检测和诊断对患者的治疗效果至关重要。随着医疗成像技术的进步,**计算机断层扫描(CT)和磁共振成像(MRI)**已成为最常用的脑部影像学检查方法。这些成像技术能够提供关于脑部结构和病变的关键信息,帮助医生准确地诊断肿瘤类型和位置。然而,传统的人工诊断依赖医生的经验,且常常受到主观因素的影响,特别是在复杂或早期的肿瘤案例中,准确性和效率可能受到限制。因此,利用机器学习和深度学习技术对这些医学图像进行自动化分析,成为近年来医学影像领域的一个重要研究方向。
2025-03-14 18:13:25
731
原创 基于Attention U-Net与SAR影像的滑坡识别
Dice 系数常用于评估图像分割任务中预测结果与真实标签的相似度,取值范围在 0 到 1 之间,越接近 1 表示预测结果与真实标签越相似。而 Dice 损失函数则是基于 Dice 系数定义的,用于在训练模型时作为优化目标,使得模型在训练过程中不断减小该损失值,从而提高预测的准确性。smooth = 1#Dice 系数#Dice 损失函数精确率关注预测的准确性,召回率关注对正例的捕捉能力,F分数综合了两者,交并比则直观地反映了预测区域和真实区域的重合程度。
2025-03-14 16:39:18
635
原创 某快餐店用户市场数据挖掘与可视化
从年龄均值来看,簇 0 的顾客相对年轻,平均年龄约为 31 岁,而簇 1 的顾客平均年龄约为 56 岁,两者存在明显的年龄差异。在喜欢程度方面,两个簇的均值都比较高且较为接近,不过簇 1 的喜欢程度均值略高于簇 0,这可能暗示年龄较大的顾客对相关事物的喜欢程度稍高一些,但差异并不是非常显著。
2025-03-12 14:38:07
1016
原创 搭建VGG16模型实现新冠肺炎CT图像识别
笔者在这里选择通过继承nn.Module的方式来构建神经网络;在正式构建模型以前,我们先升级一下pip和安装torchsummary!!# 导入torchsummary from torchsummary import summary大家可以参考以下这张图片,根据卷积核大小和卷积层数目的不同,VGG可以分为以下6种子模型,笔者在这里选择手动构建一个VGG-16 D模型。# 定义神经网络模型(VGG-16)# 第一层:2个卷积层和1个池化层# 输入3通道,输出64通道。
2025-02-28 11:21:56
357
原创 基于U-Net与EfficientNet的衣物智能分割
在深度学习中,数据预处理和数据增强是提高模型泛化能力的关键步骤。本部分展示了如何为服装图像分割任务准备训练数据和验证数据,并应用不同的数据增强技术,以增强模型对不同情况的适应性。通过将数据集进行随机裁剪、水平翻转、平移、缩放和旋转等增强操作,模型能够学习到更多的图像变换特征,提高其在实际应用中的表现。我们首先定义了MyDataset类,继承自PyTorch的Dataset类,实现了自定义的数据集加载与处理。
2025-02-27 15:16:26
1121
原创 基于数据技术的互联网行业招聘信息聚合系统
基于数据技术的互联网行业招聘信息聚合系统本系统以Python为核心,依托web展示,所有功能在网页就可以完成操作,爬虫、分析、可视化、互动独立成模块,互通有无。具体依托python的丰富库实现,爬虫使用Requests爬取,使用lxml、beautifulsoup4解析。使用numpy、pandas分析数据,使用pyecharts做可视化,使用Flask进行web后台建设。数据通过csv、MySQL、配置文件来进行存储互通。
2025-02-27 09:42:22
280
原创 基于数据可视化学习的卡路里消耗预测分析
ps:由于histplot 函数是在 seaborn 0.11.0 版本中引入的;通过分析这些数据,探索用户在进行身体活动时的热量消耗情况,即目标变量Calories,从而为个性化健身计划或健康管理提供数据支持。分析特征对模型预测的贡献程度,帮助理解哪些因素对热量消耗的影响最大。Random Forest Regressor 随机森林回归。用 XGBoost 构建预测模型,并通过交叉验证评估模型性能。总结:通过数据分析可视化,清晰直观发现。Key Indicators 关键指标。
2025-02-23 00:16:34
674
原创 基于LSTM的机场天气分析及模型预测
本数据集提供了英国希思罗机场1979 - 2023年的每日天气观测数据(STAID: 1860)。数据来自欧洲气候评估和数据集(ECA&D),包括多个天气参数,如温度、降水、日照等。根据红色的预测线和蓝色的真实线对比来说,有一定的准确率,真实值高的时候预测值也高,但是预测值波动幅度没有真实值大。先使用One-Hot进行季节编码再使用MinMaxScaler进行标准化。数据文件中包含了若干评估数据质量的字段,如。使用回归插值进行缺失值填充。
2025-02-21 11:17:02
1483
原创 关于房间传感器监测数据集的探索
上述的分析可能会有不好或者不精准的地方,希望各位读者朋友们帮忙指出。在我阅读完数据来源中的论文时发现,上述的分析方法和逻辑跟原始研究背景和问题敲定有很大偏差,(这里我只能苦笑了),以下是原数据论文阅读理解9.1 问题定义与研究背景核心问题:通过非侵入式传感器数据准确估计房间内人数,优化HVAC系统能源效率。研究动机:传统方法依赖侵入式设备(如摄像头、WiFi)存在隐私问题,且现有研究多集中于占用检测(是否有人),而非具体人数估计。9.2 实验设计与数据采集传感器部署。
2025-02-20 19:39:39
1044
原创 Go语言中有哪些必须要手动对齐内存的情况
某些自定义数据格式或网络协议可能有特定的对齐要求,需要在Go中手动对齐以符合这些要求。与C代码交互时使用cgo使用unsafe包进行内存操作性能关键代码中的SIMD指令处理特定架构的对齐要求自定义数据格式或网络协议在这些情况下,通过使用unsafe包、添加垫片或仔细的内存分配策略,可以确保内存对齐的正确性,从而避免潜在的错误和性能问题。
2025-02-20 19:18:22
310
原创 EEMD-LSTM模型择时策略 --- 2. 量化回测
我们已经得到了一个使用前七天的数据预测下一天收盘价数据的模型, 由于该方法将于量化中最为常见的进行比较。
2025-02-13 15:33:21
432
原创 EEMD-LSTM模型择时策略 --- 1.EEMD分解与LSTM模型搭建
量化思路介绍:EEMD分解 + LSTM预测数据方面: 分为训练集, 验证集与测试集测试集为题目指定的2022年至2024年4月30日数据, 即后562条数据验证集为后762至562条数据, 主要目的是控制模型早停, 避免过拟合测试集为前2717条数据, 即去掉验证集与测试集的数据主要原理:二. 数据读取与预处理1.数据读取2.数据类型转换四. 训练并保存LSTM模型模型在验证集上的mape为0.61, 测试集上的mape为0.66, 从图中也可以看出模型预测效果
2025-02-13 15:24:50
770
原创 Go语言中有哪些必须要手动对齐内存的情况
某些自定义数据格式或网络协议可能有特定的对齐要求,需要在Go中手动对齐以符合这些要求。与C代码交互时使用cgo使用unsafe包进行内存操作性能关键代码中的SIMD指令处理特定架构的对齐要求自定义数据格式或网络协议在这些情况下,通过使用unsafe包、添加垫片或仔细的内存分配策略,可以确保内存对齐的正确性,从而避免潜在的错误和性能问题。
2025-01-03 11:26:14
356
原创 Go语言中的逃逸分析:深入浅出
逃逸分析是编译器在编译阶段进行的一种静态分析,用于确定一个变量的作用域是否超出其声明的函数范围。如果变量的作用域超出了函数范围,也就是说,变量的生命周期超出了函数的执行时间,那么这个变量就会“逃逸”到堆上;否则,它将保留在栈上。在Go语言中,栈内存的管理比堆内存更高效,因为栈内存是连续的,并且由编译器自动管理。而堆内存则由垃圾回收器(GC)管理,分配和释放堆内存的开销相对较高。因此,逃逸分析可以帮助编译器在可能的情况下将变量保留在栈上,从而提高程序的性能。
2025-01-03 10:10:32
1064
原创 数据挖掘教学指南:从基础到应用
数据挖掘(Data Mining)是从大量数据中提取有用信息和知识的过程。其目标是发现数据中的模式、关联、异常和趋势,从而为决策提供支持。数据挖掘是一门充满挑战和机遇的学科。通过系统的学习和实践,学生可以掌握这一强大的工具,为未来的职业生涯打下坚实的基础。希望本文能为数据挖掘的教学提供一些有益的参考。
2025-01-02 16:51:57
1094
原创 国际超市电商销售数据分析
2.总利润为146.8万元,其中【Copiers,Phones,Bookcases ,Appliances,Chairs,Accessories,Storage,Binders】8类子产品提供了80%的利润,可以重点关注这8类产品,增大库存与营销宣传,吸引客户下单;1.在三类客户群体中,Consumer类型客户是该超市的主力群体,对利润贡献度最大占据整体利润的51.1%,其次是Corporate企业类型客户,利润占比为30.1%,最后是Home Office政府类型客户。需要当地部门深入了解分析原因。
2025-01-02 16:47:16
1096
原创 Golang 中 Goroutine 的调度
Golang 的 Goroutine 调度机制通过 M:N 模型实现了高效的并发执行。调度器负责管理 Goroutine 的生命周期和执行顺序,确保每个 Goroutine 都有机会被执行。通过抢占式调度和 work stealing 策略,Go 运行时能够高效地利用系统资源,实现高性能的并发编程。
2024-12-31 17:14:52
803
原创 Go语言中值接收者和指针接收者的区别?
值接收者的方法接收的是调用对象的一个副本,方法内部对该副本的修改不会影响原对象。指针接收者的方法接收的是调用对象的地址,方法内部对接收者的修改会直接作用于原对象。值接收者适合不可变操作;指针接收者适合可变操作。指针接收者避免了拷贝大对象的开销,但增加了代码复杂性。选择接收者类型时,应根据方法的用途和对象的大小权衡。
2024-12-30 17:00:37
924
原创 基于问卷调查数据的多元统计数据分析与预测(因子分析、对应分析与逻辑回归)
因子 0: 婚姻和谐与共同目标因子 1: 冲突与负面情绪因子 2: 沉默与逃避因子 3: 家庭时间与亲密感因子 4: 自我辩护与指责点二列相关系数是一种用于衡量连续变量和二分类变量之间相关性的统计方法。一个变量是连续的(如问卷得分)。另一个变量是二分类的(如是/否、成功/失败、离婚/未离婚等)。点二列相关系数的取值范围为[-1, 1]1:表示完全正相关。-1:表示完全负相关。0:表示无相关性。
2024-12-30 10:40:11
2316
原创 手写文本识别
手写文本识别系统通过TensorFlow实现,并在MNIST手写数字数据库上进行训练。这个神经网络模型将识别图像中包含的单个字母或单词。我们将使用Python3、Numpy、TensorFlow 2.3和OpenCV。这里有一个基于Web的应用,允许用户上传手写数字图像或直接在应用内绘制数字,并让模型预测用户输入的内容。
2024-12-28 10:52:38
338
原创 Go语言高并发实战案例分析
基础案例展示了goroutine和WaitGroup的基本用法进阶案例引入了更复杂的并发控制和数据结构实战案例整合了多个并发特性,实现了一个完整的系统正确使用锁机制避免竞态条件合理设计channel缓冲区大小注意goroutine的生命周期管理实现适当的错误处理和资源清理考虑系统的可扩展性和维护性。
2024-12-27 17:14:43
651
原创 语音情感识别
语音是人类最自然的表达方式。因此,将这种交流方式扩展到计算机应用是很自然的选择。我们将语音情感识别(SER)系统定义为一系列处理和分类语音信号以检测其中包含情感的方法。本项目探索了不同的音频特征和基于CNN的架构,以构建有效的语音情感识别(SER)系统。目标是提高检测语音信号中情感的准确性。该代码库包含代码、笔记本和实验的详细说明,包括特征提取技术、模型架构、训练程序和评估指标。欢迎对语音处理和情感识别感兴趣的贡献者探索并参与此项目。
2024-12-27 14:45:46
1103
原创 Go语言反射从入门到进阶
Go 语言的反射机制为我们提供了强大的运行时类型信息和值操作能力。检查类型信息获取和修改值访问结构体字段和方法实现通用的框架和工具但是,反射也带来了性能开销和代码复杂性,因此应该在合适的场景下谨慎使用。在实际开发中,建议遵循"实用性"原则,在确实需要反射的场景下再使用它。
2024-12-27 10:17:49
533
原创 糖尿病风险预测模型分析与构建
对于这个数据集,由于它相对较小且特征数量不多,我们可以先尝试使用逻辑回归和决策树作为初步的模型,然后根据性能考虑是否需要使用更复杂的模型。选择适合的机器学习模型通常取决于数据集的特性以及我们想要解决的问题。数据集中没有缺失值,我们可以直接进行分析而无需进行缺失值处理。
2024-12-24 01:53:40
1602
原创 ResNet50(Residual Network 50 layers)卷积神经网络(CNN)架构。
ResNet50是ResNet网络中的一种变种,它的结构具有50个层次,因此得名"50"。和其他深度网络相比,ResNet50的设计使得网络层数大幅增加,同时保持了良好的训练效果和性能。ResNet50的主要创新是通过。
2024-12-21 23:30:43
1882
原创 基于卷积神经网络(CNN)和ResNet50的水果与蔬菜图像分类系统
这部分代码定义了一个自定义的PyTorch Dataset 类,FruitVegDataset,用于加载数据集,并支持图像的转换(如缩放、裁剪等)。
2024-12-21 23:22:20
1668
2
原创 Go语言中的闭包函数:强大而灵活的编程工具
闭包是一个函数值,它引用了其外部作用域中的变量。简单来说,闭包"封闭"了外部作用域中的某些变量。这使得这个函数能够访问并操作其外部作用域中的变量。
2024-07-03 15:50:21
596
1
原创 Go语言中的可变参数:灵活而强大的函数参数
可变参数允许你传递零个或多个值给函数。在Go中,可变参数函数的声明方式是在参数类型前面加上省略号(...// 函数体其中,args是一个切片,类型为[]Type。
2024-07-03 15:43:43
1126
原创 深入理解Golang中的接口与实例展示
通过本文的学习,读者将对Golang中的接口有深入的理解,并学会如何在实际应用中设计和使用接口。接口的灵活性和多态性为Golang代码提供了更多的可能性,通过良好的接口设计,我们可以写出更具扩展性和可读性的代码。本文将深入讲解Golang中的接口概念,从基础到实际应用,通过详细案例展示,帮助读者更好地掌握接口的使用和设计。在Go中,接口定义了一组方法的集合,任何类型只要实现了这组方法,就被认为是实现了接口。Golang中的类型可以同时实现多个接口,这为代码的组织和扩展提供了更大的灵活性。
2024-01-12 15:23:42
813
1
原创 Golang 并发编程详解
通过本文,我们深入了解了 Golang 中的并发编程,包括 goroutine、channel 以及一些常见的并发模式。并发编程使得 Golang 在处理高并发任务时表现出色,开发者可以通过合理使用并发特性来提高程序性能。希望读者通过本文的学习,能更好地应用 Golang 中的并发编程,构建高效、稳定的软件系统。
2024-01-10 10:12:59
1500
2
原创 pip基本命令使用
pip是 Python 社区中最流行的包管理器之一。通过掌握这些基本命令,您可以轻松地安装、升级、卸载和管理 Python 包。在项目中使用虚拟环境是一种良好的实践,它有助于隔离不同项目的依赖关系。希望这篇博客对您学习如何使用pip有所帮助!
2023-12-21 15:26:10
439
原创 深入理解 Golang 中 Channel 的用法:从简单到复杂
在 Golang 中,Channel 是一种强大的并发原语,用于在不同的 goroutine 之间进行通信和同步。本文将从简单的 Channel 用法开始,逐步深入,介绍如何使用 Channel 实现并发控制、数据传递以及更复杂的通信模式。
2023-12-21 15:11:42
1097
基于Vue和Gin的全栈开发平台,快速上手、功能丰富
2024-12-27
120年奥运历史数据集:运动员和成绩
2023-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人