- 博客(154)
- 收藏
- 关注
原创 基于BERT+MLP模型的仇恨言论文本分类
包含3个字段:id,文本内容,文本内容对应的类别。完整源码项目包获取→点击文章末尾名片!具体类别为:是否为仇恨言论。
2025-01-29 14:28:57
257
原创 基于迁移学习的ResNet50模型实现石榴病害数据集多分类图片预测
图像是从孟加拉国 Rajshahi 和 Pabna 的番石榴果园收集的,当时是 7 月的水果成熟季节,此时疾病最易感性。植物病理学家验证了图像分类的准确性。每张图像都经过预处理,以 RGB 格式预处理为 512 x 512 像素的一致大小,适用于深度学习和图像处理应用。不幸的是,番石榴生产受到降低产量的疾病的威胁。该数据集旨在帮助开发用于番石榴果实早期病害检测的机器学习模型,帮助保护收成并减少经济损失。该数据集包括 473 张番石榴果实的注释图像,分为三类。图像分类:适用于农业应用中的监督学习。
2025-01-22 15:18:23
758
原创 四个机器学习模型对比道路裂缝检测识别分类模型
课题使用的数据集为带标签的图像数据集,课题的目标为对于目标。数据预处理、模型搭建、模型训练、模型优化、模型检测、实验总结等过程。的图片,每种图片都包含有带裂痕的图片和不带裂痕的图片共两类图片。数据集中的部分图片可能存在着一定的遮挡干扰,例如阴影、建筑表面。粗糙、建筑表面脱落、拍摄角度变换、建筑表面的孔洞和背景噪声,目标数据。在机器学习的研究领域中,传统分类算法模型数量众多,适合的应用场景。展示并分析所使用的机器学习领域的分类模型(至少两种传统的机器学习。集的分类任务即为区分带裂痕和不带裂痕的图片。
2025-01-17 17:19:08
451
原创 敏感信息数据搜集系统全英文
例如,显示 “准确的敏感数据有助于我们更好地了解医疗保健需求,为每个人提供更好的服务 ”等信息,以强调所收集数据的价值。种族信息收集部分的标题为 “种族信息收集”,并附有简要说明: “请选择您的种族,这将有助于我们了解不同群体之间的健康差异。顶部导航栏: 页面顶部的导航栏包括几个重要选项: “数据收集“、”我的贡献“、”帮助中心“、”设置 "和其他链接。用户输入敏感数据后,系统会显示一个确认页面,其中包含用户提供的信息。用户可以在输入框中输入自己的宗教信仰,如果不愿意分享此信息,可以选择 “保密 ”选项。
2025-01-17 17:14:03
302
原创 基于机器学习的二手车价格预测数据分析可视化
数据集收录了上千条车辆登记信息,每一条记录都详尽地描述了一辆待售车辆的关键属性,涵盖品牌与型号、制造年份、里程数、燃料类型、发动机规格、变速器类型、外观与内饰颜色、事故历史以及所有权状况等 9 个重要特征。了解一辆车的具体制造年份可以帮助评估其技术先进程度及潜在的折旧情况;检查车辆的行驶里程是判断其使用状况和未来维护成本的重要依据;了解车辆是否经历过事故及其修复情况对于评估车况则直接影响到车辆的安全性和可靠性。本项目通过系统的数据分析和建模过程,深入探讨了影响二手车价格的多方面因素,并尝试构建预测模型。
2025-01-17 17:12:14
436
原创 LSTM模型实现光伏发电功率的预测
同时,针对时间序列数据特性,采用滑动窗口的方法生成特征序列(SEQ_LENGTH = 24),即利用过去24小时的特征数据来预测未来的有效功率。此外,模型采用了Adam优化器,并在每轮训练后进行了验证集评估,以实现最佳模型参数的选择,从而提升整体模型的收敛效果与泛化能力。数据清洗与缺失值处理:针对原始数据中的缺失值,项目采取了不同的填补策略。时间序列特征处理:在预处理阶段,模型使用滑动窗口法构建了特征序列(长度为24),即每次利用过去24小时的特征数据作为模型输入,用来预测下一时间步的发电功率。
2025-01-16 18:23:47
1392
原创 基于机器学习的电信用户流失预测与数据分析可视化
---对高价值客户的流失可能性进行建模评分,根据模型输出为每位高价值客户赋予流失得分(如 0 - 100 分),得分越高表明流失可能性越大,按得分区间(如 0 - 30 分低风险、31 - 60 分中风险、61 - 100 分高风险)对高价值客户进行分层管理。----将频道高价值客户单独分群,综合考量用户消费金额、消费频次、利润贡献、忠诚度(如会员等级、在网时长)等多维度指标,运用层次分析法(AHP)或专家打分法确定各指标权重,构建高价值客户评估体系,筛选出频道高价值客户群体,单独分群管理。
2025-01-16 18:03:23
482
原创 基于机器学习的用户健康风险分类及预测分析
本数据集包含若干健身房会员的详细信息,包括年龄、性别、体重、身高、心率、锻炼类型、身体脂肪比例等多项关键指标,旨在深入探索会员的健身习惯、生理状态及其与健康成果之间的联系。在这个日益注重健康与体能的时代,健身已成为许多人追求健康生活的重要组成部分。完整源码项目包获取→点击文章末尾名片!
2025-01-16 18:00:10
687
原创 游戏行业销售数据分析可视化
而Role-Playing-角色扮演类仍有一定的竞争力,Misc-混合类、Fighting-战斗类有一定的上升趋势。Sports-运动类和Shooter-射击类顺序互换,但我估计现在大环境局势紧张可以会推动射击游戏的火爆!可看出最近五年用户最喜爱的游戏类型依然还是Action-动作类(当然市场发行的也很多)Platform-横板类可能由于当时3D游戏技术的发展渐渐淡出视野,退出前5地位。完整源码项目包获取→点击文章末尾名片!字段有11列、数据量16598行。
2025-01-16 17:55:13
265
原创 某国际大型超市电商销售数据分析和可视化
本作品将从人、货、场三个维度,即客户维度、产品维度、区域维度(补充时间维度与其他维度)对某国际大型超市的销售情况进行数据分析和可视化报告展示,从而为该超市在弄清用户消费偏好、提升商品利润以及优化店铺陈列等方面,提供营销决策的数据基础,并提出促进销售提升的建议和运营策略方案,促进店铺的销售提升。完整源码项目包获取→点击文章末尾名片!
2025-01-16 17:52:54
768
原创 LSTM预测未来30天销售额
多特征输入与特征工程:代码在模型输入中不仅使用了销售额历史数据,还引入了温度和周数等辅助特征,并通过创建上周销售额的特征来增强模型的预测能力。这种多特征的方式增强了LSTM模型的表现,有效捕捉到了与销售额波动相关的多重因素。这种做法在处理复杂的时间序列预测任务时,能够更好地挖掘潜在的影响因子,提升预测精度。多步预测与序列化数据生成:项目中采用了多步序列预测,即通过过去30天的数据预测未来30天的销售额,而不仅仅是单步预测。这种多步预测使得模型能够在更长的时间范围内提供预测结果,增加了实际应用的价值。
2025-01-15 16:17:27
1353
原创 BERT与CNN结合实现糖尿病相关医学问题多分类模型
首先直接利用transformer.models.bert.BertForSequenceClassification()实现文本分类。使用HuggingFace开发的Transformers库,使用BERT模型实现中文文本分类(二分类或多分类)然后手动实现BertModel + FC 实现上边函数。然后实验了论文中将bert最后四层进行concat再maxpooling的方法,模型使用的是哈工大chinese-bert-wwm,可以完全兼容BERT。最后实现了bert + CNN实现文本分类。
2025-01-15 16:10:30
777
原创 用IDCNN和bilstm实现端到端的中文实体识别
为了覆盖到输入的全部信息就需要加入更多的卷积层, 导致层数越来越深,参数越来越多,而为了防止过拟合又要加入更多的Dropout之类的正则化,带来更多的超参数,整个模型变得庞大和难以训练。因为CNN这样的劣势,大部分序列标注问题人们还是使用biLSTM之类的网络结构,尽可能使用网络的记忆力记住全句的信息来对单个字做标注。具体使用时,dilated width会随着层数的增加而指数增加。这样随着层数的增加,参数数量是线性增加的,而receptive field却是指数增加的,可以很快覆盖到全部的输入数据。
2025-01-15 15:59:02
891
原创 基于英雄联盟数据集的LightGBM的分类预测
LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,它是一款基于GBDT(梯度提升决策树)算法的分布式梯度提升框架,为了满足缩短模型计算时间的需求,LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用,以及减少多机器并行计算时的通讯代价。LightGBM可以看作是XGBoost的升级豪华版,在获得与XGBoost近似精度的同时,又提供了更快的训练速度与更少的内存消耗。完整源码项目包获取→点击文章末尾名片!1.1 LightGBM原理简介。
2025-01-09 19:31:49
460
原创 甘蔗叶片图像元素含量的回归预测多模型实现【含私人数据集】
基于python的小样本学习,完成对甘蔗叶片图像元素含量的回归预测。完整源码项目包获取→点击文章末尾名片!
2025-01-09 19:29:45
177
原创 京东电商平台消费者评价数据分析
从上述词频排序及词云图可以看出,用户更加在意包装、功能、味道、价格、物流、品牌(这里的功能主要特指包含送礼,其实在后续分析中也发现用户在意包装,也主要出于送礼的目的,详细分析过程见代码部分的第4节,这里只做总结)2、中差评主要集中在,用户对外包装不满,送礼需求未满足;但也有不满味道的用户,相对于送礼需求来说,用户更在外包装;1、相对于产品的其他属性来说,用户更加在意包装及功能属性,味道次之,即满足用户送礼的需求;通过分析用户真实评价内容,挖掘产品的优劣势,提供相关建议,提高用户满意度或提高GMV。
2025-01-09 19:28:19
430
原创 漏洞扫描工具
国内外对Web服务器及应用指纹的研究,主要都是通过构造大量特殊的HTTP请求与Web服务器交互,从其响应数据包信息中提取提取指纹特征信息,然后通过与指纹数据库进行比对,从而获取到Web服务器及应用的组件信息和版本信息。该模块采用提取指纹特征码特征信息来识别Web指纹,系统通过构造大量特殊的HTTP请求与Web服务器交互,从其响应数据包信息中提取提取指纹特征信息,然后通过与指纹数据库进行比对,从而获取到Web服务器及应用的组件信息和版本信息。我们基于当前的固定的 JSON 格式去解析取得的数据。
2025-01-08 19:45:29
909
原创 汽车用户画像分析及决策树-随机森林-svm预测分类
用户分群(User Segmentation)是一种数据挖掘和分析方法,通过对用户行为、消费习惯、兴趣爱好等多维度特征进行深入挖掘和分析,将大量用户按照相似性或差异性划分为若干个具有共同特征的群体。这些群体可以是基于地理位置、年龄、性别、收入水平、购买力等基本信息划分的常规用户群体,也可以是根据用户在产品或服务中的行为特点细分出的特定用户群体。该公司的销售团队将所有客户分为四类(A、B、C、D)并且对不同的客户群进行了细分的宣传和沟通后发现转化效果非常好。完整源码项目包获取→点击文章末尾名片!
2025-01-08 19:41:12
521
原创 基于知识图谱的医疗问答系统
将文件夹下neo4j-community-3.1.0-windows\neo4j-community-3.1.0 放到环境变量中,添加NEO4J_HOME。第4步:源码文件为medical_care.zip,修改源代码中的settings.py文件,改成自己的mysql数据库用户名和密码。第3步:执行SQL语句,Navicat打开medical_care.sql文件,运行该文件中的SQL语句。第1步:创建数据库,数据库名:medical_care。账户:admin 密码:123。第2步:安装neo4j。
2025-01-06 17:45:15
254
深度学习乐园项目案例分享:A074-基于RMBG大模型的AI抠图证件照换背景带GUI
2025-01-25
深度学习乐园项目案例分享:A073-基于PP-OCR和ErnieBot的视频字幕提取和问答助手
2025-01-25
深度学习乐园项目案例分享:A066-WaveNet模型实现电力预测
2025-01-23
深度学习乐园项目案例分享:A061-TCN模型实现电力数据预测
2025-01-22
深度学习乐园项目案例分享:A059-MobileViT模型实现图像分类
2025-01-22
深度学习乐园项目案例分享:A057-PCC Net模型实现行人数量统计
2025-01-22
深度学习乐园项目案例分享:A030-DIN模型实现推荐算法
2025-01-22
深度学习乐园项目案例分享:A029-AlexNet模型实现鸟类识别
2025-01-22
深度学习乐园项目案例分享:A028-引入SE模块和注意力机制解决VGG16过拟合实现新冠肺炎图片多分类
2025-01-22
深度学习乐园项目案例分享:A027-CNN-LSTM住宅用电量预测
2025-01-22
深度学习乐园项目案例分享:A056-KerasCV YOLOv8实现交通信号灯检测
2025-01-21
深度学习乐园项目案例分享:A053-SSD融合FERPlus模型实现面部情绪识别
2025-01-21
深度学习乐园项目案例分享:A050-银行卡数字识别
2025-01-20
深度学习乐园项目案例分享:A049-基于opencv的人脸闭眼识别疲劳监测
2025-01-20
深度学习乐园项目案例分享:A048-基于opencv答题卡识别判卷
2025-01-20
深度学习乐园项目案例分享:A022-GAN模型实现二次元头像生成
2025-01-16
深度学习乐园项目案例分享:A021-efficientnet-b3模型实现动物图像识别与分类
2025-01-16
A020-LSTM模型实现电力数据预测
2025-01-16
深度学习乐园项目案例分享:A026-DeepFM模型预测高潜购买用户
2025-01-15
深度学习乐园项目案例分享:A025-fasterRCNN模型实现飞机类目标检测
2025-01-15
深度学习乐园项目案例分享:A023-CNN模型实现mnist手写数字识别
2025-01-15
深度学习乐园项目案例分享:A017-resnet模型实现瓜果蔬菜图像识别分类苹果香蕉梨西红柿大豆菠菜玉米黄瓜葡萄橙子菠萝石榴西瓜萝卜共4个G数据
2025-01-14
深度学习乐园项目案例分享:A019卫星图像道路检测DeepLabV3Plus模型
2025-01-14
深度学习乐园项目案例分享:A018-TransUNet模型创新图像分割实战
2025-01-14
深度学习乐园项目案例分享:A016-基于keras的停车场车位识别
2025-01-13
深度学习乐园项目案例分享:A011-BertForSequenceClassification模型实现微博文本情感三分类提升
2025-01-12
snet50模型的船型识别与分类系统研究
2025-01-12
深度学习乐园项目案例分享:A008-基于YOLOv8-deepsort算法的智能车辆目标检测车辆跟踪和车辆计数
2025-01-12
深度学习乐园项目案例分享:A006-BiLSTM和CRF模型实现NER中文命名实体识别完整源码可运行
2025-01-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人