艾派森-优快云博客

原创数据挖掘实战-基于情感分析+网络语义分析+LDA主题分析对大唐不夜城用户评论进行文本分析

本研究基于去哪儿网和携程网的1888条大唐不夜城游客评论数据，运用Python进行文本分析。通过情感分析发现游客评价以积极为主（占比约70%），中性占20%，消极占10%。采用ROSTCM6软件进行社会网络语义分析，识别不同情绪下的高频词汇。使用LDA主题模型将评论划分为3个主题（夜景、表演、美食），并分析主题强度随时间变化趋势。实验包含数据采集、预处理、情感分析、语义网络分析和LDA建模等完整流程，为景区管理优化提供数据支持。源代码涵盖爬虫、数据处理和可视化分析的全套实现。

2025-06-15 09:31:33 1070 5

原创基于Flask+Bootstrap+机器学习的会计专业毕业生薪资可视化分析系统

本项目使用Flask框架搭建基于机器学习的会计专业毕业生薪资可视化分析系统其中关于Flask知识点可参考文章Flask全套知识点从入门到精通，学完可直接做项目1.登录/注册模块2.首页板块3.训练模型板块3.岗位信息模块4.可视化大屏模块技术：Flask、html、css、javascript、bootstrap、echarts系统架构：。

2025-06-10 09:08:06 6423 26

原创数据挖掘实战-基于机器学习的会计专业毕业生薪资预测模型

本研究的数据集来源于拉勾招聘网站。我们使用Python网络爬虫Selenium技术模拟浏览器行为并最终获取了拉勾网中会计相关岗位的招聘数据，其中包括岗位名称、公司名称、工作经验要求、学历要求、工作地点、薪酬、公司规模以及公司福利等相关的数据。

2025-06-06 14:51:04 7620 21

原创 HuggingFace平台详细介绍|模型or数据集下载

一、HuggingFace平台介绍）平台可以类比为机器学习领域的 GitHub，它是用于分享、协作和托管预训练模型、数据集和相关代码的平台。其主要的优势是提供了简单易用的 API 和界面，使得即使是没有深厚机器学习背景的用户也能轻松使用这些模型。

2025-06-03 10:21:35 8653 27

原创数据分析案例-电脑笔记本价格数据可视化分析3

本文基于Kaggle笔记本数据集（1303条记录，13个变量），使用Python进行数据可视化分析。通过自定义函数预处理了CPU频率、内存类型等关键特征，利用Seaborn和Matplotlib绘制了品牌分布、内存类型占比、价格影响因素等可视化图表。研究发现：1）Dell和Lenovo市场份额最大；2）SSD是主流存储类型；3）高RAM配置普遍采用SSD；4）Intel处理器占据绝对优势。分析揭示了不同品牌、配置与价格的关系，为消费者购买决策和市场策略制定提供了数据支持。

2025-05-25 15:55:06 11494 28

原创分享Python7个爬虫小案例（附源码）

本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点，非常适合刚入门python爬虫的小伙伴参考学习。

2022-10-22 07:00:00 152447 233

原创数据挖掘实战-基于RFM模型与K-means聚类算法对超市客户进行细分

本实验数据集来源于Kaggle，是某国际大型超市的用户消费记录数据，原始数据集共有541909条，8个变量。具体各变量解释如下：InvoiceNo:该包含每个零售发票或交易的唯一标识符或代码。它有助于跟踪和识别个人销售交易。StockCode:该列包含每个交易中出售的特定产品或项目的代码或标识符。它允许将产品与其各自的交易关联起来。Description:这一栏包含正在出售的产品或物品的文字描述或名称。它提供了关于产品的更详细的信息。Quantity:这一列表示在每次交易中销售的产品或物品的数量。

2025-05-28 20:07:57 12271 27

原创数据挖掘实战-基于LSTM时间序列模型的香烟销售预测分析

本文介绍了基于LSTM时间序列模型的香烟销售预测分析实验。实验背景为烟草市场竞争激烈，企业需提高销售预测准确性以优化生产、库存和营销策略。LSTM模型因其处理长序列数据的能力被选为预测工具。实验步骤包括数据准备、特征工程、模型构建、训练与评估及结果分析。数据集来自某市门店的销售数据，技术工具为Python 3.9和Jupyter Notebook。实验过程涵盖数据导入、预处理、产品销售与区域销售分析、销售预测（包括销售额、销量、利润及海通店销售额预测）。

2025-05-21 09:22:19 8158 25

原创【论文复现】基于文本挖掘的互联网医疗平台用户画像模型构建

本研究旨在通过文本挖掘技术构建互联网医疗平台的用户画像模型，以提升诊疗准确性和效率。研究以自闭症问诊数据为例，使用Python爬虫从好大夫在线平台获取6000条数据，并通过LDA主题分析和Kmeans聚类技术对数据进行处理。实验过程包括数据导入、预处理、可视化、主题分析和聚类，最终构建了具有代表性的用户画像。研究结果表明，该模型能够有效挖掘用户需求，优化问诊流程，提升患者满意度，推动互联网医疗平台向智能化、个性化方向发展。

2025-05-15 11:55:30 12433 27

原创数据挖掘实战-基于随机森林算法的空气质量污染预测模型

本实验数据集来源于Kaggle，该数据集重点关注各地区的空气质量评估。数据集包含5000个样本，并捕获了影响污染水平的关键环境和人口因素。Temperature（°C）：该地区的平均温度。Humidity（％）：该地区记录的相对湿度。PM2.5浓度(µg/m³)：细颗粒物水平。PM10浓度(µg/m³)：粗颗粒物水平。NO2浓度（ppb）：二氧化氮水平。SO2浓度（ppb）：二氧化硫水平。CO浓度(ppm)：一氧化碳水平。

2025-05-09 12:04:16 7839 37

原创数据分析案例-基于红米和华为手机的用户评论分析

在智能手机市场日益繁荣的今天，红米与华为手机作为国产手机品牌的佼佼者，凭借其各自独特的品牌魅力和技术实力，赢得了广泛的用户群体和高度关注。随着技术的不断进步和消费者需求的日益多样化，用户对手机的期望已不仅限于基本的通讯功能，更涵盖了性能、拍照、续航、用户体验等多个方面。因此，深入探究红米与华为手机在用户长期使用过程中的实际表现，尤其是用户评论中所反映出的真实反馈，对于理解市场需求、优化产品设计及提升用户体验具有重要意义。本实验的背景正是基于这样的市场环境和技术发展趋势。我们旨在通过收集并分析红米与华为手机的

2025-05-06 09:07:47 10112 37

原创数据分析案例-ChatGPT用户评论数据集可视化分析

本数据集来源于Kaggle，该数据集由ChatGPT的用户评论组成，包括文本反馈、评分和评论日期。评论范围从简短评论到更详细的反馈，涵盖了广泛的用户情绪。评分范围从 1 到 5，代表不同的满意度水平。数据集跨越多个月，为分析提供了时间维度。每条评论都附有时间戳，可以对情绪趋势进行时间序列分析。

2025-04-27 09:13:23 13789 33

原创数据挖掘实战-基于随机森林算法的交通事故预测模型

本实验数据集来源于Kaggle，原始数据集共有209306条，该数据集包含不同地区和时间段的交通事故详细信息。它包括各种指标，例如事故日期、天气状况、照明条件、碰撞类型、受伤人数和车辆参与情况。数据涵盖多个地点和事故类型，可全面了解交通事故及其原因。具体包括：crash_date：事故发生的日期。Traffic_control_device：所涉及的交通控制设备的类型（例如交通灯、标志）。weather_condition：事故发生时的天气状况。

2025-04-23 10:14:02 14610 33

原创 Python实现Doc2Vec的入门使用（附中文和英文文本案例）

本次实验将分别对中文和英文文本进行Doc2Vec分析，其中中文数据集为新闻数据集，包含新闻的类型和内容（数据集来源于天池网）英文数据集为某一研究领域的英文文献，包含论文标题和摘要（数据集来源于Kaggle）本次实验案例分别使用Doc2Vec对中英文文本内容进行分析，其中可以看出中英文的差距就是在分词那块，其他板块都是一样的套路，同时本次实验只是Doc2Vec的入门使用，后续如果学到进阶使用再回来更新或发新文。

2025-04-19 08:52:25 16175 28

原创数据挖掘实战-基于TFIDF+余弦相似度的个性化论文推荐

本实验数据集来源于Kaggle，原始数据集为英文论文数据，共有5000条，包含论文题目和摘要。

2025-04-12 09:22:13 12134 33

原创数据分析案例-本科毕业后就读MBA的决定数据集可视化分析

本实验数据集来源于Kaggle，原始数据集共有10000条，该数据集包含已完成学士学位并正在决定是否攻读 MBA 的个人。它包括人口统计信息、学术背景、工作经验、财务因素和职业抱负，以分析 MBA 决策背后的趋势和关键驱动因素。✔️ 预测模型——识别 MBA 决策中的模式✔️ 职业洞察——了解工作经验和薪资如何影响选择✔️ 商业教育研究——研究跨行业的 MBA 趋势人员 ID — 唯一标识符年龄 — 做出决定时的年龄性别 — 男、女、其他本科专业 — 工程、商科、艺术、科学等。

2025-04-07 18:16:59 15095 26

原创数据挖掘实战-基于卷积神经网络CNN的口罩检测识别模型|91%准确率

关于数据集口罩检测数据集在疫情期间，由于每个人在外出时都必须戴口罩，因此深度学习检测戴口罩和不戴口罩的面部的方法是一种很好的流行做法。在这里，我创建了一个模型，用于检测在 7553 个具有 3 个颜色通道 (RGB) 的图像上训练的面罩。数据集由 7553 个 RGB 图像组成，分别位于 with_mask 和 without_mask 2 个文件夹中。图像被命名为标签 with_mask 和 without_mask。

2025-04-01 10:36:03 10174 42

原创 3 分钟打造AI 智能体，《Manus极简入门》让你一键开启高效生活工作模式

这本书由董浩宇博士倾力撰写。它能突破传统AI仅能对话的局限，自主完成复杂任务并交付成果，真正实现从“会思考”到“会行动”的跨越，把AI从“会说话的工具”转变为“能干活的智能团队”。通过学习，理解AI Agent技术对商业模式和组织结构的潜在影响，学会将Manus整合到企业运营中，优化客户服务、市场研究、竞争分析等关键业务流程，在组织中培养“AI思维”，提升企业整体运营水平，抢占AI时代商业先机。通过这些案例，读者能够深入了解Manus的强大功能，从中获取创新灵感，拓展应用思路，更好地发挥Manus的价值。

2025-03-26 11:17:57 4807 27

原创数据挖掘实战-基于深度学习Keras的玉米植物叶识别检测模型

关于数据集数据集来源于Kaggle，用于玉米或玉米植物叶病分类的数据集0：Common Rust（常见锈病） - 1306 张图片1：Gray Leaf Spot（灰叶斑） - 574 张图片2：Blight（枯萎病） -1146 张图片3：Healthy（健康） - 1162 张图片。

2025-03-24 18:46:20 13649 33

原创数据挖掘实战-基于LRFM+Kmeans的消费者客户分群聚类

2025-03-21 08:57:53 9988 34

原创大数据分析案例-基于随机森林和CatBoost算法构建银行客户流失预测模型

本实验数据集来源于Kaggle，原始数据集分为train.csv和test.csv，其中训练集有165034条数据，14个变量，测试集有110023条数据，13个变量。

2025-03-16 09:43:32 10949 35

原创基于Flask+Bootstrap+机器学习的良恶性肿瘤预测系统

目录一、项目介绍1.1项目简介1.2技术工具1.3页面概述二、项目步骤2.1登录注册板块2.2主页面板块2.3训练模型板块2.4模型预测板块2.5查看肿瘤信息模块三、项目总结本项目使用Flask框架搭建基于机器学习良恶性肿瘤细胞分类器系统其中关于Flask知识点可参考文章Flask全套知识点从入门到精通，学完可直接做项目整个项目分为以下几个模块：项目文件框架如下:其中manager.py为主程序，password.csv为存储用户账号密码的文件，Cancer_Data是原始数据集，

2025-03-11 15:39:45 16380 32

原创数据挖掘实战-基于情感分析+网络语义分析对泾阳茯茶用户评论进行文本分析

本实验数据集来源于京东商城，使用Python爬虫获取泾阳茯茶商品的用户评论，共计3416条数据，字段有用户ID、用户昵称、IP属地、评论时间、评分、评论内容，共计6个字段信息。'''作者：艾派森csdn主页：https://blog.youkuaiyun.com/m0_64336780时间：2024/5/28'''# 导包import csv# 获取评论q=0.01',q=0.9,en;b_avif=1;b_dw=1412;b_dh=650;areaId=27;

2025-03-03 19:27:21 16003 35

原创数据分析案例-青少年心脏病发作数据集可视化分析

本实验数据来源于Kaggle，该数据集是与相关的人工生成的数据集合。它包含 50,000 行和 30 列，旨在模拟真实世界的数据，同时确保维护隐私和道德考虑。主要特点：数据并非来自实际个人或事件，而是通过复制现实世界尼日利亚数据中观察到的统计模式和关系的算法创建的。数据集有 50,000 行，为训练和评估机器学习模型、进行统计分析和探索各种研究问题提供了大量数据。30 列表明包含各种变量，可能涵盖人口、社会经济、健康、金融或其他相关领域。

2025-02-24 13:09:17 16890 36

原创数据挖掘实战-基于随机森林算法的美国加州山火预测模型

本实验数据集来源于Kaggle，该数据集反映了各种火灾事件中建筑物所遭受的损坏情况，按损坏百分比分类——从轻微损坏（1-10％）到完全损坏（50-100％），由评估受野火影响的建筑物的现场检查员收集。该数据集由加州林业和消防局 (CAL FIRE) 与国家跨部门消防中心 (NIFC) 和火灾综合实时情报系统 (FIRIS) 合作提供。该数据集对于防火、应急响应和灾害管理工作非常有价值。主要包括以下特征：OBJECTID：数据集中每个记录的唯一标识符。

2025-02-07 16:55:27 10329 32

原创数据分析案例-健身房会员锻炼数据集可视化分析

本实验数据集来源于Kaggle，该数据集详细介绍了健身房会员的锻炼习惯、身体属性和健身指标。它包含 973 个健身房数据样本，包括心率、卡路里消耗和锻炼时长等关键绩效指标。每个条目还包括人口统计数据和经验水平，可全面分析健身模式、运动员进步和健康趋势。具体包括：Age：健身房会员的年龄。Gender：健身房会员的性别（男或女）。Weight (kg)：会员的体重（公斤）。Height (m)：会员的身高（以米为单位）。Max_BPM：锻炼期间的最大心率（每分钟心跳次数）。

2025-02-01 13:52:29 13312 28

原创数据挖掘实战-基于LDA主题分析+文本分析的医学论文分类研究

本实验数据集来源于Kaggle，原始数据集为医学相关的论文，共有8000条，3列，分别为title：论文题目author：论文作者abstract：论文摘要在本次医学类论文摘要分析实验中，我们采取了多元化的分析方法，以深入探索和理解文本的内在结构和语义信息。通过综合运用LDA主题分析和K-means聚类算法，我们有效地对文本数据进行了主题识别和类别划分。首先，我们应用了LDA主题分析技术，该技术成功地揭示了隐藏在大量医学论文摘要中的主要主题。

2025-01-21 15:35:57 11713 43

原创数据挖掘实战-基于机器学习的车辆二氧化碳排放量建模分析

本实验数据集来源于Kaggle，该数据集捕获了车辆二氧化碳排放量随不同特征变化的详细信息。数据集取自加拿大政府官方开放数据网站。其中包含 7 年期间的数据。总共有 7385 行和 12 列。各列变量含义解释如下：Make:车辆的品牌或制造商。Model:车辆的具体车型名称。Vehicle Class:车辆的分类，如紧凑型、SUV等。Engine Size(L):车辆发动机的尺寸，以升为单位。Cylinders:车辆发动机的气缸数。

2025-01-17 10:02:56 12748 26

原创数据分析案例-基于猫眼和豆瓣平台的漫威系列电影票房分析

本实验共有两个数据集，分别为猫眼漫威电影票房、豆瓣漫威电影票房。其中豆瓣电影票房数据采用Python爬虫获取，共计180条数据，变量有电影名称评分评价人数类型上映年份导演主演简介猫眼电影票房数据采用手工获取，共计32条数据，变量有电影名称、票房、年份。

2025-01-09 21:59:49 10746 79

原创数据挖掘实战-基于卷积神经网络CNN的玉米植物叶病分类识别模型

关于数据集数据集来源于Kaggle，用于玉米或玉米植物叶病分类的数据集数据集说明：常见锈病- 1306 张图片灰叶斑- 574 张图片Blight（枯萎病-1146 张图片Healthy（健康- 1162 张图片。

2025-01-02 21:40:58 13334 82

原创什么是数据挖掘？数据挖掘到底在解决什么问题？

本文我将借助5W1H的思想来带你从整体上了解一下数据挖掘。比如什么是数据挖掘为什么要做数据挖掘在哪些场景下用数据挖掘怎么做数据挖掘第一个问题，什么是数据挖掘？这个问题看似很简单，但似乎也很难有一个明确的答案。如果非要给数据挖掘一个定义的话，那么我认为数据挖掘就是寻找数据中隐含的知识，并用于产生商业价值。也就是说它是我们在数据中，尤其是在大量的数据中找到一些有价值，甚至是非常有价值的东西的一种手段。

2024-12-26 20:39:17 15370 66

原创海外BI入华“水土不服”，国产BI的机会？

随着国内信创产业的快速发展，以及数字化转型的普及和深入，数据要素的重要性已经提升到国家战略层面。因此，国内数据资产这座金矿也进入了亟待开发的阶段，这无疑为国产BI带来巨大的机会。必须承认，与国际领先BI相比，国产BI虽然还存在较大的技术差距。但也要看到的是，在当前国内产业环境下，无论是在适应性、易用性、经济性、安全性和保障性等方面，国产BI应该是一个合适的选择。

2024-12-25 18:54:45 6497 11

原创数据分析案例-笔记本电脑价格数据可视化分析2

本实验数据集来源于Kaggle，原始数据集共有1303条数据，13个变量，各变量含义如下：0 laptop_ID-数字-产品ID1 Company-字符串-笔记本电脑制造商2 Product-字符串-品牌和型号3 TypeName-字符串-类型（笔记本电脑、超极本、游戏机等）4 Inches-数字-屏幕尺寸5 ScreenResolution-字符串-屏幕分辨率6 Cpu-字符串-中央处理器 (CPU)7 Ram-字符串-笔记本电脑 RAM8 Memory-字符串-硬盘/SSD 内存。

2024-12-24 13:35:47 9930 55

原创大数据分析案例-基于XGBoost算法构建笔记本电脑价格预测模型

本研究旨在利用XGBoost算法构建笔记本电脑价格预测模型，以期为消费者提供更有价值的购买建议，并为制造商和销售商提供市场分析和定价策略的支持。通过这一研究，我们希望能够推动机器学习算法在电子产品价格预测领域的应用和发展，为市场参与者提供更准确、更全面的数据支持。经过实验验证，基于XGBoost算法构建的笔记本电脑价格预测模型取得了显著的效果。该模型能够准确捕捉笔记本电脑价格与其各项属性之间的复杂关系，并有效整合市场数据，实现了对笔记本电脑价格的精准预测。

2024-12-19 07:23:05 10039 56

原创数据挖掘实战-基于循环神经网络RNN的口罩检测识模型|98%准确率

关于数据集口罩检测数据集在最近由于疫情爆发而导致的全球封锁趋势中，由于每个人在外出时都必须戴口罩，因此深度学习检测戴口罩和不戴口罩的面部的方法是一种很好的流行做法。在这里，我创建了一个模型，用于检测在 7553 个具有 3 个颜色通道 (RGB) 的图像上训练的面罩。数据集由 7553 个 RGB 图像组成，分别位于 with_mask 和 without_mask 2 个文件夹中。图像被命名为标签 with_mask 和 without_mask。

2024-12-15 09:17:16 11334 71

原创大数据分析案例-基于梯度提升决策树回归算法构建医疗保险费用预测模型

本研究旨在基于梯度提升决策树回归算法构建医疗保险费用预测模型，通过挖掘和分析历史医疗数据中的有用信息，实现对医疗保险费用的准确预测。该研究不仅有助于提高医疗保险费用预测的准确性和可靠性，还能够为保险公司提供科学的定价依据和风险控制手段，进而促进医疗保险行业的健康发展。通过应用梯度提升决策树回归算法构建医疗保险费用预测模型，并基于历史医疗数据进行训练和验证，我们取得了令人满意的预测准确率，达到了91%。这一结果表明，梯度提升决策树回归算法在医疗保险费用预测领域具有显著的优势和有效性。

2024-12-10 09:10:54 14077 89

原创 Python实现Word2Vec的入门使用--以红楼梦小说为例

本实验数据集来源于四大小说之一的《红楼梦》。以红楼梦小说为例介绍word2vec的基本使用。

2024-12-06 16:53:39 12732 76

原创数据挖掘实战-基于树模型的北京全年空气PM2.5预测

基于树模型的北京全年空气PM2.5预测研究，旨在通过收集和分析北京市过去一段时间内的空气质量数据，利用树模型算法建立预测模型，实现对北京全年PM2.5浓度的准确预测。该研究不仅可以为相关部门提供科学依据，制定有效的空气质量改善策略，还可以为公众提供未来空气质量趋势的预测信息，帮助他们提前做好防护措施。同时，该研究还可以进一步推动树模型在空气质量预测领域的应用和发展，为其他城市的空气质量预测提供借鉴和参考。

2024-12-03 15:42:10 11826 75

原创数据分析案例-车辆二氧化碳排放量数据可视化分析

2024-12-02 09:03:28 9943 77

原创数据分析案例-基于情感分析+LDA主题分析的上饶市旅游景点分析

本实验数据集由粉丝提供，原始数据集为上饶市的旅游景点和景点的游客评论，共有2个数据集。本次实验通过综合运用数据可视化分析、词云图分析、情感分析以及LDA主题分析等多种方法，对旅游景点进行了全面而深入的研究。通过这一系列分析，我们得出了以下结论，并据此对旅游市场的发展趋势和潜在机会进行了展望。首先，通过数据可视化分析，我们了解到不同景点的评分、评论数以及热度分布情况。上饶大坳枫泽湖风景区、圆明新园·夏苑等景点凭借优秀的服务和设施获得了游客的高度认可，成为热门景点。

2024-11-28 21:47:13 10562 44

数据挖掘实战-基于随机森林模型的零售店库存可视化与预测（数据集+代码）.rar

2025-03-22

数据分析案例-青少年心脏病发作数据集可视化分析（数据集+代码）.rar

2025-03-22

数据分析案例-本科毕业后就读MBA的决定数据集可视化分析（数据集+代码）.rar

2025-03-22

数据分析案例-ChatGPT用户评论数据集可视化分析（数据集+代码）.rar

2025-03-22

基于LDA主题分析+文本分析的医学论文分类研究（5000字实验报告+数据集+代码）.rar

2025-03-22

数据分析案例-基于猫眼和豆瓣平台的漫威系列电影票房分析（数据集+代码）.rar

2025-03-22

数据分析案例-车辆二氧化碳排放量数据可视化分析（数据集+代码）.rar

2025-03-22

数据挖掘实战-基于卷积神经网络CNN的玉米植物叶病分类识别模型（数据集+代码）.rar

2025-03-22

数据挖掘实战-基于循环神经网络RNN的口罩检测识模型（数据集+代码）.rar

2025-03-22

数据挖掘实战-基于机器学习算法的空气质量预测模型（数据集+代码）.rar

2025-03-22

数据分析案例-健身房会员锻炼数据集可视化分析（数据集+代码）.rar

2025-03-22

基于情感分析+LDA主题分析的上饶市旅游景点分析（代码+数据集+8000字实验报告）.rar

随着信息技术和网络通信技术的快速发展，互联网已经成为人们获取旅游信息、分享旅游经验和交流旅游感受的重要平台。尤其是旅游评论，作为游客对旅游景点最直观、最真实的反馈，对于潜在游客的决策具有重要的参考价值。然而，海量的旅游评论信息不仅增加了信息检索的难度，也使得人们难以从整体上把握游客对某一旅游目的地的整体评价和主要关注点。上饶市，位于江西省东北部，是一个旅游资源丰富、文化底蕴深厚的城市。近年来，随着全域旅游理念的推广和旅游业的发展，上饶市吸引了越来越多的游客前来观光旅游。然而，面对众多的旅游景点和复杂的旅游信息，游客往往难以做出有效的选择，而对于旅游管理者而言，也缺乏有效的工具来分析游客的反馈，以优化旅游服务和提升游客满意度。因此，本研究旨在通过情感分析和LDA主题分析的方法，对上饶市旅游景点的评论信息进行深入挖掘和分析。情感分析可以帮助我们了解游客对某一旅游景点的情感倾向，如积极、消极或中性，从而把握游客的整体满意度。而LDA主题分析则可以从海量的评论信息中提取出主要的话题和关注点，帮助我们了解游客对旅游景点的具体评价和期望。

2025-03-22

数据挖掘实战-基于树模型的北京全年空气PM预测（数据集+代码）.rar

2025-03-22

数据分析案例-车辆燃油经济性数据可视化分析（数据集+代码）.rar

2024-12-01

数据挖掘实战-基于SARIMA时间序列模型预测Netflix股票未来趋势（数据集+代码）.rar

2024-12-01

数据分析案例-欺诈性电子商务交易数据集可视化分析（数据集+代码）.rar

2024-12-01

数据分析案例-智能手机价格数据集可视化分析（数据集+代码）.rar

2024-12-01

数据挖掘实战-基于Apriori关联规则的市场购物篮分析（数据集+代码）.rar

2024-12-01

数据分析案例-笔记本电脑价格数据可视化分析（数据集+代码）.rar

2024-12-01

数据分析案例-苹果品质数据可视化分析+建模预测（数据集+代码）.rar

2024-12-01

基于Python的东方财富网股票数据可视化分析系统.rar

2025-04-26

国家社科基金项目数据集10w+条(1994-2024年).rar

该数据集包括了1994年到2024年中标的国家社科基金项目，10w+条数据

2025-04-04

大数据分析案例-基于随机森林算法探究电商网站推销商品的影响因素.rar

2025-03-29

豆瓣影评爬虫并词云图可视化.rar

该爬虫代码可以爬取豆瓣网中的电影影评，然后画出词云图可视化，因平台限制，每个电影最多爬取400条影评。使用代码前，需要更换自己登录的cookie 因爬虫代码具有时效性，所以在购买资源之前私信联系我确定该代码是否还可用！

2025-03-24

基于LSTM的南京市天气预测与分析（4000字实验报告+PPT+代码+数据集）.rar

天气预测是科学领域中的一个重要课题，天气预测不仅能为农业生产提供可靠的指导，还能为交通、能源等领域的调度和规划提供参考依据。特别是在气候变化愈发明显的今天，准确的天气预报能够帮助居民企业更好地应对突发天气，减少自然灾害对生产和生活的影响。随着机器学习和深度学习的飞速发展，传统的天气预测方法逐渐被以人工智能为核心的新技术所取代。其中，长短期记忆网络（LSTM）作为一种擅长处理时间序列数据的模型，在天气预测中发挥了显著作用。本次研究中，爬取了基于南京市过去三个月的天气数据，用pytorch框架构建了一个LSTM模型，并利用该模型预测10月份南京一个月的风力和平均气温变化趋势。

2025-03-23

微博热搜爬虫python.rar

该代码用来获取微博中的热搜数据，直接运行代码即可，每次爬取50条

2025-03-23

全国汽油价格数据集.rar

该数据集包含了2023年-2025年3月的全国汽油价格数据集，数据格式为json

2025-03-23

京东vivo手机订单数据集（630197条29个字段）.rar

该数据集为京东平台中vivo手机的销售订单数据集，共有630197条数据，29个字段变量，字段有['订单时间', '支付时间', '出库时间', '完成时间', '手机型号', '商品名称', '订单状态', '订单状态_映射','订单类型', '订单种类', '售后换新订单标志', '售后换新订单标志_映射', '售后申请时间', '售后完成时间', '处理结果','处理结果_映射', '销量', '销额', '京东价', '优惠前金额', '优惠前单价', '优惠后单价', '是否plus会员', '是否学生', '收货省份', '收货城市', '收货区县', '运费', '免运费券金额']

2025-03-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

数据挖掘实战-基于随机森林模型的零售店库存可视化与预测（数据集+代码）.rar

数据分析案例-青少年心脏病发作数据集可视化分析（数据集+代码）.rar

数据分析案例-本科毕业后就读MBA的决定数据集可视化分析（数据集+代码）.rar

数据分析案例-ChatGPT用户评论数据集可视化分析（数据集+代码）.rar

基于LDA主题分析+文本分析的医学论文分类研究（5000字实验报告+数据集+代码）.rar

数据分析案例-基于猫眼和豆瓣平台的漫威系列电影票房分析（数据集+代码）.rar

数据分析案例-车辆二氧化碳排放量数据可视化分析（数据集+代码）.rar

数据挖掘实战-基于卷积神经网络CNN的玉米植物叶病分类识别模型（数据集+代码）.rar

数据挖掘实战-基于循环神经网络RNN的口罩检测识模型（数据集+代码）.rar

数据挖掘实战-基于机器学习算法的空气质量预测模型（数据集+代码）.rar

数据分析案例-健身房会员锻炼数据集可视化分析（数据集+代码）.rar

基于情感分析+LDA主题分析的上饶市旅游景点分析（代码+数据集+8000字实验报告）.rar

数据挖掘实战-基于树模型的北京全年空气PM预测（数据集+代码）.rar

数据分析案例-车辆燃油经济性数据可视化分析（数据集+代码）.rar

数据挖掘实战-基于SARIMA时间序列模型预测Netflix股票未来趋势（数据集+代码）.rar

数据分析案例-欺诈性电子商务交易数据集可视化分析（数据集+代码）.rar

数据分析案例-智能手机价格数据集可视化分析（数据集+代码）.rar

数据挖掘实战-基于Apriori关联规则的市场购物篮分析（数据集+代码）.rar

数据分析案例-笔记本电脑价格数据可视化分析（数据集+代码）.rar

数据分析案例-苹果品质数据可视化分析+建模预测（数据集+代码）.rar

基于Python的东方财富网股票数据可视化分析系统.rar

国家社科基金项目数据集10w+条(1994-2024年).rar

大数据分析案例-基于随机森林算法探究电商网站推销商品的影响因素.rar

豆瓣影评爬虫并词云图可视化.rar

基于LSTM的南京市天气预测与分析（4000字实验报告+PPT+代码+数据集）.rar

微博热搜爬虫python.rar

全国汽油价格数据集.rar

京东vivo手机订单数据集（630197条29个字段）.rar

豆瓣电影数据集（11406条24个字段）.rar

java开发岗招聘数据爬取+可视化大屏.rar

京东商品评论爬虫Python.rar

基于Flask+Bootstrap+机器学习的会计专业毕业生薪资可视化分析系统（10000实验报告+数据集+代码）.rar

基于机器学习的会计专业毕业生薪资预测模型（7000字实验报告+代码+数据集）.rar

基于情感分析+网络语义分析+LDA主题分析对大唐不夜城用户评论进行文本分析（数据集+代码）.rar

数据分析案例-基于红米和华为手机的用户评论分析（数据集+代码）.rar

数据挖掘实战-基于RFM模型与K-means聚类算法对超市客户进行细分（数据集+代码）.rar

基于LSTM时间序列模型的香烟销售预测分析（8000字实验报告+代码+数据集）.rar

数据挖掘实战-基于随机森林算法的空气质量污染预测模型（数据集+代码）.rar

数据挖掘实战-基于随机森林算法的交通事故预测模型（数据集+代码）.rar

数据挖掘实战-基于随机森林算法的美国加州山火预测模型（数据集+代码）.rar

空空如也