- 博客(18)
- 收藏
- 关注
原创 基于Spark的京东电商数据分析系统
本项目基于Hadoop+Spark大数据平台,结合SpringBoot+Vue技术栈,构建电商数据分析系统。系统采用Hive进行数据存储与建模,实现数据采集、清洗、分析全流程处理,并通过ECharts可视化展示分类价格、店铺销量等多维度分析结果。功能涵盖工作台、用户管理、数据分析等模块,为电商平台精细化运营提供数据支撑。
2025-11-25 00:03:21
109
原创 基于Hadoop的淘宝电商数据分析系统
本文介绍了基于Hadoop生态的电商数据分析系统,采用SpringBoot+Vue技术栈实现。系统针对淘宝平台海量商品数据,通过Hadoop、Hive等大数据技术进行分布式处理,结合MySQL数据库存储,实现商品销售、用户偏好等多维度分析。前端使用Vue+ElementUI+ECharts构建可视化界面,提供数据大屏、智能分析等功能模块,支持从分类、地区、店铺等多个角度进行市场趋势分析,并实现风格、款式等维度的价格区间统计,帮助商家优化产品定位和营销策略。系统涵盖数据采集、清洗、存储到分析可视化的完整流程,
2025-11-25 00:01:19
129
原创 基于Hadoop的胖东来销售数据分析系统
本文介绍了基于大数据技术的胖东来销售数据分析系统。该系统采用Hadoop、Hive、Sqoop等大数据技术进行数据采集、清洗与存储,后端使用SpringBoot+MyBatis框架,前端基于Vue+ElementUI+ECharts实现数据可视化。系统功能包括销售趋势分析、产品分类分析、占比统计等模块,支持从数据采集到分析展示的全流程处理,为零售企业提供智能化的销售数据决策支持。开发环境采用Java17、Node.js、MySQL等技术栈,实现了销售数据的集中化管理和高效分析。
2025-11-25 00:00:24
191
原创 基于Hadoop的优衣库订单数据分析系统
优衣库订单数据分析项目基于Hadoop、Hive等大数据技术,结合SpringBoot、Vue等技术栈开发。项目实现了从数据采集、清洗到分析可视化的全流程处理,通过多维度分析用户消费行为和产品销售趋势,为企业决策提供支持。系统包含工作台、数据管理、用户管理等功能模块,可进行性别/年龄消费分析、产品销量/利润分析等。采用Java17、MySQL等技术构建开发环境,通过数据大屏实现销售高峰、热销产品等关键指标的可视化展示,助力企业提升运营效率和市场竞争力。
2025-11-24 23:59:36
199
原创 基于Hadoop的霸王茶姬订单数据分析与可视化系统
本文介绍了一个基于大数据的霸王茶姬订单数据分析系统。系统采用Hadoop、Hive等技术处理大数据,使用SpringBoot、Vue等框架构建前后端。开发环境包括Java17、MySQL等工具。该系统针对茶饮行业快速增长的市场需求,通过数据采集、清洗、存储、分析和可视化等功能,实现对销售趋势、消费偏好等关键指标的深度挖掘。主要功能包括登录注册、数据大屏、多维数据分析及用户管理等模块,旨在为企业提供精准的运营决策支持,助力数字化转型。系统可分析销量、渠道、产品热度等数据,提升企业精细化管理水平。
2025-11-24 23:58:27
100
原创 基于大数据技术的当当网图书分析推荐系统,Hadoop,Hive,Spark,SpringBoot,Vue,前后端分离,包安装,包运行成功
主页、数据管理、图书数据、日志数据、系统留言、系统管理、用户信息、角色信息、权限信息、个人信息、数据分析、图书类目数量分析、图书热度排名分析、折扣占比数量分析、图书发布趋势分析、出版社热度排名、价格分布数量分析、图书推荐、可视化大屏、图书价格预测。开发环境:java1.8、node.js、mysql、maven。数据采集、数据存储、数据清洗、数据分析、数据推荐、数据可视化。大数据技术:hadoop、hive、spark、sqoop。前端技术:vue、echarts、elementui。
2024-10-21 12:11:43
533
原创 基于大数据技术的电商行为分析预测系统,Hadoop,Hive,Spark,SpringBoot,Vue,前后端分离,包安装,包运行成功
主页、数据管理、民宿数据、日志数据、系统留言、系统管理、用户信息、角色信息、权限信息、个人信息、数据分析、每日趋势分析、每时趋势分析、漏斗转化分析、RFM客户分析、用户留存分析、购买类目排名、购买商品排名、数据大屏、购买预测模型。开发环境:java1.8、node.js、mysql、maven。数据采集、数据存储、数据清洗、数据分析、数据预测、数据可视化。前端技术:vue、echarts、elementui。大数据技术:hadoop、hive、spark。后端技术:springboot、mybatis。
2024-10-20 00:11:41
472
原创 基于大数据技术的纵横网小说推荐分析系统,Hadoop,Hive,Spark,SpringBoot,Vue,前后端分离,包安装,包运行成功
系统首页,数据分析,空气质量城市分析,年度空气质量趋势,月度空气质量趋势,日期空气质量趋势,天气空气质量分析,风向空气质量分析,空气质量预测,系统管理(仅管理员可见),通知管理,用户管理(仅管理员可见),管理员信息,普通用户信息,个人资料,修改密码,退出系统,登录。开发环境:java1.8、node.js、mysql、maven。数据采集、数据存储、数据清洗、数据分析、数据预测、数据可视化。前端技术:vue、echarts、elementui。大数据技术:hadoop、hive、spark。
2024-10-19 23:52:54
317
原创 链家新房数据爬取,分页爬取,分多个城市爬取
每个页面的数据信息保存在 dataList 中,通过遍历该列表,提取每个新房的具体信息,包括城市名称、封面图片、最小和最大面积、区域信息、房屋描述、标题、地址、均价、房屋类型、销售状态、开盘时间、总价参考、产权类型等。代码中多次使用 random.randint() 设置随机休眠时间,在每次请求不同页面时动态生成 User-Agent,并在各个请求之间引入随机延迟,以模拟正常用户的访问行为,降低触发链家反爬虫机制的可能性。urls 列表中包含了多个城市的新房信息页面链接,例如北京、上海、天津、重庆等城市。
2024-10-19 23:45:48
1503
原创 链家租房数据爬取,分页爬取,分多个城市爬取
目标URL为链家租房页面,不同城市的页面以 urls 列表的形式保存,每个 URL 包含页码参数(pg{}),这允许代码通过循环爬取不同的分页内容。这使得在生成最终的数据时,能够更好地显示出租房信息的所属地区。使用 try-except 可以改进代码的异常处理,当前代码略显简单,未对数据解析失败进行捕获,但可以加入处理机制以跳过错误数据并继续爬取下一个数据。利用 BeautifulSoup 解析网页数据,获取每个房屋的相关信息,包括链接、图片、标题、位置、房屋类型、标签、品牌、发布日期、价格等。
2024-10-19 23:42:06
1105
原创 2025最新大数据专业毕设选题,全部可以加算法
基于大数据的国内新一线城市热门旅游景点的数据分析与可视化。基于hive的网络电视剧收视率与推荐分析的设计与实现。基于大数据的小说数据分析与可视化系统的设计与实现。基于spark的华南地区房价数据的分析与可视化。基于大数据技术的酒吧数据分析系统的设计与实现。基于大数据的二手房屋数据分析及预测系统的设计。基于大数据的电商运营数据分析与可视化系统设计。基于大数据的二手车数据分析系统的设计与实现。基于大数据的厨具用品销售数据分析及可视化。基于大数据的电子产品销售数据分析与可视化。
2024-10-17 21:07:43
537
原创 2025最新大数据专业毕设选题,刚更新最新最全,全部可以加算法
基于hadoop的车辆销售与能源消费关系的可视化分析。基于大数据的求职网数据分析与可视化系统的设计与实现。基于协同过滤推荐算法的电商智能家居推荐分析系统。基于Hadoop的小说推荐分析系统的设计与实现。基于Hadoop的租房数据分析系统的设计与实现。基于大数据的快手短视频数据分析系统的设计与实现。基于协同过滤推荐算法的抖音短视频推荐分析系统。基于协同过滤推荐算法的电商护肤品推荐分析系统。基于Hadoop的电视剧推荐系统的设计与实现。基于hive的招聘数据分析系统的设计与实现。
2024-10-17 21:06:46
514
原创 2025最新大数据专业毕设选题,Spark相关的选题,全部可以加算法
基于Spark的电商智能家居可视化分析系统。基于Spark的大众点评餐厅可视化分析系统。基于Spark的社交用户画像可视化分析系统。基于Spark的电商用户行为可视化分析系统。基于Spark的电商智能家居可视化分析系统。基于Spark的社交用户画像可视化分析系统。基于Spark的口碑网行为可视化分析系统。基于Spark的电商护肤品可视化分析系统。基于Spark的新能源汽车可视化分析系统。基于Spark的电商消费可视化分析系统。基于Spark的共享单车可视化分析系统。基于Spark的森林资源可视化分析系统。
2024-10-17 21:03:20
933
原创 2025最新大数据专业毕设选题,Hive相关的选题,全部可以加算法
基于Hadoop的BOSS直聘可视化分析系统。基于Hadoop的电商用户行为可视化分析系统。基于Hadoop的口碑网行为可视化分析系统。基于Hadoop的电商护肤品可视化分析系统。基于Hadoop的电商消费可视化分析系统。基于Hadoop的共享单车可视化分析系统。基于Hadoop的森林资源可视化分析系统。基于Hadoop的酒店评论可视化分析系统。基于Hadoop的旅游景点可视化分析系统。基于Hadoop的音乐评论可视化分析系统。基于Hadoop的宠物食品可视化分析系统。
2024-10-17 21:02:27
867
原创 天气数据爬取,分页爬取,多个城市分别爬取
随机生成用户代理,模拟不同的浏览器访问以绕过网站的反爬机制。通过遍历生成的城市和时间对,逐月访问不同的历史数据页面。代码通过构造URL,获取各个城市每个月份的历史天气记录。城市的索引和名称由一个。如果在解析过程中出现格式不匹配的情况,代码会跳过异常数据,继续处理下一条记录。标签,逐个提取日期、天气、温度、空气质量指数(AQI)、风向风速、降水量等数据。解析返回的HTML页面,提取出包含天气信息的列表。该代码的目标是爬取各个城市的历史天气数据,数据来源于。列表提供,存储了多个城市的拼音索引和名称对。
2024-10-17 12:53:43
414
原创 基于大数据技术的民宿推荐分析系统,Hadoop,Hive,Spark,SpringBoot,Vue,前后端分离,包安装,包运行成功
基于大数据技术的民宿推荐系统通过采集和分析用户在平台上的行为数据,利用大数据平台如Hadoop和Spark,结合协同过滤算法,为平台提供个性化民宿推荐,帮助平台优化营销策略,提升用户体验与预订转化率,促进业务增长。数据采集、数据存储、数据清洗、数据分析、数据推荐、数据可视化。
2024-10-17 12:45:49
400
原创 当当网图书数据爬取,分页爬取,多个分类爬取
解析网页,提取书籍的链接、图片、名称、评论、推荐语、作者、出版时间、出版社、价格等信息。每个分类爬取20到26页的内容。发送带有模拟浏览器请求头的GET请求,爬取多个书籍分类的畅销书页面(如小说、文学、童书等)。文件中,遇到解析失败时跳过异常,继续处理下一条数据。:访问每本书的详情页,爬取更多详细信息如书籍描述。:将爬取的数据格式化并保存到。
2024-10-17 03:50:13
767
原创 基于大数据技术的空气质量预测分析系统,Hadoop,Hive,Spark,SpringBoot,Vue,前后端分离,包安装,包运行成功
系统首页,数据分析,空气质量城市分析,年度空气质量趋势,月度空气质量趋势,日期空气质量趋势,天气空气质量分析,风向空气质量分析,空气质量预测,系统管理(仅管理员可见),通知管理,用户管理(仅管理员可见),管理员信息,普通用户信息,个人资料,修改密码,退出系统,登录。开发环境:java1.8、node.js、mysql、maven。数据采集、数据存储、数据清洗、数据分析、数据预测、数据可视化。前端技术:vue、echarts、elementui。大数据技术:hadoop、hive、spark。
2024-10-16 22:16:06
1125
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅