- 博客(30)
- 收藏
- 关注
原创 基于大数据的电商产品评论数据分析与可视化--Python
随着电商的发展,大量商品的评价信息不断累积,这些评价反映了购买者对商品的期望和需求。本文通过采用大数据技术对电商中的产品评价信息进行细致的分析和直观的可视化展示,旨在深化对这些数据的理解,并揭示其中的价值。
2024-07-08 17:46:34
1185
原创 客户购买行为预测--Python数据分析
客户购买行为预测是许多企业和组织所关注的一个重要问题,可以帮助它们更好地了解其客户的需求并制定更有效的销售和营销策略、优化产品营销等方面。python可以通过使用各类库(如numpy, pandas, matplotlib, scikit-learn等)构建用于预测客户购买行为的机器学习模型。这些模型可以根据历史数据进行训练,并预测未来客户的购买偏好和购买时间等相关信息,从而帮助企业和组织优化产品定位、推广和销售策略,提高市场竞争力。
2024-07-08 17:27:47
1981
原创 面向计算机类岗位人才需求分析研究 --基于前程无忧招聘网站的数据经验证据
为了能够解决广大求职者找工作难,计算机相关应届生毕业就失业的问题,帮助求职者找出求职时应重点关注的问题是本文研究关注的重点。因此,本文以前程无忧网上的计算机相关专业的招聘信息作出分析:对岗位信息描述进行分词统计,对学历和技能要求进行可视化,分析企业对人才的工具技能要求和综合素质等,最后再根据TF-IDF算法提取了文本的关键词和基于LDA模型的主题分析。
2024-07-08 17:06:16
1303
1
原创 基于Python数据可视化的网易云音乐歌单分析系统
一、项目简介(一)项目背景 1(二)项目过程 1二、项目设计流程图 3(一)基于Python数据可视化的网易云音乐歌单分析系统的整体架构 3(二)获取歌单索引页的信息 4(三)获取歌单详情页的信息 5(四)歌曲出现次数 TOP10 6(五)网易云音乐欧美歌单播放 TOP10 6(六)网易云音乐欧美歌单评论 TOP10 7(七)欧美歌单播放数量分布情况 7(八)网易云音乐欧美歌单标签图 8(九)歌单介绍词云图 8三、项目实现代码 9。
2023-12-13 20:52:21
4773
13
原创 优衣库门店销售数据分析
优衣库是一家来自日本的服装品牌,于1949年成立,现已成为全球知名的快时尚品牌之一。以下是该品牌门店的一些介绍:店面数量截至2021年5月,全球优衣库门店数量达到2,248家,在亚洲、欧洲、北美和澳洲等地都有分店。在中国,优衣库也拥有超过800家门店。商品种类优衣库主营休闲服装,以简约、实用、高品质、低价位的设计理念,生产出T恤、牛仔裤、裙子、外套、鞋子和配件等各类商品,其中以基础款的卫衣、羽绒服、牛仔裤以及内衣系列最为知名。特点优衣库注重产品的质量和设计,强调舒适感和实用性。
2023-06-13 16:59:40
1499
原创 山西大学(双一流)2021–2022 学年第 2 学期-高等代数试卷
学校前身是1902年5月8日创办的山西大学堂,1912年改名山西大学校,1918年确定为国立山西大学,1931年改名山西大学,1953年更名山西师范学院,1959年恢复山西大学校名。根据2023年5月学校官网信息显示,学校有坞城、东山、大东关3个校区,总占地面积3008亩,建筑面积116.64万平米;有全日制本科生24155人、全日制硕士研究生7366人、非全日制硕士研究生1550人,全日制博士研究生977人,设有本科专业87个。
2023-06-12 11:40:35
461
原创 2020年长沙理工大学601高数-硕士研究生考试试题
有针对性:考研高数内容涵盖了选择性教材范围内的所有知识点,并包含大量零散难题,对考察学生的数学素养有很大帮助。影响精力:由于考试时限和题量较大,需要在比较短时间内解决大部分难题,往往会造成答题压力、精神紧张等问题。应用广泛:高等数学是后续学科的重要基础和工具,掌握其知识可应用于物理、化学、经济学等多个领域。2年前做的卷子,这套考研卷考的比较全面,但对于数学一二的同学来说,应该是比较基础的。
2023-06-12 09:32:40
321
原创 清华2010-2011高数上期末卷
极限极限是微积分中的核心概念之一,需要掌握以下内容:极限的符号以及定义极限的基本性质:唯一性、局部有界性、保号性和四则运算法则极限的重要定理:夹逼定理、单调有界原理、洛必达法则导数导数(又称微商)是描述一个函数局部变化率的工具,需要强化以下知识:导数的定义及图形意义导数的基本性质:可导必连续、可导函数的求导法则、可导函数的几何意义和物理意义高阶导数的概念和计算方法积分积分是导数的逆运算,是微积分中的另一个重要内容,需要掌握以下知识:定积分和不定积分的定义及其关系。
2023-06-12 09:21:27
102
原创 基于Python的疫情数据可视化(matplotlib,pyecharts动态地图,大屏可视化)
最终,组合成一个时间轴对象,从而实现动态图表的展示效果。2020年,新冠肺炎疫情在全球范围内爆发,给人们的健康和生命带来了严重威胁,不同国家和地区的疫情形势也引起了广泛的关注。本报告以疫情数据为基础,通过可视化数据分析的方式,呈现了全球和国内疫情的发展趋势和变化情况,帮助人们更加直观、全面地了解疫情的实际情况,为全社会、政府和民众做好疫情防控和处置提供参考依据。由于该地图是按月份展示,因此我们可以看到在不同的月份里,哪些国家的新增人数较多,哪些国家较少,以及某些疫情爆发严重的国家的疫情是否有所缓解等。
2023-06-10 17:57:27
7315
11
原创 基于spark对美国新冠肺炎疫情数据分析
2020年美国新冠肺炎疫情是全球范围内的一场重大公共卫生事件,对全球政治、经济、社会等各个领域都产生了深远影响。在这场疫情中,科学家们发挥了重要作用,积极探索病毒特性、传播机制和防控策略,并不断推出相关研究成果。本篇论文旨在使用 Spark 进行数据处理分析,以了解2020年美国新冠肺炎疫情在该国的传播情况,并探讨各州疫情数据之间的相互关系。在数据处理和可视化方面采用 Spark 和 Python 技术进行实现。
2023-05-31 11:34:30
3533
3
原创 使用selenium获取招聘数据并保存数据到csv文件(大数据) 2023.5.26
f = open(‘BOSS直聘.csv’, mode=‘a’, encoding=‘utf-8-sig’, newline=‘’)csv_writer = csv.DictWriter(f, fieldnames=[“职位名称”,“地区”,“薪水”,“标签”,“能力要求”,“公司名字”,“公司介绍”,“福利待遇”,“职位描述”,“企业类型”,“工作地址”,“详情链接”])csv_writer.writeheader() # 写入表头。
2023-05-26 23:34:47
725
5
原创 基于python的游戏玩家行为数据分析与预测
随着游戏产业的不断发展,越来越多的游戏企业需要对游戏运营进行数据分析,以优化运营策略,提高用户留存率和收益。游戏运营情况分析可以帮助企业了解用户行为、收入来源、市场趋势等方面的信息,指导企业量身定制营销和用户管理策略。
2023-05-24 10:34:51
2987
4
原创 基于python的电信用户流失预测
电信用户流失预测是一种针对电信运营商的数据挖掘应用,目的是通过分析历史的客户使用数据,预测未来的客户流失情况。
2023-05-22 21:07:10
1354
原创 HBase2.2.2安装
HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。欲了解HBase的官方资讯,请访问HBase官方网站。HBase的运行有三种模式:单机模式、伪分布式模式、分布式模式。单机模式:在一台计算机上安装和使用HBase,不涉及数据的分布式存储;伪分布式模式:在一台计算机上模拟一个小的集群;
2023-05-16 20:38:29
310
原创 2023华中杯A题(答案)
第十五届“华中杯”大学生数学建模挑战赛(以下简称竞赛)于3月13日正式开启报名。举办竞赛的目的在于提升学生对数学科学理论及应用价值的认识,培养学生的创新意识与团队精神。竞赛由湖北省工业与应用数学学会主办,泰迪智能科技(武汉)有限公司承办,武汉大学、华中科技大学、华中师范大学、中南财经政法大学、华中农业大学、中国地质大学、武汉理工大学、湖北大学、武汉科技大学协办。
2023-05-16 09:31:57
3080
原创 hdfs命令的使用(总结)
hdfs 命令的使用。dfs命令是在HDFS中最为常用的命令,它有许多选项,文件的基本操作都是通过执行dfs加不同的选项实现的,如文件的读、写、删除、等操作,都可以使用dfs命令来实现。
2023-05-16 08:27:39
1400
原创 关于hdfs的介绍和知识点的测试
在HDFS中,每个文件被拆分成多个数据块,并且这些数据块会被复制到多个DataNode节点上进行备份,以提高数据的容错性和可用性。高可靠性:HDFS通过将数据复制到多个DataNode节点上进行备份,从而提高了数据的可靠性。高吞吐量:HDFS针对大型数据集进行了优化,因此它能够提供高性能的数据读写服务。数据局域性:HDFS具有将数据移动到计算节点的能力,而不是像传统的计算模型一样将计算移动到数据所在的位置。适合大型数据集的应用程序开发:HDFS设计为处理大量数据,可以管理称为超过百万或亿级别文件的数据集。
2023-05-15 22:46:56
134
原创 数据分析第五章课后实训--应用Matplotlib、seaborn、pyecharts库可视化分析(答案到任务三)
为了了解学生父母教育水平、午餐、考试课程准备情况这两个特征与总式绩之间是否存在某些关系,基于实训1的数据,对这3个特征下不同值所对应的学生总成绩求均值,绘制折线图分别查看父母教育水平与总成绩的关系,绘制柱形图分别查看午餐、考试课程准备情况与总成绩的关系,并对结果进行分析。其中,最高的AQI值为203,属于重度污染,最低的AQI值为22,属于优良。总之,AQI值和PM2.5含量是反映空气质量的两个重要指标,它们的变化情况反映了空气质量的变化情况,对人们的健康和生活产生着重要的影响。
2023-05-10 11:26:46
15205
14
原创 spark法律服务大数据智能推荐(自己动手做的,完整过程+源码)
与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历史行为,主动为用户推荐能够满足他们兴趣和需求的信息。为了能够更好地满足用户需求,需要依据其网站的海量数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点,从而引导用户发现自己的信息需求,将长尾网页(长尾网页是指网页的点击情况满足长尾理论中尾巴部分的网页)准确地推荐给所需用户,即使用推荐引擎来为用户提供个性化的专业服务。
2023-05-02 15:03:09
3093
1
原创 基于大数据的MapReduce应用实践与网站用户行为分析
大数据(Big Data) :指无去在一定时间范围内用常规软件工具进行捕捉、管理和处理的数居集合,是需要新处理模式才能具有更强的央策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。主要解决,海量数据的存储和海量数据的分析问题。
2023-05-02 14:16:33
440
原创 2023华中杯c题
第十五届“华中杯”大学生数学建模挑战赛(以下简称竞赛)于3月13日正式开启报名。举办竞赛的目的在于提升学生对数学科学理论及应用价值的认识,培养学生的创新意识与团队精神。竞赛由湖北省工业与应用数学学会主办,泰迪智能科技(武汉)有限公司承办,武汉大学、华中科技大学、华中师范大学、中南财经政法大学、华中农业大学、中国地质大学、武汉理工大学、湖北大学、武汉科技大学协办。
2023-05-02 13:42:35
1161
原创 python数据分析与应用:第六章课后实训--应用sklearn分析竞标数据(全)
通过读取竞标行为数据集,进行训练集和测试集的划分、为后续的模型构建提供训练数据和测试数据;并对数据集进行降维,以适当减少数据的特征维度。
2023-04-27 20:52:15
6621
4
原创 python数据分析与应用:使用scikit-learn构建模型分析 第六章实训(1,2)
1、掌握skleam转换器的用法。2、掌握训练集、测试集划分的方法。3、掌握使用sklearm进行PCA降维的方法。4、掌握 sklearn 估计器的用法。5、掌握聚类模型的构建与评价方法。6、掌握分类模型的构建与评价方法。7、掌握回归模型的构建与评价方法。
2023-04-26 23:04:31
3556
2
原创 RDD编程初级实践
sparkrdd编程是spark计算框架中最基础的编程模型,它通过将数据分割成不同的partition,并在集群节点上进行并行处理,从而达到高效、可扩展的数据处理能力。实验步骤:1环境搭建首先需要安装好jdk和spark,并且能够成功启动spark shell(交互式命令行界面)。2数据读取与转换使用spark提供的api,对文本数据进行读取和转换。将每一行数据转换为一个字符串,并使用flatmap函数将所有字符串拆分成单词,生成一个新的rdd对象。
2023-04-25 22:51:45
739
1
c++字符串管理系统的设计
2023-04-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人