自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 大数据技术之Hadoop学习心得(HDFS)

文件系统是一种存储和组织数据的方法,实现了数据的存储、分级组织、访问和获取等操作,使得用户对文件访问和查找变得容易;文件系统使用树形目录的抽象逻辑概念代替了硬盘等物理设备使用数据块的概念,用户不必关心数据底层存在硬盘哪里,只需要记住这个文件的所属目录和文件名即可;比如windows操作系统数据:指存储的内容本身,比如文件、视频、图片等元数据:又称之为解释性数据,记录数据的数据;一般指文件大小、最后修改时间、底层存储位置、属性、所属用户、权限等信息。Hadoop分布式文件系统。

2024-12-22 11:40:35 773

原创 数据可视化(实验心得报告)

在本次数据可视化实验中,我收获颇丰。数据可视化是将复杂的数据以直观、形象的图表形式展现出来,从而清晰地揭示数据背后的规律与趋势,辅助决策数据可视化是指利用图形、表格、图表等方式将出来,使得数据更加清晰、易于理解和分析。图形绘制是数据可视化的基础,通过绘制各种图形呈现数据,可以更加直观地了解数据之间的关系和趋势,如果画图过程中出现问题针对中文不显示在当今数字化时代,已成为各行各业中不可或缺的一环。

2024-12-22 11:14:54 995

原创 大数据分析与应用--随机森林实战:解析市民属性与购车关系

在当今社会,了解市民的属性和他们购车行为之间的关系对于汽车销售、城市规划等多个领域都有着重要意义。随机森林算法作为一种强大的机器学习方法,可以帮助我们挖掘其中的潜在规律。今天,我们就来一次随机森林的实战练习,深入分析市民属性与是否购车的关系。

2024-11-03 18:29:00 911 1

原创 大一 Java 课程心得

此次课程只上了短短的一学期。虽说时间很短,但其中的每一天都使我收获很大、受益匪浅,它不但极大地加深了我对一些理论知识的理解,不仅使我在理论上对java有了全新的认识,在实践能力上也得到了提高,真正地做到了学以致用,更学到了很多做人的道理,对我来说受益非浅。除此以外,我知道了什么叫团队,怎样和团队分工合作;同时我还学会了如何更好地与别人沟通,如何更好地去陈述自己的观点,如何说服别人认同自己的观点。这也是第一次让我亲身感受到理论与实际的相结合,让我大开眼界。也是对以前所学知识的一个初审吧!

2024-07-01 18:44:31 600

原创 如何使用redis-cli

redis-cli是原生redis自带的命令行工具,可以帮助我们通过简单的命令连接redis服务,并进行数据管理,即redis键(key)和redis数据结构的管理。关于如何进入redis-cli命令行客户端,请查看文章:Redis安装部署(基于windows平台)Redis键操作是Redis数据库中非常重要和常用的操作。下面,通过一张表来介绍一下常用的Redis键操作命令及相关说明,具体如表所示。

2024-06-25 11:08:59 2263

原创 Redis安装部署(基于windows平台)

注意在连接之前要确保服务已经安装。更多的redis 模块Python 要使用 redis,需要先安装 redis 模块。如果要做数据导入/导出操作的话,还需要安装RedisDump。Redis 和 StrictRedisRedisPy库提供两个类Redis和StrictRedis来实现Redis的命令操作。StrictRedis实现了绝大部分官方的命令,参数也一一对应,比如set()方法就对应Redis命令的set方法。

2024-06-24 19:47:13 678

原创 MongoDB副本集部署(windows)

副本集(Replica Set) 是一组MongoDB实例保持其相同数据集的集群,由一个主(Primary )服务器和多个副本 (Secondary)服务器构成。通过复制 (Replication) 将数据的更新由主服务器推送到其它副本服务器上,在一定的延迟之后,达到每个MongoDB实例维护相同的数据集副本。副本集通过维护冗余的数据库副本、读写分离和故障自动转移的功能,摆脱数据库在使用过程中出现的环境故障影响,是所有生产环境部署的基础。

2024-06-24 19:29:42 778

原创 Series序列对象

例一:要提取出字符串中的数字series3 = pd.Series(['1元','2元','3元'])print(series3.agg(lambda x:x.split('元')[0]))#例二:将年龄转换为“成年”/“未成年”series4 = pd.Series(['10岁','20岁','30岁'])print(series4.agg(lambda x:'成年' if int(x.split('岁')[0])>18 else '未成年'))

2024-06-24 19:11:21 889

原创 Redis安装部署(基于windows平台)Z

edis简介键值对存储数据库是NoSQL数据库的一种类型,也是最简单的NoSQL数据库。顾名思义,键值对存储数据库中的数据是以键值对的形式来存储的。常见的键值对存储数据库有Redis、Tokyo Cabinet/Tyrant、Voldemort以及Oracle BDB数据库。Remote Dictionary Server,简称Redis,即远程字典服务器,它是一个开源的、高性能的、基于键值对的缓存与存储数据库,并且通过提供多种键值数据结构来适应不同场景下的缓存与存储需求。

2024-06-24 18:31:39 606

原创 MongoDB分片部署(windows)

os:windows11从图中可以看出,分片集群中主要由三个部分组成,即分片服务器(Shard)、路由服务器(Mongos)以及配置服务器(Config Server)组成。其中,分片服务器有三个,即Shard1、路由服务器有两个,即Mongos1和Mongos2;配置服务器有三个,即主、副、副。主要有如下所述三个主要组件:Shard:用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承。

2024-06-20 12:20:44 879 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除