- 博客(127)
- 收藏
- 关注
原创 python之三种去重方法
list2 = []方法保持顺序处理速度适用场景数据类型自定义函数✔️慢教学演示简单列表集合去重❌最快快速去重可哈希元素Pandas方法✔️快实际项目。
2025-03-31 19:02:43
1024
原创 Spring MVC 控制器方法返回值与@RequestMapping注解详解
统一视图管理:建议所有视图文件集中存放前后缀规范:推荐使用.jsp作为视图后缀。
2025-03-31 18:40:36
425
原创 Java 字符流全解析:核心类实战指南
直接基于字符处理文本文件,自动完成字节到字符的解码(默认使用系统编码)。:通过缓冲区减少磁盘 I/O 次数,显著提升性能。:处理非默认编码文件(如 UTF-8、GBK)。:直接在内存中操作字符数组,无需物理文件。:处理大文本文件或需要逐行读写的场景。:连接字节流与字符流,可指定字符编码。:替代临时文件,直接处理字符串内容。:无需I/O开销,适合高频操作。:强制指定编码解决乱码问题。:数据预处理或临时文本缓存。:将字符串作为数据源或目标。:读写简单的文本文件(如。:日志收集、模板引擎渲染。
2025-03-25 16:21:22
533
原创 Fileoutput和Objectoutput的区别
通过理解两者的区别,可以更精准地选择合适的 I/O 处理方案。是两个不同层级的流类,它们的核心区别体现在。在 Java I/O 中,
2025-03-25 10:22:54
973
原创 python之横条形图实例
通过以上解析,您应该能够全面理解代码的工作流程和各个组件的功能。建议在Jupyter Notebook中分步运行代码片段以加深理解。
2025-03-25 08:22:15
878
原创 python之size,count的区别
在 Pandas 中,size()和count()都是用于统计分组后的数据量,但它们的计算逻辑和返回值有本质区别。
2025-03-24 20:31:26
321
原创 python之数据清洗实例
希望这份解析能帮助你深入理解代码!定义clean_data函数。定义fang_bar函数。筛选总价100-120万。调用fang_bar绘图。处理单价/总价/面积列。主程序分组计算平均面积。读取CSV并清洗数据。
2025-03-19 19:12:04
641
原创 Hadoop MapReduce 词频统计(WordCount)代码解析教程
这是一个基于Hadoop MapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数,并将结果输出到HDFS文件系统。
2025-03-18 17:22:47
336
2
原创 Spring Bean 作用域与生命周期注解深度解析
通过合理使用作用域和生命周期注解,可使代码维护性提升40%,资源泄漏风险降低75%。建议结合Spring Actuator监控Bean生命周期状态,特别是在微服务架构中。:容器关闭时,Bean销毁之前。:Bean属性注入完成后,
2025-03-18 08:25:42
308
原创 Spring 核心注解深度解析教程
(涵盖@Component@Service@Autowired@Qualifier@Resource@Value。
2025-03-17 13:52:21
657
原创 python之loc,iloc的用法
核心作用:基于标签精准操作数据(查、改、删)优势:代码可读性高,支持复杂条件筛选适用场景:数据清洗、条件筛选、动态计算等# 典型工作流示例cleaned_data = df.loc[df['Quality'] > 0.8, ['ID', 'Value']] # 筛选高质量数据cleaned_data.loc[:, 'Value'] *= 100 # 批量修改选中列的值。
2025-03-12 19:17:36
255
原创 python之replace,strip,split命令
方法主要功能返回值类型是否修改原字符串典型应用场景replace子串替换字符串否(新字符串)文本内容替换、格式转换split字符串分割列表否解析CSV数据、分割日志信息strip两端字符去除字符串否数据清洗、去除多余空白/标点。
2025-03-11 09:05:53
413
原创 python之数据处理的安全(链家)
健壮性提升元素缺失场景下的崩溃率下降 >90%数据完整率达到99.2%(测试样本1000条)可维护性增强# 配置化改造示例'title': {'selector': 'div.title > a', 'default': '未知标题'},'price': {'selector': 'div.totalPrice', 'clean': lambda x: x.replace('万', '')}扩展方向增加代理IP池应对反爬结合Selenium处理动态渲染添加数据校验管道(如价格范围检测)
2025-03-10 17:05:24
1188
原创 Spring IOC 容器核心功能解析与优化架构
实际开发中建议结合注解方式(@Component, @Autowired)进行混合配置,提升开发效率。:需要精细控制 Bean 创建过程时。:需要工厂类处理复杂初始化逻辑时。:不需要工厂实例时的高效创建方式。:直接通过类默认构造器创建对象。
2025-03-10 14:41:59
883
2
原创 Redis 常用命令
通过对比和示例,可以更清晰地理解不同命令的适用场景与核心差异。实际应用中,根据数据类型(如是否需要排序、是否允许误差)选择合适的命令结构。以下是关于 Redis 常用命令的总结与对比。
2025-03-04 12:37:12
997
原创 大数据与Hadoop综合解析
在数字化转型的浪潮中,大数据已成为不可或缺的资源。它不仅改变了企业的运营方式,还重塑了整个行业格局。大数据主要应对海量数据的采集、存储与分析计算挑战,帮助企业从数据中提取价值,驱动决策和创新。数据单位解析GB(吉字节):相当于十亿字节,适用于个人电脑存储。TB(太字节):万亿字节,常见于企业级存储。PB(拍字节):千万亿字节,互联网公司的典型数据量级。EB(艾字节):百亿亿字节,用于如社交媒体或基因研究等领域。ZB(皆字节)和YB(佑字节):更大的量级,代表未来数据存储需求。
2025-02-25 12:27:34
911
原创 Hive集群的安装准备
Hive的安装与集群部署详细指南一、环境与软件准备在开始Hive的安装与集群部署之前,确保您准备好以下环境和软件:虚拟机软件:用于创建和管理虚拟机,确保可以在其上安装Linux操作系统。操作系统:建议使用rpm/yum进行包管理,以简化软件的安装过程。网络配置IP段规划:设定IP地址范围为192.168.200.128至192.168.200.254。网关:设置为192.168.200.2。节点配置(192.168.200.152) 和二、基础配置。
2025-01-15 16:56:26
614
原创 Mysql之存储过程
存储过程是一组预编译的 SQL 语句集合,可以通过调用名称来执行。存储过程可以接收参数,并支持复杂的业务逻辑(如条件语句、循环、异常处理等)。它们可以提高代码的可重用性和维护性。
2024-12-15 19:03:22
368
原创 Mysql之视图
视图是一个虚拟的表,它是基于 SELECT 查询的结果集。视图不存储实际数据,而是动态地从基表中提取数据。视图可以简化复杂查询、提高数据安全性(限制访问特定列或行)以及提供数据的逻辑结构。视图可能是可更新的,但并非所有视图都支持更新。可更新视图通常遵循某些条件,例如没有聚合函数、没有 DISTINCT、没有 GROUP BY 等。视图可以像普通表一样进行查询,使用。
2024-12-15 19:02:02
407
原创 python之分词词性
词性标注是自然语言处理中的重要任务,可以帮助理解句子的结构和语义。通过获取每个词的词性信息,可以进行更深入的文本分析,如情感分析、主题建模等。-get_key_words` 方法可以帮助用户快速识别文本中的重要概念,这在信息检索、内容摘要等领域非常有用。库,这是一个用于中文自然语言处理的库,主要用于分词和关键词提取等功能。若对中文自然语言处理感兴趣,可以深入学习其他相关技术,如句法分析、语义理解和机器学习等。提供更多的参数设置,以便用户定制分词及关键词提取的策略。
2024-12-10 18:34:53
427
原创 Static关键字
Static一般在什么场景会遇见呢,我们需要封装一个学生类,其中有名字,班级名,自我介绍等。Static是一个关键字,表示静态。可以修饰变量、方法。
2024-07-30 17:39:10
359
1
原创 Object方法重写
在Object类中,equals方法的默认实现是比较两个对象的引用是否相同,即判断两个对象是否是同一个对象(内存地址是否相同)。但是,通常情况下我们需要重写equals方法来根据对象的内容进行比较,而不仅仅是比较对象的引用。在Java中,equals()方法是Object类中的一个方法,因此所有的Java类都继承了这个方法。重写equals方法的目的是为了根据对象的特定属性进行比较,如果两个对象的属性值相同,则认为这两个对象是相等的。我们需要知道Obecj是java中的一个类,是所有类的父类,即超类。
2024-07-09 17:32:47
370
原创 This&javabean&对象数组
this在面向对象-封装那一篇里,有被两个地方提及。这是一个构造方法,this指向new出来的那个对象而set方法中,是调用setName的那个对象那么就会出现成员变量和局部变量命名冲突,this就是去解决这个问题的。
2024-07-06 21:23:08
938
原创 面向对象-封装
当我们把所有的java类都写src下的第一层级,如果是项目中,也许会有几百个java文件。src下的文件会很多,开发的时候不方便查找,也不方便维护如果较多的文件中有同名的,十分麻烦模块1中有一个叫test.java模块2中有一个叫test.java这种情况下你必须把其中的一项改名根据分类创建不同的文件夹不同的文件夹放不同的java类所以,在这里,我们准确的说,包就是一个一个的文件夹!!其作用就是方便开发者管理、查找、维护代码。为了避免命名的冲突(虽然我起名都起的怪怪的)。
2024-07-04 21:53:09
780
原创 方法种类的详解
修饰符 返回类型 方法名(形参数1类型 形参数1名字,形参数2类型 形参数2名字,形参数3类型 形参数3名字) {// 可以使用参数1// 返回语句。
2024-07-02 21:19:51
448
原创 方法的用法
代码冗长,不利于维护变量过多,想不出那么多的变量名没有重用性那么该如何解决呢?我们可以编写功能性的代码块,来被main函数调用,从而实现项目的完成。也就是方法。修饰符 返回值类型 方法名(参数) {方法体 return 返回值;/** 输出字母表(a~z 或者 A ~ Z)* 解析: A(65)~Z(90) 是一个范围,可以用数字表示。得到数字之后,转成char* */i
2024-07-02 17:41:12
331
原创 数组初了解
现在,有一个场景需求,我们需要将10个数字存入,也就是10个变量。但如果场景需求改变,是用户输入了10个数,让我们求里面的最大值。那10个变量就显得过于臃肿。我们需要一个新的数据结构,来装一系列的数据。我们简单介绍一下数组,如果说以前的变量是一个没有隔间的衣柜,一个衣柜只可以装一件衣服。那么数组就是一个有隔间的衣柜,一个隔间装一件衣服。其特点是每个隔间里装的东西都需要是同一个数据类型,那么整个衣柜就等于数组,给每个隔间赋予一个编号,就是索引,从0开始;隔间里的东西就是元素;隔间的长度就是数组的长度。
2024-06-23 15:05:12
259
原创 循环的结构
循环结构,一般常用在while,do…while,for循环三个语法,但我们一般来常用的是for循环,while与do…while我们只需要掌握就可以。于此同时,我们需要掌握一下循环控制的关键字,开始循环时,我们不用控制,想结束循环的时候,我们该如何操作呢??那就需要掌握跳出循环的关键字。但循环有时我们会遇到死循环,当然,你如果不怕被同事骂,你可以多写点死循环的代码,一般遇到死循环的问题,我们可以多去分析原因,避免写出死循环的代码。没有结束条件,或者结束条件永远为真,就会造成一直循环。
2024-06-20 17:30:29
511
原创 流程的控制
简单来说,就是为了满足需求,我们不得不在一个多条件的IF语句中加入多个IF语句来完成项目需求的实现,所以一般建议在使用多流程嵌套前先画一个流程图理清思路(别写到后面自己都不知道自己在写什么)。一般我们在很多场景下需要使用多条件类型的语句,例如在期末分析学生成绩时,若学生成绩在0-59是不及格,60-79是中等,80-89是良好,90往上是优等。写一个程序,用户输入星期几(1~7)。然后程序输出你要做的事情。周一到周五(每天的内容已经确定)。我们需要注意break,一定要写上。本篇文章将分开诉说着三类。
2024-06-09 18:12:55
556
原创 输入与随机数
我们需要了解到Scanner这个类,其作用于及键盘输入。如果要在我们指定范围内随机生成一个整数,那么我们可以使用Random这个类。nextInt(int bound) -> 在0-(bound-1)类库:java.util。类库:java.util。3.用户输入两个数,求和。
2024-06-09 17:21:12
331
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人