- 博客(6)
- 收藏
- 关注
原创 解决flume采集日志使用KafkaSource写不到hdfs的问题
在数仓开发的数据同步策略中分为全量同步和增量同步,增量同步使用Maxwell监控MySQL变化数据并上传到Kafka的topic,Flume则使用KafkaSource监控Kafka上传至hdfs完成数据传输通道。本篇文章解决flume采集Kafka无法写入hdfs的问题。
2023-11-15 13:52:15
782
原创 手写Tomcat+实现Servlet规范
这篇文章会带你实现一个简易的tomcat,使得我们更好的了解tomcat工作原理,同时也手动实现了servlet规范,通过反射web.xml来获取servlet实例。
2023-09-05 13:15:11
292
1
原创 sklearn机器学习的常用知识点(二)
上一篇文章说完了 sklearn中 数据预处理,特征工程,以及最终的模型评估,这一篇文章将继续讲解剩下最重要的机器学习模型的使用和调参,以及一些扩展。
2023-07-18 20:18:13
415
2
原创 sklearn机器学习的常用知识点(一)
Scikit-learn(又称为sklearn)是一个流行的Python机器学习库,它提供了丰富的机器学习算法和工具,用于数据预处理、特征工程、模型选择、模型训练和评估等任务。sklearn.datasets:提供了一些常用的数据集,如Iris、MNIST等,可以用于练习和测试模型。sklearn.preprocessing:包含数据预处理和特征工程相关的功能,如数据标准化、缺失值处理、特征编码、特征选择等。
2023-07-18 19:14:19
2177
1
原创 springboot通过客户端访问elasticsearch数据
本篇文章建立在对springboot会使用的基础上,想要连接elasticsearch并获取数据。
2023-07-16 14:13:13
560
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅