- 博客(12)
- 收藏
- 关注
原创 flume实验(数据采集与预处理课程,皆是本机操作)
avro监听和收集指定端口的日志,使用avro的source需要说明被监听的主机ip和端口号。exec 类型 自定义的、实时的(采集新增加的),去重的采集固定的日志文件的内容。avro端口,只接收来来自外部avro客户端的事件流(avro序列化后的数据)exec 可以实现 实时的、高可靠的采集,利用exec来之定义日志采集。spooling 类型 固定的日志目录的新增文件内容。监视该目录,并解析新出现的文件,(文件不能修改,重名).COMPLETED: 对处理完成的文件追加的后缀。
2023-04-24 21:57:36
1194
原创 爬虫(数据采集与预处理课程)
09_get 请求——ajax 数据采集(豆瓣电影).py。11_使用urllib爬取北京公交线路信息.py。08_post 请求——百度详细翻译.py。14_selenium访问元素信息.py。04_urllib请求对象的定制.py。06_get请求的qutoe方法.py。12_Selenium基本使用.py。13_Selenium元素定位.py。01_urllib的基本使用.py。07_post请求—百度翻译.py。15_selenium交互.py。03_urllib下载.py。
2023-04-23 22:03:25
1018
原创 java语言程序设计WeightedGraph
package B29_jiaquantu;import B28_tujiqiyingyong.UnweightedGraph;import B28_tujiqiyingyong.Edge;import java.util.*;/** * @author Fjj * @Time 2023/3/18 19:48 * @title WeightedGraph * @Software: IntelliJ IDEA * @description TODO */public class W
2023-04-07 22:01:15
150
原创 搜索树中常见的几个
利用栈来进行书写的深度搜索树。dfs 深度搜索遍历(树)bfs 广度搜索遍历(树)最小生成树 的树的构建。最小生成树的遍历代码。
2023-03-27 13:03:39
97
原创 Disconnected from the target VM, address: ‘127.0.0.1:‘, transport: ‘socket‘
Disconnected from the target VM, address: '127.0.0.1:', transport: 'socket'与Exception in thread "main" java.lang.NullPointerException 一起报错
2023-03-11 19:02:32
3307
原创 Linux:Hadoop完全分布式集群安装(连续更新)
Linux:Hadoop完全分布式集群安装(连续更新)hadoop-3.2.2 zookeeper-3.7.1 hbase-2.3.5 的安装
2022-10-03 15:26:56
1035
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人