- 博客(9)
- 收藏
- 关注
原创 ERROR Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer)kafka.
删掉kafka集群每个节点的logs文件,修改connecting to zookeeper的时间。再重新启动zookeeper集群跟kafka集群。启动kafka,报以下错误。
2023-11-14 08:28:55
520
原创 群启zookeeper的脚本文件【保姆级教程】
都知道zookeeper的启动都要一个一个手动去启动,这样很麻烦,所以我们写一个脚本文件一键启动。
2023-11-04 09:25:56
593
1
原创 org.apache.hadoop.ipc.RemoteException:User: root is not allowed to impersonate anonymous
org.apache.hadoop.ipc.RemoteException:User: root is not allowed to impersonate anonymous
2023-10-28 11:58:22
1137
2
原创 如何用Python爬取网页上的信息
用Python爬取网页上的信息首先我们要明确自己要获取的内容是什么?在这里我们需要获取天气网里面的预报里面的信息,第一打开我们的F12开发者模式,找到我们需要的信息在哪个位置,然后我们需要爬取我们的网址和文本内容预报例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2023-10-11 21:21:39
340
原创 hadoop集群配置好了在浏览器打不开是什么原因
查看防火墙状态:systemctl status firewalld.service(如果没关在active中会显示running,我的就是)关闭防火墙:systemctl stop firewalld.service(关闭后再查看防火墙状态,active会显示dead)通过jps进程发现已经启动,但访问不了hdfs和yarn的网页。
2023-10-06 08:16:55
2380
1
原创 如何获取网页中的文本内容
1、导入lxml库的etree包(lxml库的etree包的作用是用于处理XML文件的解析和操作。它提供了一组功能丰富的API,可以方便地读取、修改和生成XML文档。通过使用etree包,你可以轻松地遍历XML文档的元素和属性,查找和筛选特定的节点,以及进行节点的创建、删除和修改等操作)4、查询li下所有的元素,并打印。2、截取你所需要的网页文本内容。3、使用etree解析网页。
2023-10-05 16:47:07
326
原创 在python中爬取图片和网页
2.输入pip install requests安装requests库。2.在游览器中找到你要采集的图片,获取图片地址。3.使用requests的get方法加载图片。6.请求方式和请求头,以及传递参数。1.导入requests 包。一:安装requests库。3.在设置中看是否安装成功。4.设置图片名称和格式。5.设置需要传递的参数。
2023-09-17 19:35:28
80
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人