- 博客(2)
- 收藏
- 关注
原创 解决ModuleNotFoundError: No module named ‘pyspark‘
首先查看自己是否安装了py4j,你可以找spark安装路径在该目录下找到 /python/lib查看,如果没有安装可直接在命令行pip install py4j安装。注意/usr/local/spark/spark为我的spark安装路径,你需要改成自己的,py4j-0.10.9.5为我的py4j版本,注意改成自己的。之后保存,source /etc/profile使生效,然后再运行就可以啦!然后添加环境变量sudo gedit /etc/profile。
2025-02-28 19:58:43
219
原创 Hadoop network网卡启动失败,ping命令网络不可达,jps只有一个jps
首先启动Hadoop虚拟机,某个克隆机jps之后,只有jps一个节点,这个时候在该克隆机上ping主机(我的是yy01,命令:ping yy01),会显示网络不可达,那么在该克隆机上重启一下网卡。然后重启网卡成功,重新ping,发现可以ping通啦,关闭hadoop集群,重启Hadoop集群,在jps就可以啦!这个问题花费了我三个小时!ps:如果启动hadoop集群,发现从节点jps后只有一个jps,那么可以在该从节点上ping一下其他主机,如果显示网络不可达,就可以按照这个方法解决!
2024-10-25 09:35:27
463
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人