Initial job has not accepted any resources; check your cluster UI to ensure that workers are registe

spark集群搭建完成后,笔者在测试的过程中出现了:Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources 这样的错误 查阅了很多资料都没有得到解决。

 

 首先分析该错误的原因 这确实是集群中的Worker节点没有工作,注意是没有工作 并不是没有启动,也许在Worker节点上通过JPS命令可以看到Worker 的进程已经启动 但是这并不能说明Worker 就可以工作了,就好像去在图书馆也不一定学习一个道理

通过分析workder 节点的启动日志 可以发现 通过使用 ./sbin/start-slaves.sh 命令 省略了master--ip 这个参数 系统默认的会将一单机模式启动 换句话说worker节点根本没有和master节点通信 也就是根本没有在集群中 。master节点分发任务的时候迟迟得不到回应 就有了上述错误

 

 

解决方法 不要使用./sbin/start-slaves.sh去启动所有从节点 使用 ./sbin/start-slaves.sh   spark:master-ip:7077 (添加个参数即可)

这样就可以解决了

笔者的运行结果

 

再次查看slave节点的日志 信息发现 有了master节点的IP 实现了slave和master的通信 程序也就运行成功了

 后记:学习的过程中可以参考网络上的资料 切不可完全依赖网上的信息,具体问题具体分析。

### 实现 Xinference 注册功能 在 Xinference 中实现注册操作涉及配置和启动不同类型的节点,这些节点通过命令行工具进行管理。对于希望执行特定于应用程序的操作(如注册),通常需要理解如何利用现有的命令行接口或者扩展其功能。 #### 使用现有命令行工具 Xinference 提供了一套基于 Click 的命令行工具用于管理和部署服务[^2]。要完成注册动作,可能涉及到使用 `xinference` 命令及其子命令之一来发起请求或设置环境变量以便与远程服务器通信并提交必要的认证信息。具体来说: - 如果是用户级别的注册,则可能是向某个 API 发送 HTTP 请求; - 对于集群内部组件之间的注册,这通常是自动化的,并由框架本身处理。 #### 修改主目录路径 默认情况下,Xinference 将 `<HOME>/.xinference` 设为主目录以保存运行所需的数据文件,包括但不限于日志记录和模型权重等资源[^3]。如果计划自定义安装位置或是调整其他行为参数,在启动前应适当修改相应的配置项。 ```bash export XINFERENCE_HOME=/path/to/custom/directory ``` 此环境变量允许更改默认的工作空间地址,从而影响到所有后续创建的日志及其他持久化数据的位置。 #### 扩展命令行界面 (CLI) 当内置的功能不足以满足需求时,可以考虑开发新的 CLI 子命令来支持额外的任务——例如账户创建流程中的验证步骤或其他交互过程。这一般意味着编辑 Python 项目的入口脚本 (`setup.cfg` 或者 `setup.py`) 来引入新条目点,并编写对应的业务逻辑代码。 ```python import click @click.command() def register(): """Register a new user or component.""" # Implement registration logic here. pass ``` 上述片段展示了怎样快速搭建一个简单的点击风格函数;实际应用中还需要连接数据库、发送邮件确认链接等功能模块。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值