- 博客(4)
- 收藏
- 关注
原创 【mindie】编译MindieService放开10min超时限制(该问题在新版本已增加可配置参数)
摘要:针对DeepSeek模型长文本推理超时问题,提出两种解决方案:1)采用流式返回并修改MindieService代码(T6版本后将支持动态配置);2)通过编译环境调整超时限制。详细说明了从镜像准备、代码克隆到编译部署的全流程,包括关键修改点(boost包处理、超时参数调整等)。最终编译生成的libmindieservice_endpoint.so替换后,实测可支持21分钟的长文本生成(11362 token)。注意该方案涉及MindIE三个代码库权限和特定版本环境配置。
2025-06-25 14:29:37
1418
原创 【昇腾客户A公司】使用npu 4机无法拉起错误指向:acl model_out = self.acl encoder _operation.execute(acl inputs, acl_param)
摘要:服务化报错问题最终定位为客户环境变量未正确配置,导致HCCL_OP_EXPANSION_MODE为空值,引发HCCL通信故障。排查过程包括:1)更换镜像无效;2)运行AllReduce算子测试时发现环境变量问题。该问题表现为forward函数报错,提示需检查HCCL相关环境配置。(98字)
2025-06-25 14:22:13
227
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
5