JoY小方博士-优快云博客

原创 AAAI 2025 MENTOR

通过这三级对齐，MENTOR 既保留了多模态的语义补充能力，又死死锁住了“交互信息”这个核心，实现了效果与鲁棒性的双赢。

2025-11-27 13:31:19 898

原创论文解读Climber: Toward Efficient Scaling Laws for Large Recommendation Models

本文提出Climber模型，针对推荐系统中Transformer架构的低效扩展问题展开研究。

2025-11-24 16:51:43 1023

原创解决nn.batchnorm2d报错：RuntimeError: one of the variables needed for gradient computation

这行代码可以放在train（）函数之外，或者main（）函数之外，例如定义args参数之前的parser = argparse.ArgumentParser()。这种问题往往非常头疼，因为只告诉你是梯度回传的问题，不告诉具体是哪，往往这种操作会由一些inplace操作导致。运行后发现报错位置在nn.batchnorm2d，也就是说是我的batchnorm层导致梯度无法回传。搜索了很多关于“batchnorm导致梯度无法回传”，几乎没有相关内容。，然而我检查我代码，没有此操作。随后根据报错提示，用。

2024-07-09 20:19:52 717

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 AAAI 2025 MENTOR

原创 论文解读Climber: Toward Efficient Scaling Laws for Large Recommendation Models

原创 解决nn.batchnorm2d报错：RuntimeError: one of the variables needed for gradient computation

空空如也

空空如也

原创论文解读Climber: Toward Efficient Scaling Laws for Large Recommendation Models

原创解决nn.batchnorm2d报错：RuntimeError: one of the variables needed for gradient computation