- 博客(3)
- 收藏
- 关注
原创 AAAI 2025 MENTOR
通过这三级对齐,MENTOR 既保留了多模态的语义补充能力,又死死锁住了“交互信息”这个核心,实现了效果与鲁棒性的双赢。
2025-11-27 13:31:19
898
原创 论文解读Climber: Toward Efficient Scaling Laws for Large Recommendation Models
本文提出Climber模型,针对推荐系统中Transformer架构的低效扩展问题展开研究。
2025-11-24 16:51:43
1023
原创 解决nn.batchnorm2d报错:RuntimeError: one of the variables needed for gradient computation
这行代码可以放在train()函数之外,或者main()函数之外,例如定义args参数之前的parser = argparse.ArgumentParser()。这种问题往往非常头疼,因为只告诉你是梯度回传的问题,不告诉具体是哪,往往这种操作会由一些inplace操作导致。运行后发现报错位置在nn.batchnorm2d,也就是说是我的batchnorm层导致梯度无法回传。搜索了很多关于“batchnorm导致梯度无法回传”,几乎没有相关内容。,然而我检查我代码,没有此操作。随后根据报错提示,用。
2024-07-09 20:19:52
716
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅