摘要 本文深入探讨了DeepSeek-R1模型的半监督学习技术,从伪标签生成到一致性正则化的实现方法。内容包括伪标签策略、一致性训练、模型优化等核心技术,帮助读者掌握大模型半监督学习的实现方法。 1. 半监督学习概述 1.1 学习架构