大模型学习工作
文章平均质量分 92
Zheng照邻、
985本硕,本科数学计算机双学位,研究生人工智能方向。LLM实习中(预计1月结束本段实习,开启下一段。)
更多交流欢迎联系邮箱:zhengzhaolin2023@163.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
满血版优化算法介绍(总):从SGD到RAdam,如何点亮大模型的万亿参数?
大模型之优化器系列(总)原创 2025-07-08 00:21:12 · 357 阅读 · 0 评论 -
满血版优化算法介绍(三)Adam家族的精妙演化,Adam、Nadam、AdamW、RAdam如何优化大模型?
大模型之优化器系列(三)原创 2025-07-08 00:09:27 · 945 阅读 · 0 评论 -
满血版优化算法介绍(二)动态调整的艺术,Adagrad、Adadelta、RMSprop如何优化大模型参数旅程?
大模型之优化器系列(二)原创 2025-07-07 23:57:43 · 783 阅读 · 0 评论 -
满血版优化算法介绍(一)从基础到加速,SGD、Momentum、ASGD、Rprop如何铺就优化之路?
大模型之优化器系列(一)原创 2025-07-07 23:43:47 · 824 阅读 · 0 评论 -
大模型底层探秘(三):大模型月底一结算,BPE分词技术就是躺赢狗?
大模型学习基础(三)大模型架构之分词技术(三)原创 2025-04-20 21:18:17 · 801 阅读 · 0 评论 -
大模型底层探秘(二):分词技术如何塑造AI的“语言基因”?全面详解BPE等子词分词算法原理
大模型学习基础(三)大模型架构之分词技术之二原创 2025-04-19 22:03:23 · 1019 阅读 · 0 评论 -
大模型底层探秘(一):分词技术如何塑造AI的“语言基因”?详解算法与代码
大模型学习基础(三)大模型架构之分词技术之一原创 2025-04-19 17:12:18 · 954 阅读 · 0 评论 -
GPT-3的跨界表演:175B参数如何用“困惑度“丈量语言理解边界?
大模型学习基础(二)自回归大模型的生成能力原创 2025-04-17 17:52:01 · 1981 阅读 · 0 评论 -
大模型能否理解“爱坤”?语言模型何时能够语义理解,跟随香农一起探索大模型的前世今生
大模型学习基础(一)语言模型原创 2025-04-17 01:12:28 · 1764 阅读 · 0 评论 -
当AI突然“开窍”,孔乙己:大模型知道“回”字有几种写法?
当AI突然"开窍",世界将会怎样?关于李宏毅生成式AI课程总结的补充。原创 2025-04-13 19:43:18 · 1861 阅读 · 0 评论 -
Prompt魔法师李宏毅:从ChatGPT‘翻车’到DeepSeek、Grok3鸡兔鸭同笼的完美解答竟只差这一步。
大模型学习基础导论原创 2025-04-12 22:21:32 · 866 阅读 · 0 评论 -
大模型学习路径(持续更新...)
大模型学习之路原创 2025-04-10 14:57:09 · 378 阅读 · 0 评论
分享