- 博客(4)
- 资源 (1)
- 收藏
- 关注

原创 100行代码搞定12306库存问题:谈12306系统设计思路
2016年春运刚过,12306购票系统又一次被推到风头浪尖,这次春运12306系统表现还是不错的,除了神一样的验证码以外,基本上没有出现过大面积长时间的故障。12306系统复杂程度、系统如何设计,作为技术人员值得深入思考一下。12306数据分析预售期:60天车站:3000+ 车次:7000/天日期车次:7000 X 60=42万站站:21万/天日期站站:...
2018-04-08 11:13:23
4059
原创 大模型Transformer入门(2)-演算过程
交叉熵损失函数衡量的是预测概率分布与真实概率分布之间的差异,其公式为:是样本数量(在这里是4000)。是类别数量(在这里是5,因为矩阵是5x4000的)。是真实标签概率分布矩阵 (P) 中第 (i) 个样本的第 (j) 个类别的概率。是预测概率分布矩阵 (Q) 中第 (i) 个样本的第 (j) 个类别的概率。这里的是整个数据集上的平均交叉熵损失。这个公式的输出是一个标量值,表示了模型预测与真实标签之间的不匹配程度。这个值越小,说明模型的预测结果与真实标签越接近;
2024-06-27 14:03:17
1378
1
原创 大模型Transformer入门(1)-模型理解
Transformer是许多大模型的基础模型,理解Transformer是学习大模型原理一个很好的开始。目前的资料分散且不容易理解,本文通过简单通俗的方式描写,希望即使是算法小白也能够了解。本文分为三部分,包括零模型理解、算法演算、微调应用。机器学习为什么称之为学习是因为模拟了人类学习的过程。人类学习的过程就是学习、做题、纠错,再做题,直到最终达到满意分数,通过大脑掌握知识。机器学习的过程类似,只不过我们最终得到的是复合函数,以及相关的最优的参数集合。
2024-06-27 11:52:01
728
原创 DOP(Delivery-Oriented Programing)面向交付的编程
通常人类认识和改造世界分两个层次,即科学与技术,科学是基础性的研究,探寻未知领域的规律和规则。而技术通常指科学新发现后的实际应用,需要考虑如何规模化应用,如何普惠。软件开发是典型的技术应用学科,规模化应用,如何高质量、高效率的交付,如何降低成本、如何技术普惠是首要任务。 从第一行机器语言到汇编语言,再从汇编语言到高级语言,人们面对的软件应用越来越复杂,需要更高效的...
2020-05-08 09:54:24
1966
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人