- 博客(107)
- 资源 (18)
- 问答 (1)
- 收藏
- 关注
原创 最大似然估计(Maximum Likelihood Estimation, MLE)详解
最大似然估计(MLE)通过最大化观测数据的概率来估计参数。经典例子包括正态分布的均值/方差估计($\mu^=\frac{1}{n}\sum x_i$)和二项分布参数估计($p^*=k/n$)。在大模型(如GPT、BERT)中,MLE是损失函数(如交叉熵)的基础,但需结合正则化、优化算法(如Adam)应对过拟合和高维问题,并扩展至生成模型(如GAN)。其局限性(过拟合、非凸优化)通过贝叶斯方法、数据增强等技术缓解,成为统计学习与深度学习的核心方法论
2025-05-24 15:59:45
1390
原创 win11安装Joplin Server私有化部署(docker)
win11安装Joplin Server私有化部署,并且进入到joplin里面创建新的用户
2025-05-15 12:56:43
1030
原创 理解 DuckDB 的逻辑计划(Logical Plan)、优化器(Optimizer)和物理执行计划模块的工作流程
理解duckdb中的逻辑计划,优化器和物理执行的工作流程
2025-04-08 17:01:34
970
原创 端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
2025-03-28 16:04:03
750
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-4
分析测试代码,并以测试代码整理各个函数的调用栈,为后续的调用分析打下基础。
2024-11-27 17:10:20
1163
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-6
分析里面add流程,查看ivfsq训练得到了vmin和vdiff之后,如何对库中的向量如何进行处理
2024-11-27 16:35:07
363
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-1
分解faiss源代码,帮助大家理解ivf-sq的流程以及ivf-sq转移到pgsql上进行重写
2024-11-25 16:23:02
1279
原创 5万字讲解大模型语言高效推理研究(清华综述)
大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于高效大模型推理的文献进行了全面的综述总结。首先分析了大模型推理效率低下的主要原因,即大模型参数规模、注意力计算操的二次复杂度作和自回归解码方法。然后,引入了一个全面的分类法,将现有优化工作划分为数据级别、模型级别和系统级别的优化。此外,本文还对关键子领域的代表性方法进行了对比实验,以及分析并给出一定的见解。
2024-09-19 15:38:26
1172
线性代数中奇异值分解与特征值分解的理论及其在大模型中的应用解析
2025-05-24
南京大学数理逻辑考试内容
2025-01-28
南京大学软件学院专硕论文编写模板
2024-09-02
南京大学软件学院学硕论文编写模板
2024-09-02
Off-chaining Models and Approaches to Off-chain Computations
2022-01-29
用来查看AIGC的数字标注产业的前景
2024-07-10
用于解决Matlab路径的问题
2023-10-14
利用VMWare来部署Hyperledger Fabric
2023-10-09
南京大学服务器上搭建UOJ系统的保姆级步骤
2023-09-30
leetcode动态规划算法详细讲解
2023-08-29
高级算法-nju-onlineJudge-master-java和python的答案
2022-06-15
操作系统+软件工程+计算机网络相关PPT资源
2022-05-26
飞机大战源码地址--用于帮助初学者理解Java--java练手项目
2022-05-16
走向后量子区块链:抗量子计算攻击的区块链加密综述
2022-03-11
简洁非交互式零知识证明参数(zk-SNARKS),本文系统介绍了zk-SNARKS的数学理论,需要有一定的数学功底的人进行阅读
2022-03-28
研究生面临着选择研究方向的困难
2022-03-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人