- 博客(96)
- 资源 (18)
- 问答 (1)
- 收藏
- 关注
原创 端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
2025-03-28 16:04:03
698
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-4
分析测试代码,并以测试代码整理各个函数的调用栈,为后续的调用分析打下基础。
2024-11-27 17:10:20
1122
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-6
分析里面add流程,查看ivfsq训练得到了vmin和vdiff之后,如何对库中的向量如何进行处理
2024-11-27 16:35:07
324
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-1
分解faiss源代码,帮助大家理解ivf-sq的流程以及ivf-sq转移到pgsql上进行重写
2024-11-25 16:23:02
1165
原创 5万字讲解大模型语言高效推理研究(清华综述)
大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于高效大模型推理的文献进行了全面的综述总结。首先分析了大模型推理效率低下的主要原因,即大模型参数规模、注意力计算操的二次复杂度作和自回归解码方法。然后,引入了一个全面的分类法,将现有优化工作划分为数据级别、模型级别和系统级别的优化。此外,本文还对关键子领域的代表性方法进行了对比实验,以及分析并给出一定的见解。
2024-09-19 15:38:26
1084
原创 自然语言处理——英文文本预处理
针对LLM中最需要的数据,在刚开始进行LLM训练的时候,高质量的数据是非常重要的,但是在获取的数据可能不是人们需要的数据,因此,为了加快数据的获取,本文在这里进行相关文本预处理内容的获取。
2024-06-26 20:13:04
1322
原创 MySQL篇-MySQL存储引擎详解
但是有没有想过,MySQL 执行一条 select 查询语句,在 MySQL 中期间发生了什么?最为重要的存储引擎在其中起到极大的作用,但是却不被重视,因此这里从存储引擎的角度来看待MySQL
2023-09-25 16:13:35
321
南京大学数理逻辑考试内容
2025-01-28
南京大学软件学院专硕论文编写模板
2024-09-02
南京大学软件学院学硕论文编写模板
2024-09-02
用来查看AIGC的数字标注产业的前景
2024-07-10
用于解决Matlab路径的问题
2023-10-14
利用VMWare来部署Hyperledger Fabric
2023-10-09
南京大学服务器上搭建UOJ系统的保姆级步骤
2023-09-30
leetcode动态规划算法详细讲解
2023-08-29
高级算法-nju-onlineJudge-master-java和python的答案
2022-06-15
操作系统+软件工程+计算机网络相关PPT资源
2022-05-26
飞机大战源码地址--用于帮助初学者理解Java--java练手项目
2022-05-16
简洁非交互式零知识证明参数(zk-SNARKS),本文系统介绍了zk-SNARKS的数学理论,需要有一定的数学功底的人进行阅读
2022-03-28
走向后量子区块链:抗量子计算攻击的区块链加密综述
2022-03-11
Off-chaining Models and Approaches to Off-chain Computations
2022-01-29
研究生面临着选择研究方向的困难
2022-03-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人