自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 资源 (18)
  • 问答 (1)
  • 收藏
  • 关注

原创 第一季度过程

介绍量化的第一季度学习计划

2025-06-09 10:16:26 172

原创 量化策略聚焦方向与里程碑计划

介绍量化分析的进行方向与里程碑

2025-06-09 10:13:24 347

原创 最大似然估计(Maximum Likelihood Estimation, MLE)详解

最大似然估计(MLE)通过最大化观测数据的概率来估计参数。经典例子包括正态分布的均值/方差估计($\mu^=\frac{1}{n}\sum x_i$)和二项分布参数估计($p^*=k/n$)。在大模型(如GPT、BERT)中,MLE是损失函数(如交叉熵)的基础,但需结合正则化、优化算法(如Adam)应对过拟合和高维问题,并扩展至生成模型(如GAN)。其局限性(过拟合、非凸优化)通过贝叶斯方法、数据增强等技术缓解,成为统计学习与深度学习的核心方法论

2025-05-24 15:59:45 1390

原创 贝叶斯理论

讲解贝叶斯概率

2025-05-24 10:43:48 461

原创 win11安装Joplin Server私有化部署(docker)

win11安装Joplin Server私有化部署,并且进入到joplin里面创建新的用户

2025-05-15 12:56:43 1030

原创 基于JL的提升--SJLT

JL的提升,使用SJLT稀疏矩阵进行降维

2025-04-30 09:38:44 903

原创 编译faiss

编译faiss的过程

2025-04-30 09:34:33 406

原创 PDX列式存储

介绍论文PDX,介绍列存会比行存的方式更快的存储下来

2025-04-15 16:52:26 941

原创 J-L引理(随机投影,Random Projection)

讲解随机投影里面的J-L引理

2025-04-15 16:49:16 1050

原创 duckdb源码阅读学习路径图

duckdb数据库源码阅读

2025-04-08 17:03:26 341

原创 理解 DuckDB 的逻辑计划(Logical Plan)、优化器(Optimizer)和物理执行计划模块的工作流程

理解duckdb中的逻辑计划,优化器和物理执行的工作流程

2025-04-08 17:01:34 970

原创 测试duckdb运行所需的文件

测试duckdb在嵌入式设备里面所需要的最小文件内容

2025-04-02 15:25:32 718

原创 duckdb不支持向量

测试duckdb不支持向量

2025-04-02 15:21:17 312

原创 duckdb、PG、Faiss和Milvus调研与对比

数据库的对比调研

2025-04-01 15:20:20 1096

原创 统计duckdb的文件代码行数

统计duckdb代码行数的简单python脚本

2025-04-01 15:15:00 232

原创 端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小

端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小

2025-03-28 16:04:03 750

原创 理解CMakeLists.txt文件

理解CMakeLists文件

2025-03-28 16:01:34 885

原创 duckDB安装

DuckDB安装

2025-03-27 16:33:18 485

原创 duckDB使用

DuckDB使用

2025-03-27 16:32:25 711

原创 ivfsq的码表理解

ivfsq码表的理解

2025-03-24 14:51:48 992

原创 PostgreSQL并行化内容

帮助快速了解PostgreSQL的并行化过程

2025-03-24 14:47:56 1245

原创 向量数据库与RAG模型在嵌入式设备中使用ivfsq索引的重要性

主要介绍ivfsq索引在嵌入式设备当中相比于ivfflat索引的重要性

2025-03-12 11:13:14 1074

原创 ivfsq参数设置

根据faiss的内容,在PostgreSQL的拓展pgvector里面添加了ivfsq索引中的一些功能的设计

2025-03-12 11:07:09 627

原创 elkan K-Means算法

详细记录了elkan kmeans算法在ivfflat当中的计算过程,如何去寻找桶中心

2025-02-24 09:13:47 970

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-7

faiss里面的搜索过程

2024-12-25 16:35:20 792

原创 软工本科生毕设-区块链设计模式知识库系统

以区块链设计模式为例子,帮助本科生设计自己的知识库系统

2024-12-17 14:40:38 1353

原创 postgresql与pgvector安装与使用

postgresql的安装与使用

2024-12-02 09:13:11 607

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-4

分析测试代码,并以测试代码整理各个函数的调用栈,为后续的调用分析打下基础。

2024-11-27 17:10:20 1163

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-6

分析里面add流程,查看ivfsq训练得到了vmin和vdiff之后,如何对库中的向量如何进行处理

2024-11-27 16:35:07 363

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-5

详细分析faiss里面的train函数的调用过程

2024-11-27 16:28:21 437

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-3

进入到调试,并修改相对应的代码,查看里面的内容

2024-11-27 09:17:33 939

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-2

介绍ivfsq里面的相关函数

2024-11-26 19:28:37 1249

原创 gbd调试ivfflat索引

gdb调试pgVector中ivfflat索引流程

2024-11-25 16:25:33 907

原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-1

分解faiss源代码,帮助大家理解ivf-sq的流程以及ivf-sq转移到pgsql上进行重写

2024-11-25 16:23:02 1279

原创 C++指针使用指南

C++指针使用指南

2024-11-13 15:23:39 801

原创 C++/C输出字符全部介绍

C++输出字符全部介绍

2024-11-13 15:19:39 434

原创 复利--全球顶尖投资者的31节认知与决策思维课

记录书中比较有价值的观点

2024-10-10 21:50:36 899

原创 5万字讲解大模型语言高效推理研究(清华综述)

大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于高效大模型推理的文献进行了全面的综述总结。首先分析了大模型推理效率低下的主要原因,即大模型参数规模、注意力计算操的二次复杂度作和自回归解码方法。然后,引入了一个全面的分类法,将现有优化工作划分为数据级别、模型级别和系统级别的优化。此外,本文还对关键子领域的代表性方法进行了对比实验,以及分析并给出一定的见解。

2024-09-19 15:38:26 1172

原创 英文文本预处理——文本清理

对英文文本进行预处理+相关python代码

2024-09-10 08:14:39 713

原创 南京大学软件学院硕士毕业流程

主要介绍从开题报告到后面的毕业离校的所有流程

2024-09-02 15:52:11 1275

线性代数中奇异值分解与特征值分解的理论及其在大模型中的应用解析

内容概要:文章详细介绍了奇异值分解(SVD)和特征值分解(EVD)的定义、公式、核心区别及其在大模型中的应用。EVD仅适用于方阵,将矩阵分解为特征值和特征向量的组合,揭示矩阵的缩放、旋转特性;SVD适用于任意矩阵,分解为三个特定矩阵的乘积,揭示矩阵行空间和列空间的结构。EVD应用于主成分分析、矩阵稳定性分析和物理系统建模;SVD用于降维与压缩(如图像压缩、潜在语义分析)、推荐系统(如协同过滤)、模型加速与压缩(如Transformer中的注意力计算加速)以及初始化与正则化等方面。; 适合人群:对线性代数有一定了解,从事机器学习、数据科学或相关领域的研究人员和技术人员。; 使用场景及目标:①理解EVD和SVD的基本理论,掌握其数学推导和应用场景;②利用EVD进行主成分分析、矩阵稳定性分析等任务;③运用SVD进行降维、压缩、推荐系统构建及模型优化。; 其他说明:文章不仅提供了理论知识,还结合实际案例(如PCA、Transformer中的SVD应用),帮助读者更好地理解和应用这两种分解方法。建议读者在学习过程中结合具体实例进行实践,以加深理解。

2025-05-24

南京大学数理逻辑考试内容

数理逻辑这门课程主要为了帮助计算机学生去了解算法的一些逻辑基础,考试的内容主要聚焦于课后习题,基本上都是原题,那么就需要去熟知所有的课后习题。这里整理了所有的课后习题的答案,帮助学生去进一步巩固课后知识点

2025-01-28

性格测试-用于记录自己的个性

用于个人

2024-11-03

南京大学毕业生答辩PPT模板

主要是用于南京大学各个学院的毕业生答辩的PPT模板,用于毕业答辩的标准模板!!!

2024-09-02

南京大学软件学院专硕论文编写模板

用于南京大学软件学院硕士生论文编写的模板,这个模板来自于南京大学软件学院的latex模板,专门用于南大软院硕士生论文编写的模板,只有进入南大的人可以在南大的latex编辑页面(https://tex.nju.edu.cn/console)可用,外人下载没有任何意义,望周知。

2024-09-02

南京大学软件学院学硕论文编写模板

用于南京大学软件学院硕士生论文编写的模板,这个模板来自于南京大学软件学院的latex模板,专门用于南大软院硕士生论文编写的模板,只有进入南大的人可以在南大的latex编辑页面(https://tex.nju.edu.cn/console)可用,外人下载没有任何意义,望周知。

2024-09-02

软件学报2016年排版样例模板

软件学报2016年排版样例模板

2022-06-07

Off-chaining Models and Approaches to Off-chain Computations

区块链是不同计算和经济学概念的组合,主要包括对等网络,不对称密码学,共识协议,分散存储,分散计算和智能合约以及激励机制。这些概念的综合将区块链定位为新技术并同时作为可编程平台和网络。这里引入的链下计算是将区块链上进行复杂的运算转移到链下,让链上和链下的任务区分开来,减轻链上不断为了交易而彼此之间相互计算而消耗的资源,从而让链上变得更轻,从而提高区块链的性能。

2022-01-29

用来查看AIGC的数字标注产业的前景

数据标注,正迎来关键时刻。作为AI认识世界的起点,数据标注本质上是将现实世界信 息结构化、数字化,充分发挥数据信息的价值。 ⼤模型时代到来,AIGC众多垂直场景落地,以及通⽤智能、具⾝智能等前沿领域探索, 与⾼质量、专业化的场景数据密不可分,数据标注从劳动密集型加速朝着知识密集型转 型,⾏业壁垒进⼀步提⾼。 作为底层基础服务,数据标注贯穿⼤模型全⽣命周期(训练测试、评估验证和应⽤迭 代)。⼀⽅⾯,牵涉关键Know-how,更多⼤模型公司/AI企业选择⾃建标注团队和管线; 另⼀⽅⾯,上下游合作关系将更为紧密和耦合,专业数据服务提供商更多机会将在垂直 领域,帮助企业完成私有化部署。 机遇与挑战并存。合成数据作为新衍⽣赛道,潜在市场空间巨⼤。与此同时,数据标注 标准难以统⼀、数据处理流程尚未规范,⾼学历多领域多专业成为标注⼈才的硬指标。

2024-07-10

用于解决Matlab路径的问题

新手使用matlab会遇到文件夹的问题: 第一,新建一个脚本,Ctrl+S时怎么弹出我们预想的位置? 这个简单,搜一下怎么修改默认保存文件夹,同时也是工作路径,很轻松就能完成修改。 第二,这个问题可能就有些“坑”了~ 我们已经修改默认文件夹(工作路径)了,然后新建了一个.m文件,Ctrl+S了,信心满满地去运行程序,准备出结果的时候,我们发现它还是会出现如上图的提示。这是怎 么一回事呢?我们不是已经修改了工作路径,这时MATLAB应该自动寻找到默认工作路径下刚刚新建的文件然后执行啊,怎么还会出现“不在工作路径里”的提示,表示它找 不到这个文件呢。

2023-10-14

利用VMWare来部署Hyperledger Fabric

在VMWare安装Ubuntu系统和VM工具,之后安装相关的安装包,Docker和docker-compose,之后安装go语言开发换景,之后部署Hyperledger Fabric

2023-10-09

南京大学服务器上搭建UOJ系统的保姆级步骤

从申请南京大学服务器开始,然后搭建docker系统,之后创建UOJ系统用于发布课堂作业,用于帮助助教进行UOJ系统搭建,帮助助教更好的完成老师布置的任务

2023-09-30

leetcode动态规划算法详细讲解

动态规划,英⽂:Dynamic Programming,简称DP,如果某⼀问题有很多重叠⼦问题,使⽤动态规划是最有效的。 所以动态规划中每⼀个状态⼀定是由上⼀个状态推导出来的,这⼀点就区分于贪⼼,贪⼼没有状态推导,⽽是从局部直接选最优的.

2023-08-29

OneDrive共享文档使用方法

使用OneDrive进行文档共享使用方法

2023-08-11

c3p0数据库连接文件

c3p0数据库连接文件

2022-11-13

电子商务详细内容-创新业务

电子商务详细内容-创新业务

2022-07-06

高级计算机网络相关内容

计算机网络、路由器的链路、静态路由、动态路由链接方式、路由解释等等

2022-06-15

高级软件设计-设计模式

相关涉及模式内容介绍

2022-06-15

敏捷开发的相关内容和实践

敏捷开发相关知识点和方法+利用敏捷开发多邮箱管理系统实践

2022-06-15

软件需求工程的制定过程

需求确认过程

2022-06-15

IEEE论文模板+自我翻译论文模板

IEEE

2022-06-15

高级算法-nju-onlineJudge-master-java和python的答案

高级算法-nju-onlineJudge-master-java和python的答案+考试题目

2022-06-15

数据仓库和知识发现相关笔记

记录一些关于学习数仓的笔记,主要用于自我复习使用

2022-06-08

南京大学软件学院研究生第一学期相关考试资料汇总

主要涉及数据仓库和软件工程A4纸,这些是比较实用的。

2022-06-07

山东大学时间序列相关课件

数学专业方面的专业知识,需要一定的概率论知识的人

2022-05-26

操作系统+软件工程+计算机网络相关PPT资源

操作系统+软件工程+计算机网络相关PPT资源,关于相关南京大学软件学院自主命题842考试资料的相关知识点,关于南京大学本科上课相关PPT,更加详细了解到南京大学对于各个知识点的详细了解

2022-05-26

飞机大战源码地址--用于帮助初学者理解Java--java练手项目

项目功能: 1、窗体绘制 2、图片与字体的绘制 3、背景图片的循环移动 4、鼠标控制飞机的移动位置 5、子弹的批量生成 6、敌机在随机位置批量生成 7、子弹和飞机的碰撞检测 8、爆炸动画效果的实现 9、计分面板的实现 10、游戏的暂停功能 11、游戏的通关设置 12、血条的绘制 13、双缓存解决画面闪存问题 14、集合的适用和优化

2022-05-16

overleaf中文模板+论文翻译(区块链共识算法-Monoxide)

通过overleaf将论文Monoxide进行了一遍翻译,并且创建了overleaf的中文模板

2022-05-13

走向后量子区块链:抗量子计算攻击的区块链加密综述

区块链和其他分布式账本技术(DLT)在过去几年中有了显著的发展,由于其提供透明度、冗余性和问责制的能力,已被建议用于许多应用程序。在区块链的情况下,这些特征是通过公钥加密和散列函数提供的。然而,量子计算的快速发展为在不久的将来执行基于Grover和Shor算法的攻击提供了可能性。这类算法威胁到公钥密码和散列函数,迫使重新设计区块链,以利用能够抵御量子攻击的密码系统,从而创建被称为后量子、量子证明、量子安全或量子抵抗的密码系统。为此,本文首先研究了后量子密码系统的现状,以及如何将其应用于区块链和DLT。此外,还研究了最相关的后量子区块链系统及其主要挑战。此外,还对最有前途的区块链后量子公钥加密和数字签名方案的特征和性能进行了广泛的比较。因此,本文试图为未来的区块链研究人员和开发人员提供一个关于后量子区块链安全的广泛视角和有用的指导方针。 shor和grover和分别针对区块链快速生成区块和检测哈希冲突来替换区块链的区块。 第二节描述了与区块链及其安全原语相关的基本概念。 第三节研究量子攻击对区块链公钥安全方案和最流行的哈希函数的影响。

2022-03-11

简洁非交互式零知识证明参数(zk-SNARKS),本文系统介绍了zk-SNARKS的数学理论,需要有一定的数学功底的人进行阅读

我们构建了一个系统,为冯·诺依曼RISC体系结构上的程序执行提供简洁的非交互式零知识证明(zk SNARKs)。该系统由两部分组成:一个用于验证算术电路可满足性的密码验证系统,以及一个用于将程序执行转换为此类电路的电路生成器。与之前的工作相比,我们对这两个组件的设计在功能和效率方面都有所提高,如下所示。我们的电路生成器是第一个通用的:它不需要知道程序,只需要知道它的运行时间。此外,输出电路的大小取决于程序大小(而不是乘法),从而允许验证较大的程序。加密证明系统通过利用新算法和根据协议定制的配对库,提高了证明和验证时间。我们对我们的系统进行了评估,以获得多达10000条指令的程序,运行多达32000个机器步骤,每个步骤都可以任意访问随机存取存储器;并演示了如何执行使用即时编译的程序。我们的证明在80位安全性时长230字节,在128位安全性时长288字节。不管原始程序的运行时间如何,典型的验证时间为5毫秒。

2022-03-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除