- 博客(57)
- 资源 (10)
- 收藏
- 关注
原创 高并发之nginx架构
Nginx作为高性能Web服务器的代表,其成功源于对操作系统能力的极致利用。为解决C10K问题,Nginx采用了多进程事件驱动架构,结合epoll等I/O多路复用技术,实现单线程处理数万并发连接。其核心优化包括:Master-Worker多进程模型实现进程隔离,epoll机制实现O(1)事件处理,零拷贝技术减少数据传输开销。通过这些创新设计,Nginx将传统Web服务器的单机并发能力提升到百万级别,证明了合理架构与系统调优可以突破硬件限制。Nginx的成功经验表明,充分利用操作系统特性比发明新理论更能有效解
2025-11-21 18:57:22
764
原创 性能相关指标
本文系统介绍了13个核心系统性能指标,分为业务指标和技术指标两大类。业务指标包括TPS(每秒事务数)、UV(独立访客)、PV(页面浏览量);技术指标涵盖QPS(每秒请求数)、吞吐量、并发数、响应时间、错误率等。文章详细阐述了每个指标的定义、计算方式及应用场景,如TPS衡量业务处理能力,QPS评估服务器性能,响应时间反映用户体验。还介绍了可用性、MTTR、MTBF等可靠性指标,并以银行App转账接口为例展示了指标综合应用。这些指标为系统性能评估、容量规划和故障定位提供了量化依据。
2025-11-14 23:06:35
1119
原创 单机并发简介
本文探讨了单机高性能的关键因素,分析了从C10K问题到现代高并发系统的演进。主要瓶颈包括线程内存开销(默认2MB栈)、文件描述符限制和I/O效率问题。通过epoll等事件驱动技术可优化网络I/O至O(1)复杂度,而SSD可降低磁盘延迟。最佳实践建议:I/O密集型应用采用异步模型,CPU密集型控制线程数接近核心数。典型配置分析显示,8核32GB机器可支持200万+连接或80k+ QPS,但需平衡内存、CPU和I/O资源。核心优化原则是最大化有效计算时间,减少调度开销和资源浪费。
2025-11-13 23:03:05
735
原创 transformer记录二(解码器步骤讲解)
本文详细解析了Transformer解码器的工作流程,重点介绍了推理阶段的核心步骤。解码器以预设标记<sos>开始,通过掩码自注意力机制防止信息泄露,执行交叉注意力融合编码器信息,并借助残差连接保持特征。关键环节包括多头注意力分解、投影输出归一化、前馈神经网络变换,最终通过线性投影和Softmax生成预测结果。文章还对比了束搜索(确定性输出)和采样(多样性输出)两种预测策略的差异,说明不同任务场景下的适用选择。整个过程以512维向量为基础,通过循环预测直到出现结束标记<eos>终止,
2025-11-13 14:32:16
935
原创 transformer记录一(输入步骤讲解)
本文详细介绍了Transformer架构的核心原理和实现流程。首先说明Transformer通过自注意力机制实现了序列数据的并行化建模,解决了RNN长距离依赖和计算效率问题。随后以"小莲,我喜欢你"为例,逐步讲解处理流程:1)分词器将句子拆分为token;2)词向量将token转换为512维向量;3)位置编码加入顺序信息。重点解析了编码器的工作机制,包括多头自注意力计算(Query/Key/Value向量生成、注意力分数计算、加权融合)、残差连接与LayerNorm、前馈神经网络等核心组
2025-11-02 20:24:05
1163
原创 神经网络发展【深度学习】
深度学习发展经历了四个关键阶段:从2012年AlexNet开启的卷积堆叠阶段,到2015年ResNet通过残差连接解决梯度消失问题;2017年Transformer以自注意力机制突破全局建模瓶颈;2020年后进入数据驱动的大模型时代,通过预训练和微调实现多模态融合。当前技术聚焦效率优化与垂直应用,采用稀疏化、知识蒸馏等方法降低计算成本,同时推动通用模型向医疗、法律等专业领域迁移。这一历程展现了从局部感知到全局交互、从单一模态到跨模态理解的技术演进路径,未来将向更高效、通用和可解释的方向发展。
2025-10-28 15:05:38
727
原创 基于window/ubuntu安装rknn-toolkit2【docker】
在Windows 11专业版通过WSL安装Ubuntu 20.04,并成功部署Docker环境,解决了直接加载Linux打包的RKNN模型转换工具镜像(rknn-toolkit2-v2.3.2)失败的问题。具体步骤包括:1)从Microsoft Store安装Ubuntu 20.04;2)配置Docker仓库并安装Docker;3)通过WSL文件共享将镜像文件拷贝至Ubuntu目录;4)使用docker load命令成功加载RKNN工具包镜像。该方法为Windows用户提供了便捷的Linux开发环境搭建方案
2025-10-24 18:05:30
774
原创 comfy UI节点缺失dlib库处理
编译为:dlib-19.24.99-cp312-cp312-win_amd64.whl。依赖环境:python3.12 comfyui 最新版本。进入到目录下,然后通过python进行手动安装。pip install dlib 出现错误。下载解压之后:直接通过。
2025-02-23 18:23:51
377
原创 comfy SDXL_EcomID_ComfyUI 节点地址
进入到ComfyUI_windows_portable\ComfyUI\custom_nodes。依赖:insightface 、 onnxruntime 、onnxruntime-gpu、如果实在拉不下来,这里直接把我下好的放到节点里面。
2025-02-23 10:12:04
747
原创 springboot mvn 打包,jar和资源文件分离打包
修改jar打包插件,一定需要添加启动类com.xxx.xxx.xxx自己修改。资源打包,导报到resources目录下面。依赖打包,把依赖文件打包到lib目录。添加资源,包含如下保和文件格式。然后再命令窗口进行打包操作。
2024-12-03 11:21:05
489
原创 问题An object named ‘ResNetArcFace‘ was already registered in ‘arch‘ registry!
发现是由于ResNetArcFace已经被注册,搜索了下,发下我安装的另外一个库已经包含了。那咋办了,一个是重新开个环境,通过conda创建一个虚拟环境,排除环境依赖,一个是修改源码。在安装 GFPGAN 的时候,一切都顺利,但是执行的时候出现了错误,哦还有一个问题,就是如果basicsr安装不成功可以执行如下命令。回归上面的问题,如果执行出现了如下错误。然后源代码重新安装,执行解决此问题。
2024-11-15 17:11:34
581
原创 基于docker部署nacos-mysql
在nacos-docker/xample目录下找到standalone-mysql-5.7.yaml。并修改nacos-docker/env/custom-application-config.env。这里数据库搭建在docker里面,所以我这边的ip选择的就是docker的ip。这里修改文件为如下standalone-mysql-5.7.yaml。需要登录的容器里面进行授权,还有sql也需要执行。在nacos-docker目录下执行。工具:docker-compose。数据库:mysql5.7。
2024-10-25 10:35:43
750
原创 查询vllm-flash-attn与之对应的pytorch
最近安装vllm的时候 有时候pytorch版本总是弄错,这里写下vllm-flash-attn与pytoch对应关系。点进去查询对应的pytoch。
2024-08-29 13:51:08
4916
原创 SkyWalking部署(监控系统)
SkyWalking 是一个开源的应用性能监控 (APM) 和可观测性平台,旨在帮助开发者、运维人员和架构师监控、诊断和优化微服务架构中的应用。SkyWalking 提供了一套完整的工具链,用于收集、分析和可视化应用的性能指标、追踪和日志数据。SkyWalking 的主要特点自动发现服务拓扑图。自动跟踪服务间的依赖关系。自动收集服务和应用的性能指标。支持多种编程语言,包括 Java、Go、.NET、Node.js 等。
2024-08-28 15:08:10
2332
3
原创 卷积神经网络(三)-zfNet
ZFNet(Zeiler & Fergus Net)是由Matthew D. Zeiler和Rob Fergus在2013年提出的卷积神经网络模型,它是基于AlexNet进行改进而来的。ZFNet在当年的ImageNet Large Scale Visual Recognition Challenge (ILSVRC)中取得了冠军,尤其在分类和定位任务上表现突出。
2024-07-25 09:42:27
1474
4
原创 卷积神经网络(二)-AlexNet
AlexNet 针对之前的CNN做出来改进,把网络模型增加了(之前训练的5层到8层),并且带权重的网络增加到了8层,识别种类可以达到1000种,在当时是非常不错了,参数60,516,968个(大约6000w个权重参数,和论文里面的60million对上了里面包含的可训练的网络层只有8层(C1、C2、C3、C4、C5、F1、F2、F3)相当于现在的网络层级来说层数太浅了无法支持更复杂的特征。提出步长小于滤波器的边数,这样获取值的时候能够对有效特征进行重复提取,可以提高识别精度。
2024-07-22 10:31:02
777
原创 卷积神经网络(一)-LeNet-5
CNN网络的开山之作,很简单的结构,总共就7层,整体的参数个数:59,706 参数接近6万,参数量相对于现在来说是已经很小了,由于之前受计算机性能和数据等影响,也没法发展太大的网络框架。但是此框架给我们开了一个头,而且由于他的简单方便我们学习。
2024-07-17 17:37:14
1017
原创 onnx模型转rknn到部署
最近开始用3568的板子,之前是在用3399,cpu的话3399比3568强,但是3568有1T的npu算力,所以模型移植过来用npu使用,之前用ncnn感觉太慢了,rk的npu使用没有开源,所以没法兼容,只能跑rknn了。有些版本可以有限制,无法查询当前的命令,但是如果代码能够正常执行就行。这里采用的模型是 insightface 的 det_500m.onnx 模型,用来做人脸目标检测。
2024-06-28 17:14:37
3849
原创 ONNX2NCNN工具
最近部署很多onnx转ncnn的操作,发现还是需要有页面操作会比较好,而且需要查询onnx的图,所以写了一个工具来搭配使用建议搭配来使用。
2024-06-13 10:50:40
3037
4
原创 关于人脸识别【insightface】 ncnn移植到rk3399
参考上一章量化之后,识别速度没有提升,后面我只能换小点的模型了,把【det_10g】改为【det_500m】速度终于提升上来了,识别效果还在在rk3399 上面由1s多 降为500ms左右,但是速度还是有点慢。看了下识别时长,基本都是目标检测和人脸特征提取这两个时间有点长。
2024-06-12 18:56:24
1308
原创 人脸识别之--计算余弦相似度-android
余弦相似度是比对两个向量是否一致,同样可以比较两组特征的相识度,一般人脸识别中会比较常用到,而且计算出来的结果就可以展示相似度分值。其中Embed值是list 值为512维。
2024-06-12 18:07:55
903
原创 卷积池化尺寸计算公式
卷积CNN是我们最常使用的,但是有时候需要观察他的输出前后的差异,这里描述下计算方式,具体如下:图片大小:WxHxD W:宽 H:高 D:通道(RGB) 例:320x320x3卷积核:NxNx3 卷积核大小 后面的3是和图片的通道对应,如果图片是灰度的那么就是1卷积核个数:C步长:S 每次一卷积的时候跨越的步长填充:P 外网填充多少行和列,一般是图片保留特征或者是维持图片大小公式计算:输出数据的高度:OH = (H - N + 2P) / S + 1。
2024-06-06 19:05:05
2231
原创 ncnn 优化量化
当前正在做人脸检测部署,发现检测速度有点吓人,以下监测的时间gpu:cpu:gpu推理大概整体时间200多毫秒,cpu推理时间300多毫秒,这里暂时没去考虑内存了。只考虑效率。用的insightface的det_10g 和w600k_r50模型,一个用于检测人脸框,一个用于对齐人脸特征。其实主要的时间集中在了检测框步长8的步骤。现在我的主要思路是基于ncnn的量化来进行优化,看看是否满足效果。
2024-05-24 16:20:30
2202
原创 NMS出现重框问题
最近做目标检测的时候,发现通过极大值,还是有可能出现两个重叠的方框具体如下:核心代码如下:问题排查:通过定位排查,发现里面有个缺陷,就是在重叠框和目标框过小的时候,容易导致出现出问题NMS计算是IOU,就是计算重叠面积,占据两个框总面积减去重叠框的比例如果其中一个面积比较大,一个面积比较小,这个时候哪怕完全重叠,他们的IOU的NMS也比较低,通过阈值过滤会失败,导致出现两个重叠的方框。比如:我设置的阈值是0.4有两个方框A和B方框A的面积是1000,而B的面积是10,他们完全重叠,但是计算出来的N
2024-05-22 21:08:58
605
原创 ncnn android编译
直接使用下面的和官方的opencv 出现了typeid无法识别的问题。如果直接使用的opencv但是看了有些函数被去掉了,我一个项目刚好需要estimateAffinePartial2D函数,但是恰好他没有,那么只能选择官方的opencv(但是又碰上了 error: use of typeid requires -frtti主要是用到了typeid 引起的,android为了效率关闭了运行时类型信息 (RTTI),开启会增加程序大小和降低性能。
2024-05-22 09:11:39
967
原创 人脸识别之bbox【det_10g】-ncnn(c++)
det_10g是insightface 人脸框图和人脸关键点的分类,最终能够得到人脸框图bbox,分值还有人脸五官(眼x2、鼻子x1、嘴巴x2)
2024-05-11 16:33:55
1724
原创 torch对应版本torchvision和torchAudio
返回False,那么是无法使用gpu的,所以需要找到pytorch和cuda的对应关系,不能安装cpu版本,不然无法使用gpu的。
2024-04-18 11:57:29
29708
docker部署服务文档
2023-11-28
rk3399烧录工具&烧录教程
2023-02-13
node js模块 打包
2017-10-18
缓冲区代码
2014-03-11
ProtocolBuffers-2.2.0-Source (1).tar.gz
2014-12-12
comfyui-ComfyUI-Impact-Pack 节点模型
2025-02-22
nacos-docker资源
2024-10-25
AlexNet论文 (2)
2024-07-18
onnx转ncnn工具,ui操作
2024-06-13
insightface模型onnx
2024-06-12
insightface模型onnx转ncnn模型
2024-06-12
ncnn 包,window
2024-04-24
asterisk20编译的相应包编译包
2024-02-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅