随缘测试
文章平均质量分 60
小湿哥
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
高性能代码优化实战与解析
在实际软件开发中,性能优化的手段非常多样,最常见的往往是业务逻辑、数据结构和算法层面的改进。本文主要聚焦于计算密集型场景下的一些底层优化方法,包括循环展开、SIMD、循环合并、分支去除和数据预取等。这些技术并不是通用的“万能钥匙”,而是针对特定类型的性能瓶颈,在合适的场景下可以带来显著提升。原创 2025-09-15 16:38:02 · 1004 阅读 · 0 评论 -
性能优化-循环展开的威力有多大?
文章摘要:本文对比了三种计算字符串长度的实现方法:普通循环、4次循环展开和SIMD(AVX2)优化版本。测试数据显示,在10万次随机字符串测试中,SIMD版最快(16.7ms),4次展开版次之(30.2ms),原始循环最慢(41.1ms)。循环展开通过减少循环次数(N/4)和分支判断提升性能,而SIMD利用AVX2指令集一次处理32字节数据,实现并行计算。性能排序为:SIMD > 4次展开 > 原始循环,验证了优化策略的有效性。原创 2025-09-07 02:46:11 · 291 阅读 · 0 评论 -
多模匹配Aho-Corasick 算法真的很快吗?
本文比较了多模匹配算法(Aho-Corasick)与普通字符串查找在性能上的差异。多模匹配通过构建Trie树和失败指针,实现时间复杂度为O(n+m)的高效匹配,而普通查找则为O(n*k)。实验使用不同数量级的关键词(10,100,500个)测试一个系统日志文件,结果表明多模匹配在关键词数量较大时性能优势显著。测试代码基于开源aho_corasick实现,通过计时器测量两种方法的匹配耗时,为选择合适的关键词规模场景提供数据参考。原创 2025-06-26 20:18:48 · 382 阅读 · 0 评论 -
常见压缩算法性能和压缩率对比 LZ4 LZO ZSTD SNAPPY
压缩算法性能对比与实测分析 通过对LZ4、Zstandard、Brotli、LZO和Snappy五种压缩算法的测试表明: 速度方面:LZ4和LZO表现最佳,压缩/解压耗时最短(LZ4仅需15ms解压); 压缩率:Zstd以9.23%的压缩率显著领先,Brotli次之(13.19%); 综合性能:Zstd在压缩率和速度间取得平衡,适合文件压缩、数据库备份等场景;LZ4则更适用于实时数据处理。实测日志压缩中,Zstd压缩耗时71ms,解压31ms,综合性价比最优。各算法安装简单,通过GitHub源码编译即可快速原创 2025-05-30 17:09:03 · 2169 阅读 · 0 评论 -
RedisDB双机主从同步性能测试
测试程序单连接写入并且同步只有 10000 req/s 左右的写入性能。如果关闭PUB,单纯写入会有20000 req/s左右性能。通过benchmark验证,单链接也是18000 req/s写入性能。原创 2025-01-09 21:17:11 · 687 阅读 · 0 评论 -
单线程内存拷贝速度居然比硬盘写入还慢?
单线程内存顺序拷贝,首次拷贝性能不如SSD写入性能!原创 2024-04-10 16:45:08 · 773 阅读 · 0 评论 -
iperf3跑满100G网卡实测记录
其中发送速率12016406,基本稳定在1200000 KB/s以上。三个窗口分别同时开3个iperf3 client,跑10分钟。三个iperf3 Client, 合并速率大约 92GB/s。Kbps Mbps Gbps换算倍数是 1000。三个窗口分别开3个iperf3 server。ubuntu20.04, 系统设置默认状态。Kpbs 与 KB/s换算关系是 x8。两台服务器 100G网卡对插直连。原创 2023-07-27 16:13:16 · 6586 阅读 · 0 评论 -
gettimeofday和clock_gettime性能对比
测试方法gettimeofday 和 clock_gettime的7种类型时间的对比。clock_gettime类型如下类型含义CLOCK_REALTIME从1970.1.1到目前的时间CLOCK_MONOTONIC系统启动到现在的时间CLOCK_THREAD_CPUTIME_ID线程所消耗的时间CLOCK_PROCESS_CPUTIME_ID进程所消耗的时间CLOCK_MONOTONIC_RAW基于硬件时间CLOCK_REALTIME_CO原创 2022-03-29 15:13:48 · 4022 阅读 · 1 评论
分享