31、SIMD strlen() 实现与 x86 - 64 架构特性解析

最新推荐文章于 2025-07-23 15:05:08 发布

tree

最新推荐文章于 2025-07-23 15:05:08 发布

阅读量22

点赞数

CC 4.0 BY-SA版权

分类专栏：探索逆向工程与汇编语言的秘密文章标签： SIMD strlen x86-64

本文链接：https://blog.youkuaiyun.com/tree/article/details/149606304

探索逆向工程与汇编语言的秘密专栏收录该内容

81 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

SIMD strlen() 实现与 x86 - 64 架构特性解析

1. SIMD strlen() 实现

在 C/C++ 代码中，可以通过特殊宏插入 SIMD 指令。对于 MSVC，部分宏位于 intrin.h 文件中。利用 SIMD 指令实现的 strlen() 函数，其运行速度比普通实现快 2 - 2.5 倍。以下是具体实现代码：

size_t strlen_sse2(const char *str)
{
    register size_t len = 0;
    const char *s = str;
    bool str_is_aligned = (((unsigned int)str) & 0xFFFFFFF0) == (unsigned int)str;
    if (str_is_aligned == false)
        return strlen(str);
    __m128i xmm0 = _mm_setzero_si128();
    __m128i xmm1;
    int mask = 0;
    for (;;)
    {
        xmm1 = _mm_load_si128((__m128i *)s);
        xmm1 = _mm_cmpeq_epi8(xmm1, xmm0);
        if ((mask = _mm_movemask_epi8(xmm1)) != 0)
        {
            unsigned long pos;
            _BitScanF