31、X86-AVX编程：打包浮点与整数运算

最新推荐文章于 2025-11-24 13:21:31 发布

最新推荐文章于 2025-11-24 13:21:31 发布

阅读量3

点赞数

CC 4.0 BY-SA版权

分类专栏：现代X86汇编精要文章标签： X86-AVX 打包浮点运算打包整数运算

本文链接：https://blog.youkuaiyun.com/view3/article/details/155619178

现代X86汇编精要专栏收录该内容

46 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

X86-AVX编程：打包浮点与整数运算

1. 打包浮点运算

在X86 - AVX编程中，打包浮点运算具有重要地位。以一个计算矩阵列均值的程序为例，其核心目的是计算双精度浮点值矩阵中每列的算术平均值。

1.1 C++实现

以下是C++代码实现：

#include "stdafx.h"
#include <memory.h>
#include <stdlib.h>

extern "C" bool AvxPfpColMeans_(const double* x, int nrows, int ncols, double* col_means);

bool AvxPfpColMeansCpp(const double* x, int nrows, int ncols, double* col_means)
{
    // 确保nrows和ncols有效
    if ((nrows <= 0) || (ncols <= 0))
        return false;

    // 确保col_means正确对齐
    if (((uintptr_t)col_means & 0x1f) != 0)
        return false;

    // 计算列均值
    memset(col_means, 0, ncols * sizeof(double));

    for (int i = 0; i < nrows; i++)
    {
        for (int j = 0; j < ncols; j++)