内存拷贝函数
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
#include <errno.h>
#include <xmmintrin.h> // SSE Intrinsics
#define SIZE_1K 1024
#define SIZE_1M (1024 * 1024)
void* aligned_malloc(size_t size) {
void* ptr = _mm_malloc(size, 16);
if (!ptr) perror("aligned_malloc failed");
return ptr;
}
void* simd_memcpy(void* dest, const void* src, size_t size