c++并发和多线程_c++ 多线程真正并行-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_33060405/article/details/144278620

C++11 及以后的版本在并发和多线程编程方面提供了强大的支持，使得开发者能够更有效地利用多核处理器，提高程序的性能。以下是对 C++ 标准库中线程支持和并行算法的详细介绍。

1. C++ 标准库中的线程支持

C++11 引入了一系列用于多线程编程的工具和类，主要包括：

1.1 std::thread

std::thread 是 C++11 中引入的一个类，用于创建和管理线程。开发者可以通过 std::thread 创建新的线程并执行指定的函数。

示例：使用 std::thread 创建线程

#include <iostream>
#include <thread>

void printMessage(const std::string& message) {
    std::cout << message << std::endl;
}

int main() {
    std::thread t1(printMessage, "Hello from thread 1!");
    std::thread t2(printMessage, "Hello from thread 2!");

    t1.join(); // 等待线程 t1 完成
    t2.join(); // 等待线程 t2 完成

    return 0;
}

在这个例子中，两个线程被创建并执行 printMessage 函数。join() 方法用于等待线程完成。

1.2

std::mutex 是 C++11 标准库中引入的一个互斥量（mutex），用于在多线程环境中保护共享资源，防止数据竞争和不一致性。数据竞争发生在多个线程同时访问同一共享资源，并且至少有一个线程在修改该资源时。使用 std::mutex 可以确保在同一时刻只有一个线程能够访问共享资源，从而保证数据的安全性和一致性。

1. 基本概念

互斥量（Mutex）：互斥量是一种同步原语，用于控制对共享资源的访问。只有获得互斥量的线程才能访问被保护的资源。
锁定（Locking）：当一个线程需要访问共享资源时，它会尝试锁定互斥量。如果互斥量已经被其他线程锁定，该线程将被阻塞，直到互斥量被释放。

2. 使用 std::mutex

使用 std::mutex 的基本步骤如下：

创建一个 std::mutex 对象。
在访问共享资源之前，调用 lock() 方法锁定互斥量。
访问共享资源。
调用 unlock() 方法释放互斥量。

3. 示例代码

以下是一个使用 std::mutex 的简单示例，演示如何保护共享资源：

#include <iostream>
#include <thread>
#include <mutex>

std::mutex mtx; // 定义一个互斥量
int sharedCounter = 0; // 共享资源

void incrementCounter() {
    for (int i = 0; i < 1000; ++i) {
        mtx.lock(); // 锁定互斥量
        ++sharedCounter; // 访问共享资源
        mtx.unlock(); // 释放互斥量
    }
}

int main() {
    std::thread t1(incrementCounter);
    std::thread t2(incrementCounter);

    t1.join(); // 等待线程 t1 完成
    t2.join(); // 等待线程 t2 完成

    std::cout << "Final counter value: " << sharedCounter << std::endl; // 输出 2000

    return 0;
}

为了简化互斥量的管理，C++11 还提供了 std::lock_guard 类。std::lock_guard 是一个 RAII（资源获取即初始化）风格的类，它在构造时自动锁定互斥量，并在析构时自动释放互斥量。这可以有效地避免因异常或提前返回而导致的死锁问题。

使用 std::lock_guard 的示例：

#include <iostream>
#include <thread>
#include <mutex>

std::mutex mtx; // 定义一个互斥量
int sharedCounter = 0; // 共享资源

void incrementCounter() {
    for (int i = 0; i < 1000; ++i) {
        std::lock_guard<std::mutex> lock(mtx); // 自动锁定互斥量
        ++sharedCounter; // 访问共享资源
        // lock_guard 在离开作用域时自动释放互斥量
    }
}

int main() {
    std::thread t1(incrementCounter);
    std::thread t2(incrementCounter);

    t1.join(); // 等待线程 t1 完成
    t2.join(); // 等待线程 t2 完成

    std::cout << "Final counter value: " << sharedCounter << std::endl; // 输出 2000

    return 0;
}

4. 注意事项

死锁：在使用互斥量时，必须小心死锁的发生。死锁通常发生在两个或多个线程相互等待对方释放锁的情况下。为了避免死锁，建议遵循一致的锁定顺序。
性能：频繁地锁定和解锁互斥量可能会影响性能。在设计多线程程序时，尽量减少锁的持有时间，或者考虑使用其他同步机制（如读写锁、条件变量等）来提高性能。

1.3 std::atomic

std::atomic 提供了一种无锁的方式来访问共享数据，确保在多线程环境中对变量的原子操作。它可以用于基本数据类型，如整数和布尔值。

示例：使用 std::atomic

#include <iostream>
#include <thread>
#include <atomic>

std::atomic<int> atomicCounter(0);

void incrementCounter() {
    for (int i = 0; i < 1000; ++i) {
        ++atomicCounter; // 原子操作
    }
}

int main() {
    std::thread t1(incrementCounter);
    std::thread t2(incrementCounter);

    t1.join();
    t2.join();

    std::cout << "Final atomic counter value: " << atomicCounter.load() << std::endl; // 输出 2000

    return 0;
}

在这个例子中，std::atomic 确保对 atomicCounter 的增量操作是原子的，避免了数据竞争。

2. 并行算法

C++17 引入了并行算法库，允许开发者在标准库算法中使用并行执行策略，从而提高性能。通过使用并行算法，开发者可以轻松地将算法应用于多核处理器。

2.1 并行执行策略

C++17 提供了几种并行执行策略，包括：

std::execution::seq：顺序执行。
std::execution::par：并行执行。
std::execution::par_unseq：并行和向量化执行。

示例：使用并行算法

#include <iostream>
#include <vector>
#include <algorithm>
#include <execution>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};

    // 使用并行算法对向量中的元素进行平方
    std::for_each(std::execution::par, vec.begin(), vec.end(), [](int& n) {
        n *= n;
    });

    // 输出结果
    for (const auto& n : vec) {
        std::cout << n << " ";
    }
    std::cout << std::endl;

    return 0;
}

在这个例子中，std::for_each 使用 std::execution::par 执行策略对向量中的每个元素进行平方操作，利用多核处理器并行处理。

总结

C++11 及以后的版本通过引入 std::thread、std::mutex、std::atomic 等类，提供了强大的多线程支持，使得开发者能够有效地利用多核处理器，提高程序性能。此外，C++17 引入的并行算法库进一步简化了并行编程，使得开发者可以轻松地在标准库算法中使用并行执行策略，从而提升性能。通过合理使用这些特性，开发者可以编写出高效、可扩展的并发程序。

c++中原子操作有哪些

在 C++ 中，原子操作是指在多线程环境中可以安全地进行的操作，这些操作不会被其他线程中断。C++11 引入了原子类型和操作，以支持无锁编程，确保在多线程环境中对共享数据的安全访问。原子操作通常用于实现高效的同步机制，避免使用互斥量（std::mutex）带来的性能开销。

1. 原子类型

C++11 提供了 std::atomic 模板类，支持多种基本数据类型的原子操作。以下是一些常用的原子类型：

std::atomic<bool>：原子布尔类型。
std::atomic<int>：原子整数类型。
std::atomic<unsigned int>：原子无符号整数类型。
std::atomic<long>：原子长整型。
std::atomic<float>：原子浮点类型。
std::atomic<double>：原子双精度浮点类型。
std::atomic<T*>：原子指针类型。

2. 原子操作

std::atomic 提供了一系列原子操作，包括：

加载和存储：
- load()：原子读取值。
- store(value)：原子写入值。
算术操作：
- fetch_add(value)：原子加法，返回操作前的值。
- fetch_sub(value)：原子减法，返回操作前的值。
- ++ 和 --：原子自增和自减操作。
比较和交换：
- compare_exchange_strong(expected, desired)：比较并交换，如果当前值等于 expected，则将其替换为 desired，并返回操作前的值。
- compare_exchange_weak(expected, desired)：与 compare_exchange_strong 类似，但可能会失败并重试，适用于高竞争场景。
位操作：
- fetch_or(value)：原子按位或操作。
- fetch_and(value)：原子按位与操作。
- fetch_xor(value)：原子按位异或操作。

3. 示例代码

以下是一个使用 std::atomic 的简单示例，演示如何进行原子操作：

#include <iostream>
#include <thread>
#include <atomic>

std::atomic<int> atomicCounter(0); // 原子计数器

void incrementCounter() {
    for (int i = 0; i < 1000; ++i) {
        atomicCounter.fetch_add(1); // 原子加法
    }
}

int main() {
    std::thread t1(incrementCounter);
    std::thread t2(incrementCounter);

    t1.join();
    t2.join();

    std::cout << "Final atomic counter value: " << atomicCounter.load() << std::endl; // 输出 2000

    return 0;
}

4. 注意事项

内存序：原子操作的内存序（memory order）可以通过 std::memory_order 枚举来控制。默认情况下，原子操作使用 memory_order_seq_cst（顺序一致性），但可以根据需要选择其他内存序，如 memory_order_relaxed、memory_order_acquire、memory_order_release 等，以优化性能。
性能：原子操作通常比使用互斥量更高效，但在高竞争场景下，频繁的原子操作可能会导致性能下降。因此，在设计多线程程序时，需根据具体情况选择合适的同步机制。

总结

C++ 中的原子操作通过 std::atomic 提供了一种安全、高效的方式来处理多线程环境中的共享数据。通过使用原子类型和操作，开发者可以避免数据竞争，提高程序的性能和可靠性。

并行算法

std::execution::par 是 C++17 标准库中定义的一个 枚举值，而不是类或对象。它是 std::execution 命名空间中的一个常量，用于表示并行执行策略。

详细说明

在 C++17 中，执行策略被引入以支持并行和并发算法。std::execution 命名空间中定义了几种执行策略，包括：

std::execution::seq：顺序执行策略。
std::execution::par：并行执行策略。
std::execution::par_unseq：并行和向量化执行策略。

这些执行策略可以作为参数传递给标准库算法，以指定算法的执行方式。例如，使用 std::execution::par 可以让算法在多线程环境中并行执行，从而提高性能。

示例

以下是一个使用 std::execution::par 的示例，演示如何在并行执行策略下使用标准库算法：

#include <iostream>
#include <vector>
#include <algorithm>
#include <execution>

int main() {
    std::vector<int> data = {5, 3, 8, 1, 2, 7, 4, 6};

    // 使用并行执行策略对数据进行排序
    std::sort(std::execution::par, data.begin(), data.end());

    // 输出排序后的结果
    for (const auto& num : data) {
        std::cout << num << " ";
    }
    std::cout << std::endl;

    return 0;
}

在这个示例中，std::execution::par 被用作 std::sort 函数的第一个参数，指示该算法应在并行模式下执行。

总结

std::execution::par 是一个枚举值，表示并行执行策略。
它用于指定标准库算法的执行方式，以便在多线程环境中并行执行。

C++17 引入的并行算法库为开发者提供了强大的工具，以便在多核处理器上高效地执行标准库算法。通过使用并行执行策略，开发者可以轻松地将算法应用于大规模数据集，从而显著提高性能。以下是对并行执行策略的详细介绍。

2.1 并行执行策略

C++17 提供了三种主要的并行执行策略：

std::execution::seq：
- 描述：顺序执行策略，表示算法将按照顺序执行，适用于不需要并行化的情况。
- 使用场景：当数据量较小或算法本身不适合并行化时，使用顺序执行可以避免并行化带来的开销。
```
#include <vector>
#include <algorithm>
#include <execution>

std::vector<int> data = {5, 3, 8, 1, 2, 7, 4, 6};
std::sort(std::execution::seq, data.begin(), data.end()); // 顺序排序
```
std::execution::par：
- 描述：并行执行策略，表示算法可以在多个线程中并行执行。适用于可以被分割成独立任务的算法。
- 使用场景：当处理大规模数据时，使用并行执行可以显著提高性能，尤其是在多核处理器上。
```
#include <vector>
#include <algorithm>
#include <execution>

std::vector<int> data = {5, 3, 8, 1, 2, 7, 4, 6};
std::sort(std::execution::par, data.begin(), data.end()); // 并行排序
```
std::execution::par_unseq：
- 描述：并行和向量化执行策略，表示算法可以在多个线程中并行执行，并且可以利用 SIMD（单指令多数据）指令进行向量化处理。
- 使用场景：适用于可以并行化并且可以通过向量化进一步提高性能的算法，尤其是在处理大规模数据时。
```
#include <vector>
#include <algorithm>
#include <execution>

std::vector<int> data = {5, 3, 8, 1, 2, 7, 4, 6};
std::sort(std::execution::par_unseq, data.begin(), data.end()); // 并行和向量化排序
```

2.2 使用并行算法的优势

性能提升：通过利用多核处理器的能力，开发者可以显著提高算法的执行速度，尤其是在处理大规模数据时。
简化代码：使用并行执行策略，开发者可以在不需要手动管理线程的情况下，轻松实现并行化。
可移植性：C++标准库的并行算法在不同的编译器和平台上具有良好的可移植性，开发者可以在多种环境中使用相同的代码。

2.3 注意事项

数据竞争：在并行执行中，必须小心处理数据竞争和同步问题。确保在并行执行时不会出现数据竞争是非常重要的。
任务粒度：选择合适的任务粒度非常重要。过小的任务可能导致线程管理开销过大，而过大的任务可能导致负载不均。
性能评估：在使用并行算法时，建议进行性能评估，以确保并行化带来的性能提升超过了其开销。

总结

C++17 的并行算法库通过引入并行执行策略，使得开发者能够轻松地在标准库算法中实现并行化。这些策略包括顺序执行、并行执行和并行与向量化执行，适用于不同的场景和需求。通过合理使用这些策略，开发者可以显著提高程序的性能。

并行执行案例分析

std::execution::par 是 C++17 标准库中引入的并行执行策略，允许开发者在使用标准库算法时指定并行执行。虽然 C++ 标准库并没有提供 std::execution::par 的具体实现细节，但我们可以讨论其可能的底层实现原理和设计思路。

1. 执行策略的概念

执行策略是 C++ 标准库算法的一种扩展，允许用户指定算法的执行方式。std::execution::par 表示算法可以并行执行，通常会利用多线程来加速计算。

2. 可能的底层实现原理

2.1 任务划分

在并行执行策略下，算法会将输入数据划分为多个任务。任务划分的策略可能包括：

静态划分：在算法开始时，将数据划分为固定大小的块，每个线程处理一个块。这种方法简单，但在数据量不均匀时可能导致负载不均。
动态划分：在算法执行过程中，根据线程的空闲情况动态分配任务。这种方法可以更好地平衡负载，但实现复杂度较高。

2.2 线程管理

并行执行通常会使用线程池来管理线程的创建和销毁。线程池的实现可能包括：

预创建线程：在程序启动时创建一定数量的线程，避免在每次任务执行时创建和销毁线程的开销。
任务队列：使用一个任务队列来存储待执行的任务，线程从队列中获取任务并执行。

2.3 任务调度

任务调度是并行执行的关键部分。调度器负责将划分好的任务分配给可用的线程。调度策略可以是：

FIFO（先进先出）：任务按照到达的顺序执行。
优先级调度：根据任务的优先级分配执行顺序。

2.4 同步与数据竞争

在并行执行中，必须小心处理数据竞争和同步问题。标准库算法在设计时会考虑到这些问题，确保在并行执行时不会出现数据竞争。例如，某些算法会使用内部的锁或原子操作来保护共享数据。

3. 示例实现

虽然 C++ 标准库的具体实现可能因库的不同而异，以下是一个简化的示例，展示如何使用线程池和任务划分来实现一个简单的并行算法：

#include <iostream>
#include <vector>
#include <thread>
#include <future>
#include <algorithm>

template<typename Iterator, typename T>
void parallel_sort(Iterator begin, Iterator end) {
    auto length = std::distance(begin, end);
    if (length < 1000) { // 小数据量使用顺序排序
        std::sort(begin, end);
        return;
    }

    // 划分任务
    auto mid = begin + length / 2;

    // 创建两个异步任务
    auto handle1 = std::async(std::launch::async, parallel_sort<Iterator, T>, begin, mid);
    auto handle2 = std::async(std::launch::async, parallel_sort<Iterator, T>, mid, end);

    // 等待任务完成
    handle1.get();
    handle2.get();

    // 合并结果
    std::inplace_merge(begin, mid, end);
}

int main() {
    std::vector<int> data = {5, 3, 8, 1, 2, 7, 4, 6};

    parallel_sort<std::vector<int>::iterator, int>(data.begin(), data.end());

    for (const auto& num : data) {
        std::cout << num << " ";
    }
    std::cout << std::endl;

    return 0;
}

4. 性能考虑

加速比：并行执行的性能提升取决于多个因素，包括任务的粒度、数据的大小、硬件的核心数等。对于小规模的数据，使用并行执行可能会引入额外的开销，导致性能下降。
负载均衡：在任务划分时，确保负载均衡是非常重要的。如果某些线程的任务过重而其他线程的任务过轻，可能会导致性能瓶颈。
内存访问：并行算法的性能也受到内存访问模式的影响。尽量减少共享数据的访问和修改，可以提高并行执行的效率。