简单聊聊C++中线程的原理与实现

C/C++
254
0
0
2023-09-11

在C++中有多种实现线程的方式

  • C++11提供的标准多线程方式;
  • 第三方库(如:Boost.Thread);
  • 操作系统提供的多线程(如:Windows 线程 与 POSIX 线程(pthread))。

我们这里先了解的就是C++11提供的标准多线程方式。因为它提供了良好的跨平台兼容性和简洁的语法,已经满足大多数需求。

从最简单的开始

C++11 引入了多线程支持,提供了一套基本的线程库,包括线程、互斥量(mutex)、条件变量(condition_variable)等。这些组件可以帮助你在 C++ 程序中实现并发和多线程编程。下面是一些基本概念和示例:

1.std::thread:

std::thread 是 C++11 中的线程类,用于创建和管理线程。您可以将一个函数作为参数传递给 std::thread 的构造函数,该函数将在新线程中执行。

#include <iostream>
#include <thread>

void hello() {
    std::cout << "Hello from thread!" << std::endl;
}

int main() {
    std::thread t(hello); // 创建一个新线程,执行 hello 函数
    t.join(); // 等待线程结束
    return;
}

2.std::mutex:

std::mutex 是互斥量类,用于保护共享资源的访问。当多个线程需要访问共享资源时,使用互斥量可以确保每次只有一个线程访问资源,从而避免数据竞争和其他并发问题。

#include <iostream>
#include <mutex>
#include <thread>

std::mutex mtx; // 互斥量

void print_block(int n, char c) {
    mtx.lock(); // 锁定互斥量
    for (int i =; i < n; ++i) {
        std::cout << c;
    }
    std::cout << std::endl;
    mtx.unlock(); // 解锁互斥量
}

int main() {
    std::thread t(print_block, 50, '*');
    std::thread t(print_block, 50, '$');
    t.join();
    t.join();
    return;
}

3.std::lock_guard:

std::lock_guard 是一个 RAII(Resource Acquisition Is Initialization)包装类,用于自动管理互斥量的锁定和解锁。当创建 std::lock_guard 对象时,它将自动锁定互斥量,当对象销毁时,它将自动解锁互斥量。

void print_block(int n, char c) {
    std::lock_guard<std::mutex> lock(mtx); // 自动锁定互斥量
    for (int i =; i < n; ++i) {
        std::cout << c;
    }
    std::cout << std::endl;
    // 自动解锁互斥量(lock_guard 对象销毁时)
}

4.std::condition_variable:

std::condition_variable 是一个条件变量类,用于在线程之间同步操作。它可以与 std::mutex 配合使用,实现线程间的等待和通知机制。

#include <iostream>
#include <condition_variable>
#include <mutex>
#include <thread>

std::mutex mtx;
std::condition_variable cv;
bool ready = false;

void print_id(int id) {
    std::unique_lock<std::mutex> lck(mtx); 
    cv.wait(lck, [] { return ready; }); // 等待 ready 变为 true 
    std::cout << "thread " << id << std::endl; 
} 

void go() { 
    std::unique_lock<std::mutex> lck(mtx);
    ready = true; 
    cv.notify_all();// 通知所有等待的线程 
}

int main() {
    std::thread threads[];
    for (int i =; i < 10; ++i) {
        threads[i] = std::thread(print_id, i); // 启动 个线程 
    }
    
    go(); // 通知所有线程开始执行

    for (auto& th : threads) {
        th.join(); 
    }
    return;
}

在这个示例中,我们创建了 10 个线程,每个线程在启动后等待一个条件变量。主线程通过调用 go 函数将条件变量的状态设置为 true 并通知所有等待的线程,使它们开始执行。

5.std::future 和 std::async:

std::future 和 std::async 是 C++11 提供的用于异步操作的类。std::async 可以异步地执行一个函数,并返回一个 std::future 对象,该对象表示该函数的返回值。您可以通过调用 std::future::get() 来等待函数执行完成并获取其返回值。

#include <iostream>
#include <future>

int sum(int a, int b) {
    return a + b;
}

int main() {
    std::future<int> result = std::async(sum,, 20); // 异步执行 sum 函数
    int value = result.get(); // 等待执行完成并获取返回值
    std::cout << "The result is: " << value << std::endl;
    return;
}

这个简单的示例展示了如何使用 std::async 异步地执行一个求和函数,然后通过std::future 获取其结果。

C++11 的多线程支持功能使得在 C++ 中实现并发编程变得更加简单。通过这些基本组件,您可以根据需要构建更复杂的并发程序。

C++11的线程只有这么简单吗?

是也不是。C++11 中的多线程库确实相对简单,但这只是表面现象。实际上,它们为复杂的多线程程序提供了基础。前面已经介绍了一些基本的多线程组件,例如 std::thread、std::mutex、std::condition_variable、std::future 和 std::async。但是,还有一些其他的组件和技巧可能会对你有帮助:

1.std::atomic:

C++11 引入了原子类型(std::atomic),用于实现原子操作,即在多线程环境中不会被中断的操作。原子类型在多线程中特别有用,因为它们可以避免数据竞争和其他并发问题。

示例:

#include <iostream>
#include <atomic>
#include <thread>

std::atomic<int> counter();

void increase_counter() {
    for (int i =; i < 1000; ++i) {
        ++counter;
    }
}

int main() {
    std::thread t(increase_counter);
    std::thread t(increase_counter);

    t.join();
    t.join();

    std::cout << "Counter: " << counter << std::endl;
    return;
}

2.std::call_once:

std::call_once 是一个用于确保在多线程环境中某个函数只被调用一次的工具。它需要一个 std::once_flag 变量作为参数,该变量用于跟踪函数是否已被调用。

示例:

#include <iostream>
#include <mutex>
#include <thread>

std::once_flag flag;

void do_something() {
    std::cout << "Called once" << std::endl;
}

void call_do_something() {
    std::call_once(flag, do_something);
}

int main() {
    std::thread t(call_do_something);
    std::thread t(call_do_something);

    t.join();
    t.join();

    return;
}

3.线程局部存储:

C++11 支持线程局部存储,即每个线程拥有自己的变量副本。使用 thread_local 关键字可以定义一个线程局部变量。这对于某些需要每个线程拥有独立状态的应用场景非常有用。

示例:

#include <iostream>
#include <thread>

thread_local int counter =;

void increase_counter() {
    ++counter;
    std::cout << "Counter: " << counter << " in thread " << std::this_thread::get_id() << std::endl;
}

int main() {
    std::thread t(increase_counter);
    std::thread t(increase_counter);

    t.join();
    t.join();

    return;
}

以上是 C++11 多线程库中的一些其他组件和技巧。虽然这些组件相对简单,但它们为实现复杂的多线程应用提供了基础。掌握这些基本概念后,你可以根据自己的需求组合这些组件以实现更高级的功能。以下是一些可能对你有帮助的高级用法:

线程池

线程池是一种允许您在一组线程中重用线程以执行任务的技术。这可以减少线程创建和销毁的开销,从而提高性能。C++11 没有提供内置的线程池功能,但您可以使用基本的多线程组件自己实现一个,或者使用第三方库(例如 Boost.Asio)。

并行算法

C++17 标准引入了并行算法库,它提供了一些与 STL 算法类似的并行版本,以支持多线程并行执行。这使得实现并行计算变得更加简单。例如,您可以使用 std::sort 的并行版本 std::execution::par 对大数据集进行排序。

示例:

#include <iostream>
#include <vector>
#include <algorithm>
#include <execution>
#include <random>

int main() {
    std::vector<int> data();
    std::random_device rd;
    std::mt gen(rd());

    std::generate(data.begin(), data.end(), [&]() { return gen() %; });

    std::sort(std::execution::par, data.begin(), data.end());

    // 现在 data 已经被排序
    return;
}

lock_guard 和 scoped_lock:

std::lock_guard 是一个简化互斥锁管理的 RAII 封装。当您创建一个 lock_guard 对象时,它将自动锁定给定的互斥锁,并在销毁时自动解锁。这有助于避免死锁和忘记解锁。

std::scoped_lock 是 C++17 引入的一个改进版的 lock_guard,用于同时锁定多个互斥锁,避免死锁。

std::shared_mutex 和 std::shared_lock:

std::shared_mutex 是一种特殊类型的互斥锁,允许多个线程同时以共享模式访问资源。std::shared_lock 是与 std::shared_mutex 配合使用的锁对象,允许您在共享模式或独占模式下锁定资源。

以上是 C++11 多线程库的一些高级用法。熟练掌握这些组件和技巧可以帮助您实现更加高效、可扩展和健壮的多线程应用。

大体其实就这些,另外在设计时还需要注意的是:

避免死锁:

在多线程编程中,死锁是一个常见的问题,它发生在两个或多个线程相互等待对方释放资源时。为了避免死锁,请确保使用锁的顺序一致,避免嵌套锁,并尽量减少锁的使用范围。

数据竞争与内存模型:

在多线程环境中,数据竞争是一个潜在的问题。当多个线程同时访问共享数据且至少有一个线程对数据进行修改时,就会发生数据竞争。避免数据竞争的方法包括使用互斥锁、原子操作或者线程局部存储。

此外,C++11 引入了内存模型,用于描述多线程中的内存访问行为。内存模型包括原子操作的内存顺序,例如 std::memory_order_relaxed、std::memory_order_acquire 和 std::memory_order_release。在大多数情况下,默认的内存顺序已经足够使用,但在某些高级应用场景下,理解和使用内存模型可以帮助您实现更高效的代码。

性能与可伸缩性:

在编写多线程程序时,需要权衡性能和可伸缩性。线程之间的通信和同步会导致性能损失,因此您需要在使用更多线程以提高并发性能时,尽量减少同步和通信的开销。

异常安全:

在多线程环境中,处理异常尤为重要。在一个线程中发生异常时,其他线程可能仍在继续执行。确保在多线程中正确处理异常,例如使用 try-catch 块捕获异常,并确保锁和资源在异常发生时得到正确的释放。

第三方库和框架:

除了 C++ 标准库提供的多线程支持外,还有一些第三方库和框架提供了更高级或特定领域的多线程功能。例如,Boost.Thread 库提供了类似于 C++11 多线程库的功能,但在某些方面更为强大。Intel 的 Threading Building Blocks (TBB) 是另一个广泛使用的并行编程库。

P.S. 再来点与之无关紧要的小知识

join()既然是等待子线程完成,为什么不叫wait_thread()之类的? 而且join本身的单词是加入,有点感觉格格不入。

因为在多线程编程中,join 方法的命名来源于它的作用:将一个子线程加入(join)到主线程或其他线程,等待这个子线程完成。这种“加入”的概念实际上是指当前线程(通常是主线程)等待另一个线程(子线程)完成它的任务。在子线程完成任务之前,当前线程会阻塞等待。因此,join 这个名字来源于将子线程与等待它的线程连接在一起的过程。简单来说,当在疯狂星期四这天的公司楼下KFC里,在你排队买快乐时,有你的领导插队(join进来),你必须等它完成的,所以这也就是等待的本意。

wait()

std::condition_variable::wait() 是一个成员函数,用于阻塞当前线程,直到条件变量被通知。wait() 函数通常与 std::unique_lock<std::mutex> 和 std::mutex 配合使用,以便在等待期间自动解锁互斥量。可以传递一个谓词函数给 wait(),以便在条件变量被通知后检查是否满足继续执行的条件。

notify_all()与notify_one

std::condition_variable::notify_all() 是一个成员函数,用于唤醒所有等待当前条件变量的线程。当某个条件满足时,可以调用 notify_all() 通知所有等待的线程继续执行。这是一种线程之间协作的方式。

std::condition_variable::notify_one() 也是一个成员函数,用于唤醒一个正在等待该条件变量的线程。与之相对的,notify_all 是唤醒所有正在等待该条件变量的线程。在某些情况下,您可能只需要唤醒一个等待的线程,而不是所有线程,这时候就可以使用 notify_one。

再聊聊第三方库(如:Boost.Thread)方式

#include <iostream>
#include <boost/thread.hpp>

void print_hello() {
    std::cout << "Hello from thread!" << std::endl;
}

int main() {
    boost::thread thread(print_hello);
    thread.join();

    std::cout << "Hello from main!" << std::endl;
    return;
}

最后的战役:操作系统方式

1.POSIX 线程(pthread):

POSIX 线程是基于 POSIX 标准的一种多线程实现,它在类 Unix 系统(如 Linux、macOS)中广泛使用。pthread 库提供了用于创建线程、同步、互斥锁等多线程功能的函数。然而,由于它是用 C 语言编写的,所以在 C++ 中使用时可能不够直观。以下是一个简单的使用 POSIX 线程的例子:

#include <iostream>
#include <pthread.h>

void* print_hello(void* arg) {
    std::cout << "Hello from thread!" << std::endl;
    return nullptr;
}

int main() {
    pthread_t thread;
    pthread_create(&thread, nullptr, print_hello, nullptr);
    pthread_join(thread, nullptr);

    std::cout << "Hello from main!" << std::endl;
    return;
}

2.Windows 线程:

在 Windows 操作系统中,可以通过 Windows API 来创建和管理线程。Windows API 提供了一组用于线程管理、同步和互斥的函数。以下是一个简单的使用 Windows 线程的例子:

#include <iostream>
#include <windows.h>

DWORD WINAPI print_hello(LPVOID lpParam) {
    std::cout << "Hello from thread!" << std::endl;
    return;
}

int main() {
    HANDLE thread = CreateThread(nullptr,, print_hello, nullptr, 0, nullptr);
    WaitForSingleObject(thread, INFINITE);
    CloseHandle(thread);

    std::cout << "Hello from main!" << std::endl;
    return;
}

由于这不是我们的重点战场,简单了解一下就完事,当你必须使用它时这个文章就没必要看了。