Linux线程互斥与同步—互斥锁（mutex）的原理及其实现机制

发布时间：2022-10-30 13:31:00 所属栏目：Linux 来源：未知

导读： 一段代码引发的问题
首先，我们来编写一段代码，它的目的是定义一个全局变量，创建两个线程对其进行5000++的操作。

运行结果如下：

当然，目前来看，这段程序并没有任何的问题。
然而，对

一段代码引发的问题

首先，我们来编写一段代码，它的目的是定义一个全局变量，创建两个线程对其进行5000++的操作。

linux 进程与线程_linux线程与进程_linux 线程

运行结果如下：

当然，目前来看，这段程序并没有任何的问题。

然而，对于此程序，结合线程的特点，我们需要明确两点：

我们知道，只要是共享的资源，那么它就可以看作临界资源，而临界资源的访问需要同步与互斥机制才能维持正常访问。否则可能会出现数据不一致的问题。

下面，我们来讨论一种情况：

假设上边的程序中，线程1先运行。它在物理内存中读到gcount=0后被切换出去（保存上下文信息）。当线程1重新换回来时，还认为gcount是0，因为它不会再从物理内存中读取。

而此时，线程2开始运行，它在物理内存中也读到gcount=0然后将gcount加到5000，接着又被切换出去。

然后线程1再接着运行linux 线程，将gcount加到1。又被切换了出去。

最后，线程2再运行时也不会再从物理内存中读取gcount的值，它从上下文信息中得知gcount的值为1。

这样问题就出现了，本来线程2已经将gcount加到了5000，现在它又从5000变成了1。如此下去，gcount的值就是不确定的。

为什么会出现这样的问题呢？

这是因为对gcount计数器的操作是非原子性的，所以导致了数据不一致的问题。

多个线程同时访问共享数据时可能会冲突。

比如上边的两个线程都要把全局变量增加1,这个操作在某平台需要三条指令完成:

从内存读变量值到寄存器寄存器的值加1将寄存器的值写回内存

假设两个线程在多处理器平台上同时执行这三条指令,则可能导致最后变量只加了一次而非两次。

那为什么上边的程序结果无误呢？

其实如果是以前的电脑，可能会出错。然而现在的计算机计算速度太快了，线程之间的干扰不够严重。

为了证明确实会出现这种数据不一致的问题，我们对程序进行改造，加大线程之间的干扰力度。

如何加大线程之间的干扰力度呢？有一种比较重要且容易实现的手段：触发线程间切换

知识科普

内核态：操作系统的模式，如果用户或某程序进入了内核态，那么它的权限就会不受约束，可以做任何事。操作系统向外提供系统调用接口方便进行用户态到内核态的转变。

用户态：一般用户的模式，用户或某程序在此状态下只能调用用户代码，权限受约束。当用户想调用系统接口，执行内核代码，就要从用户态变成内核态。

触发线程间切换：在线程执行函数代码中多次进行系统调用，使其不断地从用户态到内核态。这样多个线程之间就会相互干扰。

科普结束。。。

让我们回到问题中，其实上边的程序代码中有一个系统调用：printf

但它调用的次数不够，而且代码也不够复杂，所以对代码进行改造，在“读取全局变量gCount的值”和“把变量的新值保存回去”这两步操作之间插入一个printf调用。它会执行write系统调用进内核，为内核调度别的线程执行提供了一个很好的时机。一个循环中重复上述操作几千次,就会观察到访问冲突的现象。

加入局部变量tmp，使其代替gCount进行++操作，将数据++的过程分成两部分，增加系统调用的次数。改造后的代码如下：

linux 线程_linux 进程与线程_linux线程与进程

接下来再运行程序，就会出现上述数据不一致导致的错误结果。而且多运行几次，它的结果也是不确定的。

linux线程与进程_linux 进程与线程_linux 线程

好了，折腾了半天，终于找到了问题。那么如何解决这个问题呢？

解铃还须系铃人，要解决问题，归根结底就是要解决线程之间互相干扰的问题，从而保证临界资源的原子性。

互斥锁（mutex）就是这里的解铃人。

Linux多核并行编程关键	16个核心概念带你入门
Linux后台开发必知的i	十五个好用的 Kuberne