Linux进程间通信与线程间同步详解(全面详细)

引用:http://community.csdn.net/Expert/TopicView3.asp?id=4374496
linux下进程间通信的几种主要手段简介:

1. 管道(Pipe)及有名管道(named pipe):管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信;
   2. 信号(Signal):信号是比较复杂的通信方式,用于通知接受进程有某种事件发生,除了用于进程间通信外,进程还可以发送信号给进程本身;linux除了支持Unix早期信号语义函数sigal外,还支持语义符合Posix.1标准的信号函数 sigaction(实际上,该函数是基于BSD的,BSD为了实现可靠信号机制,又能够统一对外接口,用sigaction函数重新实现了signal 函数);
   3. 报文(Message)队列(消息队列):消息队列是消息的链接表,包括Posix消息队列system V消息队列。有足够权限的进程可以向队列中添加消息,被赋予读权限的进程则可以读走队列中的消息。消息队列克服了信号承载信息量少,管道只能承载无格式字节流以及缓冲区大小受限等缺点。
   4. 共享内存:使得多个进程可以访问同一块内存空间,是最快的可用IPC形式。是针对其他通信机制运行效率较低而设计的。往往与其它通信机制,如信号量结合使用,来达到进程间的同步及互斥。
   5. 信号量(semaphore):主要作为进程间以及同一进程不同线程之间的同步手段。
   6. 套接口(Socket):更为一般的进程间通信机制,可用于不同机器之间的进程间通信。起初是由Unix系统的BSD分支开发出来的,但现在一般可以移植到其它类Unix系统上:Linux和System V的变种都支持套接字。

 
 
 
 
 
线程的最大特点是资源的共享性,但资源共享中的同步问题是多线程编程的难点。linux下提供了多种方式来处理线程同步,最常用的是互斥锁、条件变量和信号量。

1)互斥锁(mutex)

通过锁机制实现线程间的同步。同一时刻只允许一个线程执行一个关键部分的代码。

int pthread_mutex_init(pthread_mutex_t *mutex,const pthread_mutex_attr_t *mutexattr);

int pthread_mutex_lock(pthread_mutex *mutex);

int pthread_mutex_destroy(pthread_mutex *mutex);

int pthread_mutex_unlock(pthread_mutex *

(1)先初始化锁init()或静态赋值pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIER

attr_t有:

PTHREAD_MUTEX_TIMED_NP:其余线程等待队列

PTHREAD_MUTEX_RECURSIVE_NP:嵌套锁,允许线程多次加锁,不同线程,解锁后重新竞争

PTHREAD_MUTEX_ERRORCHECK_NP:检错,与一同,线程请求已用锁,返回EDEADLK;

PTHREAD_MUTEX_ADAPTIVE_NP:适应锁,解锁后重新竞争

(2)加锁,lock,trylock,lock阻塞等待锁,trylock立即返回EBUSY

(3)解锁,unlock需满足是加锁状态,且由加锁线程解锁

(4)清除锁,destroy(此时锁必需unlock,否则返回EBUSY,//Linux下互斥锁不占用内存资源

示例代码

  1. #include <cstdio>
  2. #include <cstdlib>
  3. #include <unistd.h>
  4. #include <pthread.h>
  5. #include "iostream"
  6. using namespace std;
  7. pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
  8. int tmp;
  9. void* thread(void *arg)
  10. {
  11. cout << "thread id is " << pthread_self() << endl;
  12. pthread_mutex_lock(&mutex);
  13. tmp = 12;
  14. cout << "Now a is " << tmp << endl;
  15. pthread_mutex_unlock(&mutex);
  16. return NULL;
  17. }
  18. int main()
  19. {
  20. pthread_t id;
  21. cout << "main thread id is " << pthread_self() << endl;
  22. tmp = 3;
  23. cout << "In main func tmp = " << tmp << endl;
  24. if (!pthread_create(&id, NULL, thread, NULL))
  25. {
  26. cout << "Create thread success!" << endl;
  27. }
  28. else
  29. {
  30. cout << "Create thread failed!" << endl;
  31. }
  32. pthread_join(id, NULL);
  33. pthread_mutex_destroy(&mutex);
  34. return 0;
  35. }

编译: g++ -o thread testthread.cpp -lpthread

说明:pthread库不是Linux系统默认的库,连接时需要使用静态库libpthread.a,所以在使用pthread_create()创建线程,以及调用pthread_atfork()函数建立fork处理程序时,需要链接该库。在编译中要加 -lpthread参数。

2)条件变量(cond)

利用线程间共享的全局变量进行同步的一种机制。条件变量上的基本操作有:触发条件(当条件变为 true 时);等待条件,挂起线程直到其他线程触发条件。

int pthread_cond_init(pthread_cond_t *cond,pthread_condattr_t *cond_attr);

int pthread_cond_wait(pthread_cond_t *cond,pthread_mutex_t *mutex);

int pthread_cond_timewait(pthread_cond_t *cond,pthread_mutex *mutex,const timespec *abstime);

int pthread_cond_destroy(pthread_cond_t *cond);

int pthread_cond_signal(pthread_cond_t *cond);

int pthread_cond_broadcast(pthread_cond_t *cond);  //解除所有线程的阻塞

(1)初始化.init()或者pthread_cond_t cond=PTHREAD_COND_INITIALIER(前者为动态初始化,后者为静态初始化);属性置为NULL

(2)等待条件成立.pthread_wait,pthread_timewait.wait()释放锁,并阻塞等待条件变量为真,timewait()设置等待时间,仍未signal,返回ETIMEOUT(加锁保证只有一个线程wait)

(3)激活条件变量:pthread_cond_signal,pthread_cond_broadcast(激活所有等待线程)

(4)清除条件变量:destroy;无线程等待,否则返回EBUSY

对于

int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex);

int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime);

一定要在mutex的锁定区域内使用。

如果要正确的使用pthread_mutex_lock与pthread_mutex_unlock,请参考

pthread_cleanup_push和pthread_cleanup_pop宏,它能够在线程被cancel的时候正确的释放mutex!

另外,posix1标准说,pthread_cond_signal与pthread_cond_broadcast无需考虑调用线程是否是mutex的拥有者,也就是说,可以在lock与unlock以外的区域调用。如果我们对调用行为不关心,那么请在lock区域之外调用吧。

说明:

(1)pthread_cond_wait 自动解锁互斥量(如同执行了pthread_unlock_mutex),并等待条件变量触发。这时线程挂起,不占用CPU时间,直到条件变量被触发(变量为ture)。在调用 pthread_cond_wait之前,应用程序必须加锁互斥量。pthread_cond_wait函数返回前,自动重新对互斥量加锁(如同执行了pthread_lock_mutex)。

(2)互斥量的解锁和在条件变量上挂起都是自动进行的。因此,在条件变量被触发前,如果所有的线程都要对互斥量加锁,这种机制可保证在线程加锁互斥量和进入等待条件变量期间,条件变量不被触发。条件变量要和互斥量相联结,以避免出现条件竞争——个线程预备等待一个条件变量,当它在真正进入等待之前,另一个线程恰好触发了该条件(条件满足信号有可能在测试条件和调用pthread_cond_wait函数(block)之间被发出,从而造成无限制的等待)。

(3)pthread_cond_timedwait 和 pthread_cond_wait 一样,自动解锁互斥量及等待条件变量,但它还限定了等待时间。如果在abstime指定的时间内cond未触发,互斥量mutex被重新加锁,且pthread_cond_timedwait返回错误 ETIMEDOUT。abstime 参数指定一个绝对时间,时间原点与 time 和 gettimeofday 相同:abstime = 0 表示 1970年1月1日00:00:00 GMT。

(4)pthread_cond_destroy 销毁一个条件变量,释放它拥有的资源。进入 pthread_cond_destroy 之前,必须没有在该条件变量上等待的线程。

(5)条件变量函数不是异步信号安全的,不应当在信号处理程序中进行调用。特别要注意,如果在信号处理程序中调用 pthread_cond_signal 或pthread_cond_boardcast 函数,可能导致调用线程死锁。

示例程序1

  1. #include <stdio.h>
  2. #include <pthread.h>
  3. #include "stdlib.h"
  4. #include "unistd.h"
  5. pthread_mutex_t mutex;
  6. pthread_cond_t cond;
  7. void hander(void *arg)
  8. {
  9. free(arg);
  10. (void)pthread_mutex_unlock(&mutex);
  11. }
  12. void *thread1(void *arg)
  13. {
  14. pthread_cleanup_push(hander, &mutex);
  15. while(1)
  16. {
  17. printf("thread1 is running\n");
  18. pthread_mutex_lock(&mutex);
  19. pthread_cond_wait(&cond,&mutex);
  20. printf("thread1 applied the condition\n");
  21. pthread_mutex_unlock(&mutex);
  22. sleep(4);
  23. }
  24. pthread_cleanup_pop(0);
  25. }
  26. void *thread2(void *arg)
  27. {
  28. while(1)
  29. {
  30. printf("thread2 is running\n");
  31. pthread_mutex_lock(&mutex);
  32. pthread_cond_wait(&cond,&mutex);
  33. printf("thread2 applied the condition\n");
  34. pthread_mutex_unlock(&mutex);
  35. sleep(1);
  36. }
  37. }
  38. int main()
  39. {
  40. pthread_t thid1,thid2;
  41. printf("condition variable study!\n");
  42. pthread_mutex_init(&mutex,NULL);
  43. pthread_cond_init(&cond,NULL);
  44. pthread_create(&thid1,NULL,thread1,NULL);
  45. pthread_create(&thid2,NULL,thread2,NULL);
  46. sleep(1);
  47. do
  48. {
  49. pthread_cond_signal(&cond);
  50. }while(1);
  51. sleep(20);
  52. pthread_exit(0);
  53. return 0;
  54. }

示例程序2:

  1. #include <pthread.h>
  2. #include <unistd.h>
  3. #include "stdio.h"
  4. #include "stdlib.h"
  5. static pthread_mutex_t mtx = PTHREAD_MUTEX_INITIALIZER;
  6. static pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
  7. struct node
  8. {
  9. int n_number;
  10. struct node *n_next;
  11. } *head = NULL;
  12. /*[thread_func]*/
  13. static void cleanup_handler(void *arg)
  14. {
  15. printf("Cleanup handler of second thread./n");
  16. free(arg);
  17. (void)pthread_mutex_unlock(&mtx);
  18. }
  19. static void *thread_func(void *arg)
  20. {
  21. struct node *p = NULL;
  22. pthread_cleanup_push(cleanup_handler, p);
  23. while (1)
  24. {
  25. //这个mutex主要是用来保证pthread_cond_wait的并发性
  26. pthread_mutex_lock(&mtx);
  27. while (head == NULL)
  28. {
  29. //这个while要特别说明一下,单个pthread_cond_wait功能很完善,为何
  30. //这里要有一个while (head == NULL)呢?因为pthread_cond_wait里的线
  31. //程可能会被意外唤醒,如果这个时候head != NULL,则不是我们想要的情况。
  32. //这个时候,应该让线程继续进入pthread_cond_wait
  33. // pthread_cond_wait会先解除之前的pthread_mutex_lock锁定的mtx,
  34. //然后阻塞在等待对列里休眠,直到再次被唤醒(大多数情况下是等待的条件成立
  35. //而被唤醒,唤醒后,该进程会先锁定先pthread_mutex_lock(&mtx);,再读取资源
  36. //用这个流程是比较清楚的/*block-->unlock-->wait() return-->lock*/
  37. pthread_cond_wait(&cond, &mtx);
  38. p = head;
  39. head = head->n_next;
  40. printf("Got %d from front of queue/n", p->n_number);
  41. free(p);
  42. }
  43. pthread_mutex_unlock(&mtx); //临界区数据操作完毕,释放互斥锁
  44. }
  45. pthread_cleanup_pop(0);
  46. return 0;
  47. }
  48. int main(void)
  49. {
  50. pthread_t tid;
  51. int i;
  52. struct node *p;
  53. //子线程会一直等待资源,类似生产者和消费者,但是这里的消费者可以是多个消费者,而
  54. //不仅仅支持普通的单个消费者,这个模型虽然简单,但是很强大
  55. pthread_create(&tid, NULL, thread_func, NULL);
  56. sleep(1);
  57. for (i = 0; i < 10; i++)
  58. {
  59. p = (struct node*)malloc(sizeof(struct node));
  60. p->n_number = i;
  61. pthread_mutex_lock(&mtx); //需要操作head这个临界资源,先加锁,
  62. p->n_next = head;
  63. head = p;
  64. pthread_cond_signal(&cond);
  65. pthread_mutex_unlock(&mtx); //解锁
  66. sleep(1);
  67. }
  68. printf("thread 1 wanna end the line.So cancel thread 2./n");
  69. //关于pthread_cancel,有一点额外的说明,它是从外部终止子线程,子线程会在最近的取消点,退出
  70. //线程,而在我们的代码里,最近的取消点肯定就是pthread_cond_wait()了。
  71. pthread_cancel(tid);
  72. pthread_join(tid, NULL);
  73. printf("All done -- exiting/n");
  74. return 0;
  75. }

3)信号量

如同进程一样,线程也可以通过信号量来实现通信,虽然是轻量级的。

信号量函数的名字都以"sem_"打头。线程使用的基本信号量函数有四个。

#include <semaphore.h>

int sem_init (sem_t *sem , int pshared, unsigned int value);

这是对由sem指定的信号量进行初始化,设置好它的共享选项(linux 只支持为0,即表示它是当前进程的局部信号量),然后给它一个初始值VALUE。

两个原子操作函数:

int sem_wait(sem_t *sem);

int sem_post(sem_t *sem);

这两个函数都要用一个由sem_init调用初始化的信号量对象的指针做参数。

sem_post:给信号量的值加1;

sem_wait:给信号量减1;对一个值为0的信号量调用sem_wait,这个函数将会等待直到有其它线程使它不再是0为止。

int sem_destroy(sem_t *sem);

这个函数的作用是再我们用完信号量后都它进行清理。归还自己占有的一切资源。

示例代码:

  1. #include <stdlib.h>
  2. #include <stdio.h>
  3. #include <unistd.h>
  4. #include <pthread.h>
  5. #include <semaphore.h>
  6. #include <errno.h>
  7. #define return_if_fail(p) if((p) == 0){printf ("[%s]:func error!/n", __func__);return;}
  8. typedef struct _PrivInfo
  9. {
  10. sem_t s1;
  11. sem_t s2;
  12. time_t end_time;
  13. }PrivInfo;
  14. static void info_init (PrivInfo* thiz);
  15. static void info_destroy (PrivInfo* thiz);
  16. static void* pthread_func_1 (PrivInfo* thiz);
  17. static void* pthread_func_2 (PrivInfo* thiz);
  18. int main (int argc, char** argv)
  19. {
  20. pthread_t pt_1 = 0;
  21. pthread_t pt_2 = 0;
  22. int ret = 0;
  23. PrivInfo* thiz = NULL;
  24. thiz = (PrivInfo* )malloc (sizeof (PrivInfo));
  25. if (thiz == NULL)
  26. {
  27. printf ("[%s]: Failed to malloc priv./n");
  28. return -1;
  29. }
  30. info_init (thiz);
  31. ret = pthread_create (&pt_1, NULL, (void*)pthread_func_1, thiz);
  32. if (ret != 0)
  33. {
  34. perror ("pthread_1_create:");
  35. }
  36. ret = pthread_create (&pt_2, NULL, (void*)pthread_func_2, thiz);
  37. if (ret != 0)
  38. {
  39. perror ("pthread_2_create:");
  40. }
  41. pthread_join (pt_1, NULL);
  42. pthread_join (pt_2, NULL);
  43. info_destroy (thiz);
  44. return 0;
  45. }
  46. static void info_init (PrivInfo* thiz)
  47. {
  48. return_if_fail (thiz != NULL);
  49. thiz->end_time = time(NULL) + 10;
  50. sem_init (&thiz->s1, 0, 1);
  51. sem_init (&thiz->s2, 0, 0);
  52. return;
  53. }
  54. static void info_destroy (PrivInfo* thiz)
  55. {
  56. return_if_fail (thiz != NULL);
  57. sem_destroy (&thiz->s1);
  58. sem_destroy (&thiz->s2);
  59. free (thiz);
  60. thiz = NULL;
  61. return;
  62. }
  63. static void* pthread_func_1 (PrivInfo* thiz)
  64. {
  65. return_if_fail (thiz != NULL);
  66. while (time(NULL) < thiz->end_time)
  67. {
  68. sem_wait (&thiz->s2);
  69. printf ("pthread1: pthread1 get the lock./n");
  70. sem_post (&thiz->s1);
  71. printf ("pthread1: pthread1 unlock/n");
  72. sleep (1);
  73. }
  74. return;
  75. }
  76. static void* pthread_func_2 (PrivInfo* thiz)
  77. {
  78. return_if_fail (thiz != NULL);
  79. while (time (NULL) < thiz->end_time)
  80. {
  81. sem_wait (&thiz->s1);
  82. printf ("pthread2: pthread2 get the unlock./n");
  83. sem_post (&thiz->s2);
  84. printf ("pthread2: pthread2 unlock./n");
  85. sleep (1);
  86. }
  87. return;
  88. }

通 过执行结果后,可以看出,会先执行线程二的函数,然后再执行线程一的函数。它们两就实现了同步。在上大学的时候,虽然对这些概念知道,可都没有实践过,所 以有时候时间一久就会模糊甚至忘记,到了工作如果还保持这么一种状态,那就太可怕了。虽然现在外面的技术在不断的变化更新,可是不管怎么变,其核心技术还 是依旧的,所以我们必须要打好自己的基础,再学习其他新的知识,那时候再学新的知识也会觉得比较简单的。信号量代码摘自http://blog.csdn.net/wtz1985/article/details/3835781

参考:

【1】 http://www.cnblogs.com/feisky/archive/2009/11/12/1601824.html

【2】 http://www.cnblogs.com/mydomain/archive/2011/07/10/2102147.html

【3】 线程函数介绍

http://www.unix.org/version2/whatsnew/threadsref.html

【4】 http://www.yolinux.com/TUTORIALS/LinuxTutorialPosixThreads.html

【5】 线程常用函数简介

http://www.rosoo.net/a/201004/8954.html

【6】 条件变量

http://blog.csdn.net/hiflower/article/details/2195350

【7】条件变量函数说明

http://blog.csdn.net/hairetz/article/details/4535920

本文来自博文:

http://www.cnblogs.com/mydomain/archive/2011/08/14/2138455.html

上一篇:Android Memory Leak


下一篇:Python读excel——xlrd