第四章学习笔记

2024-01-29 18:39:04

读书笔记

本章论述了并发编程，介绍了并行计算的概念，指出了并行计算的重要性;比较了顺序算法与并行算法，以及并行性与并发性;解释了线程的原理及其相对于进程的优势;通过示例介绍了Pthread中的线程操作，包括线程管理函数，互斥量、连接、条件变量和屏障等线程同步工具;通过具体示例演示了如何使用线程进行并发编程，包括矩阵计算、快速排序和用并发线程求解线性方程组等方法;解释了死锁问题，并说明了如何防止并发程序中的死锁问题;讨论了信号量，并论证了它们相对于条件变量的优点;还解释了支持Linux中线程的独特方式。编程项目是为了实现用户级线程。它提供了一个基础系统来帮助读者开始工作。这个基础系统支持并发任务的动态创建、执行和终止，相当于在某个进程的同一地址空间中执行线程。读者可通过该项目实现线程同步的线程连接、互斥量和信号量，并演示它们在并发程序中的用法。该编程项目会让读者更加深入地了解多任务处理、线程同步和并发编程的原理及方法。

知识点总结

一、线程

线程是某进程同一地址空间上的独立执行单元。创建某个进程就是在一个唯一地址空间创建一个线程。当某进程开始时，就会执行该进程的主线程。如果只有一个主线程，那么进程和线程实际上并没有区别。但是，主线程可能会创建其他线程。每个线程又可以创建更多的线程等。某进程的所有线程都在该进程的相同地址空间中执行，但每个线程都是一个独立的执行单元。

线程优点
线程创建和切换速度更快：若要在某个进程中创建线程，操作系统不必为新的线程分配内存和创建页表，因为线程与进程共用同一个地址空间。所以，创建线程比创建进程更快。
线程的响应速度更快：一个进程只有一个执行路径。当某个进程被挂起时，帮个进程都将停止执行。相反，当某个线程被挂起时，同一进程中的其他线程可以继续执行。
线程更适合井行计算：并行计算的目标是使用多个执行路径更快地解决间题。基于分治原则（如二叉树查找和快速排序等）的算法经常表现出高度的并行性，可通过使用并行或并发执行来提高计算速度。
线程缺点
由于地址空间共享，线程需要来自用户的明确同步。
许多库函数可能对线程不安全
在单CPU系统上，使用线程解决间题实际上要比使用顺序程序慢，这是由在运行时创建线程和切换上下文的系统开销造成的。
线程操作
线程的执行轨迹与进程类似。线程可在内核模式或用户模式下执行。在用户模式下，线程在进程的相同地址空间中执行，但每个线程都有自己的执行堆栈。线程是独立的执行单元，可根据操作系统内核的调度策略，对内核进行系统调用，变为桂起激活以继续执行等。为了利用线程的共享地址空间，操作系统内核的调度策略可能会优先选择同一进程中的线程，而不是不同进程中的线程。

二、线程管理函数

Pthread并发编程
Pthread库提供了用于线程管理的以下APT。

pthread_create(thread, attr, function, arg): create thread
pthread_exit(status）：terminate thread
pthread_cancel(thread) : cancel thread
pthread_attr_init(attr) : initialize thread attributes
pthread_attr_destroy(attr): destroy thread attribute

使用pthread_ create()函数创建线程。int pthread_create (pthread_t pthread_id,pthread_attr_t•attr,void * (func) (void *), void *arg);如果成功则返回0,如果失败则返回错误代码。
pthread_id是指向pthread_t类型变员的指针。它会被操作系统内核分配的唯一线程ID填充。在POSIX中,pthread_t是一种不透明的类型。程序员应该不知道不透明对象的内容，因为它可能取决千实现情况。线程可通过pthread_self()函数获得自己的ID。在Linux中，pthread_t类型被定义为无符号长整型，因此线程ID可以打印为%lu。
attr是指向另一种不透明数据类型的指针，它指定线程属性。
func是要执行的新线程函数的人口地址。
arg是指向线程函数参数的指针，可写为：void *func(void *arg) ,attr参数使用：
定义一个pthread展性变址pt:hread_attr_tattr。
用pthread_attr_init(&attr)初始化屈性变掀。
设置属性变垃并在pthread_ create()调用中使用。
必要时，通过pthread_attr_destroy(&attr)释放attr资源。
线程ID 是一种不透明的数据类型，取决于实现悄况。因此，不应该直接比较线程ID。如果需要，可以使用pthread_ equal()函数对它们进行比较。
int pthread_equal (pthread_t tl, pthread_t t2);
线程函数结束后，线程即终止。或者，线程可以调用函数 int pthraad_axit {void *status)
一个线程可以等待另一个线程的终止，通过：int pthread_join (pthread_t thread, void **status__ptr);终止线程的退出状态以status_ptr返回。
在 Pthread中，锁被称为互斥量，意思是相互排斥。互斥变呈是用 ptbread_mutex_t 类型声明的在使，用之前必须对它们进行初始化。有两种方法可以初始化互斥址。
静态方法,pthreaa—mutex_t m = PTHREAD_MUTEX_INITIALIZER;定义互斥量m,并使用默认属性对其进行初始化。
动态方法，使用 pthread_ mutex _init() 函数

三、死锁预防

预防死锁
通过破坏产生死锁的四个必要条件来预防死锁，
但因互斥条件是必须的，所以不能破坏该条件。

预防死锁-破坏“请求和保持”条件
为了破坏该条件，OS需要保证：
当进程请求资源时，不可持有不可抢占资源。
可通过两个协议实现：

第一种协议
进程在开始运行前，一次性申请整个运行过程中所需的全部资源。
缺点：
资源严重浪费。
进程进程出现饥饿现象。
第二种协议
进程在开始运行前，仅请求初期所需资源，运行时逐步释放不再需要的资源，并请求新的所需资源。

预防死锁-破坏“不可抢占”条件
保持了不可抢占资源的进程，提出新资源申请，但不被满足时，释放所有已得到的资源。
实现复杂，且释放已有资源很可能付出很大代价。
预防死锁-破坏“循环等待”条件
对系统所有资源类型进行排序，并赋予不同序号，进程在请求资源时，必须按序号递增顺序请求资源。如果一个拥有高序号资源的进程，请求低序号资源，则需要先释放高序号资源，再请求低序号资源。
资源利用率与吞吐量相较前两策略改善不少。

缺点：
新设备的增加被限制。
资源标号困难。
限制用户编程思路。

避免死锁
在资源动态分配过程中，防止系统进入不安全状态，限制弱，但成本低。
避免死锁-系统安全状态
死锁避免中，系统状态被划分成安全状态与不安全状态，处于不安全状态时，系统可能进入死锁。
允许进程动态申请资源，但OS进行分配资源前，应先评估资源分配安全性，仅安全状态下可分配。

安全状态，是指OS能按某进程推进顺序为各进程分配资源（包括释放资源），满足各进程对资源的最大需求。
安全状态下不会出现死锁。
安全状态的例子见P119，很简单的一个例子。
避免死锁-利用银行家算法避免死锁
由Dijkstra的银行家算法是一个非常有代表性的避免死锁算法。
为实现银行家算法，每个新进程在进入系统时，先申明各所需资源的最大数目。
OS分配资源时，先确认有足够资源分配给该进程，再确认分配资源后是否会进入不安全状态。
银行家算法的数据结构
Available[]：可利用资源向量，包含m个元素的数组，表示系统中该类资源的数目。

Max[][]：nm矩阵，n个进程对m个资源的最大需求。
Allocation[][]：nm矩阵，n个进程已获得m个资源的数量。
Need[][]：n*m矩阵，n个进程所需的m个资源的数量。

关系：Need[i, j] = Max[i, j] - Allocation[i, j]
书本中的Need等二维向量，仅用一对[]，但为了区分，变量名中我使用两对[]。
银行家算法
Request是进程p的请求向量，
Request[j]=k表示当前p进程对j资源需要k个数量。
如无特别说明，带序号的步骤为顺序步骤。
Request[][]<=Need[][]，如果大于，则认为出错，因为超过了它原先宣布的最大值。
Request[][]<=Available[]，如果大于，则等待。
将数据结构中各数据修改成分配资源后的值。
执行安全性算法，若安全，则分配数据，若不安全，则本次分配作废，进程等待。
安全性算法
设置两个临时变量Work[]=Available[]、Finish[]=false，分别表示当前可用资源数目、是否已经安全分配资源。
从进程集合中找到一进程i满足：Finish[i]false，并且Need[i, j]<Work[j]的进程，若找到，进入3，否则进入4.
设置Work[j]+=Available[i, j]，Finish[i]=true，即分配完资源给进程，进程结束后释放资源，Work增加，安全分配，Finish置真。
步骤3结束后，跳回步骤2.
所有进程Finish[]true，是则表示处于安全状态，不是则不安全。

问题和解决思路

线程计算矩阵和
主线程会先生成一个N×N整数矩阵。然后，它会创建N个工作线程，将唯一行号作为参数传递给各工作线程，并等待所有工作线程终止。每个工作线程计算不同行的部分和，并将部分和存入全局数组int sum[N]的相应行中。当所有工作线程计算完成后，主线程继续进行计算。它将工作线程生成的部分和相加来计算总和。
]
相关代码

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
typedef struct{
	int upperbound;
	int lowerbound;
}PARM;
#define N 10
int a[N]={5,1,6,4,7,2,9,8,0,3};// unsorted data
int print(){//print current a[] contents
	int i;
	printf("[");
	for(i=0;i<N;i++)
		printf("%d ",a[i]);
	printf("]\n");
}
void *Qsort(void *aptr){
	PARM *ap, aleft, aright;
	int pivot, pivotIndex,left, right,temp;
	int upperbound,lowerbound;
	pthread_t me,leftThread,rightThread;
	me = pthread_self();
	ap =(PARM *)aptr;
	upperbound = ap->upperbound;
	lowerbound = ap->lowerbound;
	pivot = a[upperbound];//pick low pivot value
	left = lowerbound - 1;//scan index from left side
	right = upperbound;//scan index from right side
	if(lowerbound >= upperbound)
		pthread_exit (NULL);
	while(left < right){//partition loop
		do{left++;} while (a[left] < pivot);
		do{right--;}while(a[right]>pivot);
		if (left < right ) {
			temp = a[left];a[left]=a[right];a[right] = temp;
		}
	}
	print();
	pivotIndex = left;//put pivot back
	temp = a[pivotIndex] ;
	a[pivotIndex] = pivot;
	a[upperbound] = temp;
	//start the "recursive threads"
	aleft.upperbound = pivotIndex - 1;
	aleft.lowerbound = lowerbound;
	aright.upperbound = upperbound;
	aright.lowerbound = pivotIndex + 1;
	printf("%lu: create left and right threadsln", me) ;
	pthread_create(&leftThread,NULL,Qsort,(void * )&aleft);
	pthread_create(&rightThread,NULL,Qsort,(void *)&aright);
	//wait for left and right threads to finish
	pthread_join(leftThread,NULL);
	pthread_join(rightThread, NULL);
	printf("%lu: joined with left & right threads\n",me);
}
	int main(int argc, char *argv[]){
	PARM arg;
	int i, *array;
	pthread_t me,thread;
	me = pthread_self( );
	printf("main %lu: unsorted array = ", me);
	print( ) ;
	arg.upperbound = N-1;
	arg. lowerbound = 0 ;
	printf("main %lu create a thread to do QS\n" , me);
	pthread_create(&thread,NULL,Qsort,(void * ) &arg);//wait for Qs thread to finish
	pthread_join(thread,NULL);
	printf ("main %lu sorted array = ", me);
	print () ;
}

码农公寓