C#多线程(一) 入门

本文你会了解如下内容:

1、计算机程序、进程、线程的概念

2、多线程的概念、为什么需要多线程、多线程的好处与坏处

3、C# 线程的一些概念与操作(创建线程、像线程中传递参数、给线程取名、前后台线程、线程优先级、异常处理)

4、线程池


一、计算机程序、进程、线程的概念

计算机程序:是计算机能识别和处理的指令集合,通常情况下是计算机操作系统可以执行的二进制文件,如在Win32系统上符合PE(Portable Executable)格式的二进制文件就可算是计算机程序。

进程:是计算机程序在计算机操作系统中运行的产物。一个计算机程序可以有多个进程,如一个游戏程序运行多次就会得到多个游戏程序的进程。

:在早期的操作系统(如早期的 Unix)是基于进程设计的,进程既是掌管资源的单位又是执行的单位;在现代的操作系统中,进程本身不是执行的单位,而是线程的容器,此时的进程仅仅是掌管资源的单位。

线程:是一个独立的执行流,每个线程有自己独立的线程栈。在同一进程下的线程共享进程的资源。

二、多线程的概念、为什么需要多线程、多线程的好处与坏处

多线程:通过软件或硬件的技术实现多个线程并发执行的技术,在通常情况下就是指一个进程中有多个线程(并发执行)的现象。

我们知道在现在主流计算机体系结构(冯诺依曼体系机构)中CPU是很宝贵的资源,我们要尽可能的提高CPU的利用率。在日常的任务操作中,有大量任务是与IO设备交互,应为IO设备的运行速度比CPU的运行速度慢好几个数量级,在需要大量IO操作的任务或程序(IO密集型)中CPU会有一段不短的时间等待IO设备处理完毕,这就造成了CPU资源的浪费。为了解决这种浪费,为了更充分的利用CPU资源,我们引入多线程技术。针对刚才的例子,我们可以通过把需要和IO设备交互的工作交给一个线程(通常是后台线程)处理,主线程继续执行其他任务,这样就解决问题了,这也就是为什么需要需要多线程技术。

多线程的好处

1、提高了CPU的利用率

2、提升了程序的效率

多线程的坏处

1、增加了程序的复杂度(创建线程不复杂、复杂的是线程间的协调工作),可能导致一些很难调试的BUG

2、比单线程程序消耗更多的资源(每个线程有独立的线程栈,这是需要资源滴)

建议

1、将多线程逻辑封装到一个可重用的类库中,这个类库可以被充分的测试。最好不要将多线程处理逻辑和业务处理逻辑耦合得太紧,这样做是在给自己挖坑 C#多线程(一) 入门

三、C# 线程的一些概念与操作

光说不练假把式,先来看个例子(为了节省文章版幅,因此代码有时候采用缩行处理)

例1:创建线程

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(WriteY);
t.Start();
while(true) {Console.Write("x");}
} static void WriteY()
{
while(true) {Console.Write("y");}
}
}

编译: csc 1.cs

运行 1.exe > result.txt

上面的 “>” 是一个DOS运算符,含义是将 1.exe 打印的字符写入到 result.txt 文本中

效果:

C#多线程(一) 入门

引用 Thread in C# 中的一幅图

C#多线程(一) 入门

刚才我们说每个线程有独立的线程栈,我们写代码验证下

using System;
using System.Threading; // 每个线程内的变量互相不影响,CLR为每个线程在堆上分配独立的线程栈控件
class App
{
static void Main()
{
new Thread(Go).Start();
Go();
} static void Go()
{
for(int cycles = ; cycles<; cycles++) {Console.Write("?");}
}
}

运行效果:??????????

10 个问号,不是5个问号,正好验证了我们的猜测。

当线程引用公有变量(全局变量)时它们会共享此公有变量的数据,看下例:

using System;
using System.Threading;
// 实例字段和实例方法
class App
{
bool done;
static void Main()
{
App app = new App();
new Thread(app.Go).Start();
app.Go();
} void Go()
{
if(!done){done = true; Console.WriteLine("This Only Print Once");}
}
}

运行效果: This Only Print Once

貌似这个程序得到了我们要的效果,其实这样做是存在打印出两次的风险的(虽然概率极小),为了让出现打印两次的概念变大许多,我们改变以下 done = true; 和Console.WriteLine("This Only Print Once"); 的次序变为:

void Go()
{
if(!done){Console.WriteLine("This Only Print Once");done = true; }
}

运行结果变为:

This Only Print Once
This Only Print Once

打印了两次,这并不是我们想要的结果。通过这个例子,我们引入线程安全的概念(其实这是一个非线程安全的例子)即在多线程情况下,每次运行结果和单线程运行的结果是一样的,相关变量的值也是在预期范围内的,这样的情况成为线程安全,反之称为非线程安全(说白了,线程安全,就是程序跑出的结果和你猜想的一致,非线程安全就是和你想的不一致)

在C#中解决上面非线程安全问题的最简单的方式就是用 lock 语句锁住多线程交互的地方,看代码:

using System;
using System.Threading; class App
{
static bool done;
static object _locker = new object();
static void Main()
{
new Thread(Go).Start();
Go();
} static void Go()
{
lock(_locker)
{
if(!done) {Console.WriteLine("This Only Print Once");done = true;}
}
}
}

运行结果:This Only Print Once

注意

1、线程间共享公有数据是多线程复杂性以及产生难以发现BUG的主要原因,尽管多线程之间经常需要共享公共数据,但尽量使共享数据交互的代码尽量简单吧 C#多线程(一) 入门

2、通过lock语句每次只有一个线程进入临界区,其余线程被挡在临界区外(或等待或被阻塞Blocked)直到获取到lock的锁对象。

3、lock 语句是比较耗资源的,lock语句锁住的范围最好尽量的小。考虑一个极端的情况,在一个多线程程序中用lock语句锁住的范围是整个程序的执行范围,这是神马情况?这种情况不就是和单线程执行效果一样了么,那还用毛线多线程技术和lock语句呀,对吧?!

Join 与 Sleep语句

你可以通过Join语句实现线程A等待线程B执行完的功能,看代码:

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(() =>
{
for(int i = ; i< ; i++) {Console.Write("y ");}
});
t.Start();
t.Join(); // 主线程等待 线程t执行完毕再结束
Console.WriteLine("Thread t has ended!");
}
}

编译 :csc 10_join.cs

运行 : 10_join.exe > joinResult.txt

程序执行效果:

C#多线程(一) 入门

其实本例的t.Join(); 加不加效果都一样,原因是用 Thread 创建的线程是前台线程,程序要等到所有前台线程执行完毕后才会退出,这个下面会谈到。

Thread.Sleep 暂停当前线程指定时间

Thread.Sleep(TimeSpan.FromHours());    // 暂停1小时
Thread.Sleep(); // 暂停 500 毫秒

注意

1、Thread.Sleep(0) 或 Thread.Yield() 表示主动放弃当前线程执行权,把CPU资源让给别的线程。Yield(有放弃、让步、屈服之意)

ThreadStart委托与 ParameterizedThreadStart 委托

先看看MSDN上的定义:

public delegate void ThreadStart() // 无参

public delegate void ParameterizedThreadStart(Object obj)  // 带参数,可以向线程中传递数据,但注意这里只能用Object,因此涉及到装箱拆箱操作

初始化委托有四种方法(原始方式、方法方式、匿名方法方式、Lambda 方式)详见 类库探源——System.Delegate

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(new ThreadStart(WriteY)); // 这是原始的方法
/* 还可以
Thread t = new Thread(WriteY); // 方法方式
Thread t = new Thread(delegate(){while(true) {Console.Write("y");}}); // 匿名方法
Thread t = new Thread(() => {while(true) {Console.Write("y");}}); // Lambda 表达式
*/
Console.WriteLine(t.IsBackground); // 用 Thread 创建的线程是前台线程 结果是 False
t.Start();
while(true) {Console.Write("x");}
} static void WriteY()
{
while(true) {Console.Write("y");}
}
}

运行结果:

C#多线程(一) 入门

向线程中传递数据

首先我们可以用 ParameterizedThreadStart 委托传递参数,看代码:

using System;
using System.Threading; class App
{
static void Main()
{
string str = "Contents";
var t = new Thread(Invoke);
t.Start(str); // 传参
}
static void Invoke(object str)
{
Console.WriteLine(str);
}
}

上面的代码可以用 Lambda 表达式写得更精练

static void Main()
{
string str = "Contents";
new Thread((obj) =>{Console.WriteLine(obj);}).Start(str);
}

第二种方法用匿名方法(或Lambda表达式)调用一个普通方法变通解决:

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(delegate(){WriteText("hello Thread Param");});
        //可用Lambda表达式 var t = new Thread(() =>WriteText("hello Thread Param"));        
        t.Start();
}
static void WriteText(string txt)
{
Console.WriteLine(txt);
}
}

Lambda 表达式值捕获问题

如我们所见 Lambda 表达式是向线程传值的最强大的方式,但是你必须小心值捕获(captured variables)问题,也有人把这个问题称为闭包下值的问题,看代码:

using System;
using System.Threading; class App
{
static void Main()
{
for(int i = ; i < ; i++)
{
new Thread(() => Console.Write(i)).Start();
}
}
}

运行几次的效果:

C#多线程(一) 入门

可以看出每次都不一样C#多线程(一) 入门,也没有一次值为 0123456789 这是为什么呢?

原因是在循环指向过程中的变量 i 指向了相同的内存位置(i variable refers to the same memory location throughout the loop’s lieftime.)每个线程获取到i的值不会那么巧正好是 0123456789的顺序

解决方法:用个临时变量存储i

int temp = i;
new Thread(() => Console.Write(temp)).Start();

效果:

C#多线程(一) 入门

每次都是 0123456789

再用更简单例子来说明:

string text = "t1";
var t1 = new Thread(() =>Console.WriteLine(text)); string text = "t2";
var t2 = new Thread(() =>Console.WriteLine(text)); t1.Start();
t2.Start();

结果是打印 两个 t2

给线程取名

给线程命名在调试的时候很有用,在VS下可以查看线程名字

Thread.CurrentThread 获取当前正在运行的线程

using System;
using System.Threading; class App
{
static void Main()
{
Thread.CurrentThread.Name = "Main Thread";
var worker = new Thread(Go);
worker.Name = "Worker Thread";
worker.Start(); // 另取线程调用Go
Go(); // 主线程中调用Go
} static void Go()
{
Console.WriteLine("Hello from " + Thread.CurrentThread.Name);
}
}

运行效果:

C#多线程(一) 入门

前台线程与后台线程

用 Thread 类创建的线程默认是前台线程,应用程序的所有前台线程执行完后才结束,如何特殊设置(如Join)前台线程结束后,后台线程也会终止因为程序都terminate 了嘛 C#多线程(一) 入门

看下刚才Join的例子,我们将用后台线程演示,看代码:

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(() =>
{
for(int i = ; i< ; i++) {Console.Write("y ");}
});
t.IsBackground = true;
t.Start(); Console.WriteLine("Thread t has ended!");
}
}

运行2次效果:

C#多线程(一) 入门

第一次执行打印一个y 第二次执行打印一个y ,反正都没打印完

现在用 Join 语句阻塞下

using System;
using System.Threading; class App
{
static void Main()
{
Thread t = new Thread(() =>
{
for(int i = ; i< ; i++) {Console.Write("y ");}
});
t.IsBackground = true;
t.Start();
t.Join();
Console.WriteLine("Thread t has ended!");
}
}

效果:

C#多线程(一) 入门

后台线程执行完了。

注意

1、Thread 创建的线程默认是前台线程

2、线程池创建的线程默认是后台线程

3、线程的前后台状态与线程的优先级没有关系

线程优先级

public enum ThreadPriority{Lowest,BelowNormal,Normal,AboveNormal,Highest}

异常处理

参见 类库探源——System.Exception 中第四和第五小节

未完

本系列参考Joseph Albaharis Thread in C#

上一篇:聚宽获取财务数据+DataFrame写入txt


下一篇:delphi 组件安装教程详解