C#集合基础与运用

C#集合基础与运用

 

C#集合基础与运用

1. 集合接口与集合类型............................................... 1

(1) 集合的命名空间................................................. 2

(2) 集合接口介绍..................................................... 2

1、 IEnumerable与IEnumerator接口............. 2

2、集合和列表实现的接口表............................ 2

2. 集合的基本操作....................................................... 2

(1) 创建集合............................................................. 2

(2) 添加元素............................................................. 3

(3) 插入元素............................................................. 3

(4) 访问元素............................................................. 3

(5) 删除元素............................................................. 4

(6) 搜索元素............................................................. 4

(7) 元素排序............................................................. 4

(8) 类型转换............................................................. 4

(9) 只读集合............................................................. 5

(10) 集合常用的扩展方法(常用)........................... 5

3. 常见集合的特性....................................................... 5

(1) 非泛型集合对应的泛型集合............................. 5

(2) 队列(Queue<T>)................................................. 5

(3) 栈(Stack<T>)..................................................... 6

(4) 链表(LinkedList<T>)....................................... 7

(5) 有序列表(SortedList<K,V>)........................... 7

(6) 字典..................................................................... 8

1、 Dictionary<K,V>.......................................... 8

2、 Lookup<K,V>.................................................. 8

3、 SortedDictionary<K,V>.............................. 8

(7) 集(ISet<T>接口)............................................... 8

4. 可观察的集合(深入)............................................... 8

(1) ObservableCollection<T>类简介................... 8

(2) 使用示例............................................................. 8

5. 位数组(深入)........................................................... 9

(1) BitArray、BitVector32介绍.......................... 9

(2) BitArray............................................................. 9

(3) BitVector32..................................................... 10

6. 并发集合(.NET 4新增)........................................ 10

(1) ConcurrentQueue<T>....................................... 10

(2) ConcurrentStack<T>....................................... 10

(3) ConcurrentBag<T>........................................... 10

(4) ConcurrentDictionary<K, V>....................... 10

(5) BlockingCollection<T>................................. 10

7. 不同集合类的性能................................................. 10

1.集合接口与集合类型

(1)集合的命名空间

大多数集合类都可以在System.Collections和System.Collections.Generic名称空间中找到。泛型集合位于System.Collections.Generic名称空间中;专用于特定类型的集合类位于System.Collections.Specialized名称空间中;线程安全的集合位于System.Collections.Concurrent名称空间中。

(2)集合接口介绍

1、IEnumerable与IEnumerator接口

其实IEnumerable接口是非常的简单,只包含一个抽象的方法GetEnumerator(),它返回一个可用于循环访问集合的IEnumerator对象。

public interface IEnumerable

{

IEnumerator GetEnumerator();

}

IEnumerator对象有什么呢?它是一个真正的集合访问器,没有它,就不能使用foreach语句遍历集合或数组,因为只有IEnumerator对象才能访问集合中的项。IEnumerator接口定义了:一个Current属性用来获取当前集合中的项;MoveNext方法将游标的内部位置向前移动;Reset方法将枚举数设置为其初始位置,该位置位于集合中第一个元素之前。

public interface IEnumerator

{

object Current { get; }

bool MoveNext();

void Reset();

}

一个collection要支持foreach进行遍历,就必须实现IEnumerable,并以某种方式返回迭代器对象:IEnumerator。

2、集合和列表实现的接口表

接口

说明

IEnumerable<T>

如果foreach语句用于集合,就需要此接口。

ICollection<T>

此集合定义了Count属性、CopyTo、Add、Remove、Clear方法

IList<T>

可以通过位置访问几何元素

ISet<T>

此集合不允许有重复的元素

IDictionary<K,V>

含有键值对的集合

ILookup<K,V>

含有键值对的集合,但可以通过一个键包含多个值

IComparer<T>

集合元素比较器,用于集合元素的排序

IEqualityComparer<T>

用于字典集合的比较器

IProducerConsumerCollection<T>

线程安全的集合

2.集合的基本操作

(1)创建集合

使用默认的构造函数创建一个空集合,元素添加到集合之后,集合的容量就会扩大为4。当集合的容量被使用完,且还在向集合中添加元素时,集合的容量就会扩大成原来的2倍!可使用Capacity属性设置或访问集合的容量,使用Count属性访问集合的元素个数。也可使用TrimExcess方法调整集合容量,节省内存!

class Program

{

static void Main(string[] args)

{

List<int> list = new List<int>();//List<int> list = new List<int>(3)

for (int i = 0; i < 1025; i++)

{

if (list.Count == (list.Capacity))

{

Console.WriteLine("容量使用量:"+list.Count + "/" + list.Capacity);

}

list.Add(i);

}

Console.WriteLine("容量使用量:" + list.Count + "/" + list.Capacity);

list.TrimExcess();//调整容量

Console.WriteLine("容量使用量:" + list.Count + "/" + list.Capacity);

Console.Read();

}

}

创建集合时可以为集合设置初始值,如下:

List<int> list = new List<int>() { 1,2,3,4,5,6,7,8,9,0};

List<string> list = new List<int>() { "aa", "bb", "cc" };

(2)添加元素

为集合添加元素可使用Add方法,还可以使用AddRange方法一次添加多个元素,因为AddRange方法的参数是IEnumerable<T>类型的对象,所以可以添加数组到集合里。

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>();

list.AddRange(new string[]{"aa","bb","cc"});//添加数组

list.AddRange(list);//添加集合

foreach (string s in list)

{

Console.WriteLine(s);

}

Console.Read();

}

}

(3)插入元素

插入元素可以使用Insert方法,同样使用InsertRange方法插入多个元素,与AddRange方法类似。

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "aa", "bb", "ff" };

list.Insert(2, "cc");//插入元素

list.InsertRange(3, new string[] { "dd", "ee" });//插入集合

foreach (string s in list)

{

Console.WriteLine(s);

}

Console.Read();

}

}

(4)访问元素

可以使用索引器访问集合中某个位置的元素,例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "aa", "bb", "cc" };

Console.WriteLine(list[1]);//访问第1个位置上的元素,下标从0开始

Console.Read();

}

}

集合的遍历,除了使用foreach外,还可以使用集合的Foreach方法,该方法的参数是一个Action<T>委托类型,可以使用Lambda表达式。例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "aa", "bb", "cc" };

list.ForEach(temp => Console.WriteLine("元素:" + temp));

//也可使用: list.ForEach(Console.WriteLine);

Console.Read();

}

}

(5)删除元素

使用RemoveAt删除指定位置的元素,使用Remove删除指定的元素,使用RemoveRange删除指定位置范围的元素,使用Clear删除所有元素,使用RemoveAll选择删除的元素。

注意:RemoveAll方法的参数是一个Predicate<T>委托类型,使用方式如下:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "12", "123", "1234", "12345" };

//删除长度小于4的元素

list.RemoveAll(x => { bool flag = x.Length < 4; return flag; });

list.ForEach(Console.WriteLine);

Console.Read();

}

}

(6)搜索元素

用于搜索的方法有:IndexOf、LastIndexOf、FindIndex、FindLastIndex、FindLast、Find、FindAll、Exists等方法。

IndexOf、LastIndexOf、FindIndex、FindLastIndex方法用于搜索元素的位置。

FindLast、Find、FindAll方法用于搜索满足条件的元素。

Exists用于判断集合是否存在某些元素。

参数可以使用Predicate<T>委托类型(Lambda表达式)的方法有:FindIndex、FindLastIndex、Find、FindLast、FindAll、Exists。例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "12", "123", "1234", "12345" };

//搜索长度小于4的元素

list=list.FindAll(x => { bool flag = x.Length < 4; return flag; });

list.ForEach(Console.WriteLine);

Console.Read();

}

}

(7)元素排序

可以使用Sort方法对元素排序,也可以调用Reverse方法逆转集合顺序,Sort方法使用快速排序算法。Sort使用了几个重载的方法,可以传递的参数有泛型委托Comparison<T>和泛型接口IComparer<T>,例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "12", "123", "1234", "12345" };

//按字符串长度排序

list.Sort((x, y) => { return y.Length - x.Length; });

list.ForEach(Console.WriteLine);

Console.Read();

}

}

(8)类型转换

使用ConvertAll<TOutput>方法可以把集合里的所有元素转换成另一种类型,ConvertAll<TOutput>使用了Converter委托,其定义如下:

public sealeddelegate TOutput Converter<TInput, TOutput>(TInput from)

TInput是委托方法的参数类型,TOutput是委托方法的返回值类型。例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "12", "123", "1234", "12345" };

//把字符串转换成数字(String->int)

List<int> array = list.ConvertAll<int>(temp => Int32.Parse(temp));

array.ForEach(temp => Console.WriteLine((temp + 1)));

Console.Read();

}

}

(9)只读集合

集合的AsReadOnly方法可以返回一个ReadOnlyCollection<T>类型的集合;ReadOnlyCollection<T>是一个只读集合类型,除了不能使用修改集合的方法与属性,其它与集合一样。

(10)集合常用的扩展方法(常用)

集合的扩展方法很多,这里只举两个例子:Select与Where。例如:

Select:将序列中的每个元素投影到新表中。

class Program

{

static void Main(string[] args)

{

List<int> list = new List<int>() {1,3,5,7,9};

IEnumerable<string> array = list.Select<int, string>(x => (x * x).ToString());

foreach(string s in array)

{

Console.WriteLine(s);

}

Console.Read();

}

}

Where:基于谓词筛选值序列。

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string> { "1", "12", "123", "1234" };

//查询长度小于3的元素

IEnumerable<string> query = list.Where(temp => temp.Length < 3);

foreach (string s in query)

{

Console.WriteLine(s);

}

Console.Read();

}

}

3.常见集合的特性

(1)非泛型集合对应的泛型集合

非泛型集合类

对应的泛型集合类

ArrayList

List<T>

HashTable

DIctionary<T>

Queue

Queue<T>

Stack

Stack<T>

SortedList

SortedList<T>

(2)队列(Queue<T>)

队列是其元素以先进先出的方式来处理的集合。该集合没有Add与Remove方法,其重要的方法如下:

Enqueue

在队列的尾端添加元素

Dequeue

在队列的头部读取并删除元素

Peek

只读取队列头部的元素

程序示例如:

class Program

{

static void Main(string[] args)

{

Queue<string> queue = new Queue<string>();

for (int i = 1; i < 5; i++)

{

queue.Enqueue(i.ToString());//在尾部添加元素

}

PrintQueue(queue);//输出元素

string s = queue.Dequeue();//读取并删除头部元素

Console.WriteLine("读取并删除头部元素:" + s);

queue.Enqueue("5");//在尾部添加元素

s = queue.Peek();//读取头部元素

Console.WriteLine("读取头部元素:" + s);

PrintQueue(queue);//输出元素

Console.Read();

}

//输出元素

private static void PrintQueue(Queue<string> q)

{

IEnumerable<string> list = q.Where(t => true);

foreach (string t in list)

{

Console.WriteLine(t);

}

}

}

(3)栈(Stack<T>)

栈是一个后进先出的容器,其重要的方法如下:

Push

在栈顶压入一个元素入栈

Pop

从站顶读取并删除一个元素

Peek

只从站顶读取一个元素

程序示例如:

class Program

{

static void Main(string[] args)

{

Stack<string> stack = new Stack<string>();

for (int i = 1; i < 5; i++)

{

stack.Push(i.ToString());//入栈

}

PrintStack(stack);//输出元素

string s = stack.Pop();//读取并删除栈顶元素

Console.WriteLine("读取并删除栈顶元素:" + s);

s = stack.Peek();//只读取栈顶元素

Console.WriteLine("只读取栈顶元素:" + s);

PrintStack(stack);//输出元素

Console.Read();

}

//输出元素

private static void PrintStack(Stack<string> s)

{

IEnumerable<string> list = s.Where(t => true);

foreach (string t in list)

{

Console.WriteLine(t);

}

}

}

(4)链表(LinkedList<T>)

LinkedList<T>是一个双向链表。链表的优点是,如果将元素插入列表的中间位置,使用链表就会非常快,只需要修改下一个元素的Next引用与上一个元素的Previous引用。链表不能在集合中只存储元素,必须要把元素存到LinkedListNode<T>类型的对象中,LinkedListNode<T>定义了属性:List、Next、Value、Previous。List属性返回与该节点相关的LinkedList<T>对象,Next、Previous用于遍历链表。

LinkedList<T>对象可以访问第一个和最后一个元素(Frist与Last)、在指定位置插入元素(AddAfter()、AddBefore()、AddFirst()、AddLast()方法),删除指定位置的元素(ReMove()、ReMoveFirst()、RemoveLast()方法),从链表的开头(Find())或结尾(FindLast())开始搜索元素。

程序示例如:

class Program

{

static void Main(string[] args)

{

LinkedList<int> link = new LinkedList<int>();

LinkedListNode<int> node;

for (int i = 0; i < 10; i++)

{

node = new LinkedListNode<int>(i);

if (i % 2 == 0)

{

link.AddFirst(node);//从头部添加节点

}

else

{

link.AddLast(node);//从尾部添加节点

}

}

PrintLink(link);//输出元素

Console.Read();

}

//输出元素

private static void PrintLink(LinkedList<int> l)

{

IEnumerable<int> list = l.Where(t => true);

foreach (int t in list)

{

Console.WriteLine(t);

}

}

}

(5)有序列表(SortedList<K,V>)

SortedList<K,V>是基于键对集合进行排序的集合类,它只允许每个键只有一个对应值,如果需要每个键对应多个值可以使用Lookup<K,V>。可以使用foreach遍历该集合,枚举器返回的是KeyValuePair<K,V>类型的元素。除了使用Add方法添加元素,还可以使用索引器添加。例如:

class Program

{

static void Main(string[] args)

{

SortedList<string, string> sort = new SortedList<string, string>();

sort.Add("K1", "V1");//Add方法添加元素

sort["K2"] = "V2";//索引器添加元素

PrintSorted(sort);//输出元素

Console.WriteLine("是否存在[K3]:" + sort.ContainsKey("K3"));

string value = null;

Console.WriteLine("是否存在[K2]:" + sort.TryGetValue("K2", out value));

Console.WriteLine("[K2]的值:" + value);

Console.Read();

}

//输出元素

private static void PrintSorted(SortedList<string, string> s)

{

IEnumerable<KeyValuePair<string, string>> list = s.Where(t => true);

foreach (KeyValuePair<string, string> t in list)

{

Console.WriteLine(t.Key + " ---> " + t.Value);

}

}

}

(6)字典

字典中键的类型必须重写Object类的GetHashCode()方法。只要字典类需要确定元素的位置,他就会调用GetHashCode()方法。除了实现GetHashCode()方法外,键类型还必须实现IEquatable<T>.Equals()方法,或重写Object类的Equals()方法。

因为不同的对象可能返回相同的散列码(GetHashCode方法返回值),但是如果A.Equals(B)返回true,则A和B的散列码就必须相同。这似乎有点奇怪,但这非常重要,因为字典的性能取决于GetHashCode()方法实现的代码。

1、Dictionary<K,V>

Dictionary<K,V>类支持每个键关联一个值,与SortedList<K,V>很类似。

2、Lookup<K,V>

Lookup<K,V>类把键映射到一个值集上。创建Lookup<K,V>类对象必须调用ToLookup()扩展方法,该方法返回一个Lookup<K,V>对象。ToLookup()方法需要一个Func<T,K>类型的委托参数,Func<T,K>类型定义了键的选择器。

ToLookup()是一个奇妙的函数,用于对一个集合进行操作,创建一个1:n 的映射。 它可以方便的将数据分类成组,并生成一个字典供查询使用。例如:

class Program

{

static void Main(string[] args)

{

List<string> list = new List<string>() { "1","12","123","1234","a","ab","abc"};

var lookup=list.ToLookup(x => x.Length);//根据元素的长度分组

foreach (var t in lookup)

{

List<string> temp=t.ToList<string>();//把一组数据转换成集合

temp.ForEach(x=>Console.Write(x+"、"));//输出集合

Console.WriteLine();

}

Console.Read();

}

}

3、SortedDictionary<K,V>

SortedDictionary<K,V>类是一个二叉搜索树,其中的元素根据键来排序,该键类型必须实现IComparable<T>接口。

SortedDictionary<K,V>与SortedList<K,V>的区别:

SortedList<K,V>类使用的内存比SortedDictionary<K,V>少。

SortedDictionary<K,V>类的元素的插入与删除比较快。

在用于已排好序的集合,若不需要修改容量SortedList<K,V>会比较快。

区别的根本原因:SortedList<K,V>实现的是一个基于数组的集合,SortedDictionary<K,V>实现的是一个基于字典的集合。

(7)集(ISet<T>接口)

不包含重复元素的集合称为集,.NET Framework包含两个集(HashSet<T>和SortedSet<T>),它们都实现ISet<T>接口。HashSet<T>是不包含重复元素的无序列表,SortedSet<T>是不包含重复元素的有序列表。

4.可观察的集合(深入)

(1)ObservableCollection<T>类简介

ObservableCollection<T>类是为WPF定义的,这样UI就可以得知集合的变化,因为只要修改了ObservableCollection<T>类对象集合中的元素,它就会产生CollectionChanged事件。

(2)使用示例

class Program

{

static void Main(string[] args)

{

ObservableCollection<int> list = new ObservableCollection<int>();

list.CollectionChanged += ListCollectionChanged;//添加事件方法

list.Add(10);//产生事件

list.Add(20);//产生事件

list.Remove(10);//产生事件

Console.Read();

}

//事件方法

private static void ListCollectionChanged(object sender,

NotifyCollectionChangedEventArgs e)

{

Console.WriteLine("本次修改的方式:" + e.Action.ToString());

if (e.OldItems != null)

{

Console.WriteLine("本次修改的位置:" + e.OldStartingIndex);

Console.WriteLine("本次修改的元素个数:" + e.OldItems.Count);

}

if (e.NewItems != null)

{

Console.WriteLine("本次修改的位置:" + e.NewStartingIndex);

Console.WriteLine("本次修改的元素个数:" + e.NewItems.Count);

}

Console.WriteLine();

}

}

5.位数组(深入)

(1)BitArray、BitVector32介绍

如果需要处理的数字有许多位,就可以使用BitArray类与BitVector32结构。它们的区别是:BitArray类可以重新设置大小,它可以包含很多位;BitVector32结构是基于栈的,因此比较快,但它只能包含32为,它们存在一个整数中。

(2)BitArray

BitArray类是一个引用类型,它包含一个int数组,其中32位使用一个新整数,其成员如下:

Count、Length

Count、Length可得到数组的位数,Length可设置其数组的大小

Get、Set

使用Get、Set可访问数组中的位

SetAll

SetAll()方法设置所有的位值

Not

Not()方法对数组中所有的位求反

And、Or、Xor

And()是与操作,Or()是或操作,Xor()是异或操作

程序示例:

class Program

{

static void Main(string[] args)

{

BitArray barray = new BitArray(20);

barray.SetAll(true);//对所有位赋值

PrintBitArray(barray);//输出

barray.Set(1, false);

barray[2] = false;

PrintBitArray(barray);//输出

Console.Read();

}

//输出函数

private static void PrintBitArray(BitArray b)

{

foreach (bool bit in b)

{

Console.Write(bit ? 1 : 0);

}

Console.WriteLine();

}

}

(3)BitVector32

BitVector32结构的效率更高,因为它是值类型!它常用成员如下:

Data

Data属性把BitVector32结构返回成一个整数

索引器

访问BitVector32结构的值可以使用索引器

CreateMask

这是一个静态方法,为访问BitVector32结构中特定的类创建掩码

CreateSection

这是一个静态方法,用于创建32位中的几个片段

程序示例:

class Program

{

static void Main(string[] args)

{

BitVector32 b32 = new BitVector32();

PrintBitVector32(b32);//输出位

int bit = BitVector32.CreateMask();

for (int i = 0; i < 4; i++)

{

b32[bit] = true;

Console.WriteLine(bit);

PrintBitVector32(b32);//输出位

b32[bit] = false;

bit = BitVector32.CreateMask(bit);

}

Console.WriteLine(b32.Data);//输出数

Console.Read();

}

//输出函数

private static void PrintBitVector32(BitVector32 b32)

{

for (int i = 0; i < 32; i++)

{

Console.Write(b32[i] ? 1 : 0);

}

Console.WriteLine();

}

}

6.并发集合(.NET 4新增)

(1)ConcurrentQueue<T>

这个集合类用一种免锁定的算法实现,访问队列元素的方法有:TryDequeue、TryPeek和Enqueue。

(2)ConcurrentStack<T>

这个集合类定义了:Push()、PushRange、TryPeek、TryPop、TryPopRange方法。

(3)ConcurrentBag<T>

ConcurrentBag<T>表示对象的线程安全的无序集合。对于同一个线程值的添加和删除是非常快的,因为ConcurrentBag内部将数据按线程的标识而独立存储,所以一个线程从自己的数据中移除一个数据是非常快的,当然如果这个线程中没有数据,那么只能从其他线程中移除数据,此时会发生一些性能损耗从而确保线程安全!

(4)ConcurrentDictionary<K, V>

这是一个线程安全的键值集合,TyrAdd、TryGetValue、TryRemove、TryUpdate方法以非阻塞的方式访问元素。

(5)BlockingCollection<T>

这个集合在可以添加或提取元素元素之前,会阻塞线程并一直等待。可以使用Add、Take方法用来添加和删除元素,这些方法会阻塞当前线程,一直等到任务可以执行为止。

7.不同集合类的性能

集合

Add

Insert

Remove

Item

Sort

Find

List

O(1)或O(n)

O(n)

O(n)

O(1)

O(n log n)-O(n^2)

Stack

O(1)或O(n)

n/a

O(1)

n/a

n/a

n/a

Queue

O(1)或O(n)

n/a

O(1)

n/a

n/a

n/a

HashSet

O(1)或O(n)

O(1)或O(n)

O(1)

n/a

n/a

n/a

SortedSet

O(1)或O(n)

O(1)或O(n)

O(1)

n/a

n/a

n/a

LinkedList

O(1)

O(1)

O(1)

n/a

n/a

O(n)

Dictionary

O(1)或O(n)

n/a

O(1)

O(1)

n/a

n/a

SortedDictionary

O(log n)

n/a

O(log n)

O(log n)

n/a

n/a

SortedList

O(n)或O(log n)

n/a

O(n)

O(n)或O(log n)

n/a

n/a

 
 
分类: C#基础
上一篇:jQuery 源码基本框架


下一篇:3.10-通过requests、BeautifulSoup、webbrowser模块的相关方法,爬取网页数据示例程序(一)