python序列

2022-04-21 15:49:39

python序列

序列（sequence）官方定义（https://docs.python.org/zh-cn/3/glossary.html#term-sequence）：

一种 iterable，它支持通过 __getitem__() 特殊方法来使用整数索引进行高效的元素访问，并定义了一个返回序列长度的 __len__() 方法。内置的序列类型有 list、str、tuple 和 bytes。注意虽然 dict 也支持 __getitem__() 和 __len__()，但它被认为属于映射而非序列，因为它查找时使用任意的 immutable 键而非整数。

collections.abc.Sequence 抽象基类定义了一个更丰富的接口，它在 __getitem__() 和 __len__() 之外又添加了 count(), index(), __contains__() 和 __reversed__()。实现此扩展接口的类型可以使用 register() 来显式地注册。

【immutable（不可变）官方定义https://docs.python.org/zh-cn/3/glossary.html#term-immutable

具有固定值的对象。不可变对象包括数字、字符串和元组。这样的对象不能被改变。如果必须存储一个不同的值，则必须创建新的对象。它们在需要常量哈希值的地方起着重要作用，例如作为字典中的键。】

序列有着相同的访问模式，它们的每一个元素可以通过指定一个偏移量的方式得到。而多个元素可以通过切片操作的方式一次得到。序列是 Python 中最基本的数据结构。序列中的每个元素都分配一个索引，及其在序列中的位置，第一个索引是0，第二个索引是1，依此类推。序列都可以进行的操作包括索引，切片，加，乘，检查成员等。

序列类型操作符

序列类型的操作符主要有如下几种，按照优先级从高到底的顺序排列：

seq[ind] 获得下标为 ind 的元素

seq[ind1:ind2] 获得下标从 ind1 到 ind2 间的元素集合

seq * expr 序列重复 expr 次

seq1 + seq2 连接序列 seq1 和 seq2

obj in seq 判断 obj 元素是否包含在 seq 中

obj not in seq 判断 obj 元素是否不包含在 seq 中

成员关系操作符 (in, not in)

成员关系操作符用于判断一个元素是否属于一个序列。比如对字符串类型来说，就是判断一个字符是否属于这个字符串，对和元组类型来说，就代表了一个对象是否属于该对象序列。in/not in 操作符的返回值一般来讲就是 True/False，满足成员关系就返回 True，否则返回 False。该操作符的语法如下：

obj [not] in sequence

连接操作符( + )

连接操作符用于把一个序列和另一个相同类型的序列做连接，语法如下:

sequence1 + sequence2

该表达式的结果是一个包含 sequence1 和 sequence2 的内容的新序列。但是这个操作不是最快或者说最有效的。对字符串来说，这个操作不如把所有的子字符串放到一个列表或可迭代对象中，然后调用一个 join 方法来把所有的内容连接在一起节约内存；类似地，对列表来说，我们推荐读者用列表类型的 extend() 方法来把两个或者多个列表对象合并.当你需要简单地把两个对象的内容合并，或者说不能依赖于可变对象的那些没有返回值（实际上它返回一个 None）的内建方法来完成的时候时，连接操作符还是很方便的一个选择。

重复操作符 ( * )

当你需要需要一个序列的多份拷贝时，重复操作符非常有用，它的语法如下：

sequence * copies_int

copies_int 必须是一个整数（不能是长整数）。像连接操作符一样，该操作符返回一个新的包含多份原对象拷贝的对象。

切片操作符 ( [], [:], [::] )

简单地讲，所谓序列类型就是包含一些顺序排列的对象的一个结构。序列的访问方式类似于其他高级语言的数组，访问某一个元素时，可以通过使用方括号[ ]指定下标来实现，其语法如下：

sequence[index]

Python 序列的访问还可以通过用 : 来访问某一区间的元素，这就是所谓的切片，其语法如下:

sequence[starting_index:ending_index]

通过这种方式可以得到从起始索引到结束索引之间的一”片”元素。需要注意的是，切片操作的区间是前闭后开的，也就是结束索引对应的元素不包含在切片所选的元素内。

序列还可以用步长索引来进行扩展的切片操作，即 [::]，它多出来的第三个索引值被用做步长参数。如：

序列类型内建函数

类型转换

内建函数 list(),str()和 tuple()被用做在各种序列类型之间转换。这类似于其他语言里的类型转换，但是并没有进行任何的转换。这些转换实际上是工厂函数，将对象作为参数，并将其内容(浅)拷贝到新生成的对象中。因为一个 Python 的对象被建立，就不能更改其身份或类型。所谓浅拷贝就是只拷贝了对对象的索引,而不是重新建立了一个对象！序列类型的转换函数如下：

list(iter) 把可迭代对象转换为列表

str(obj) 把 obj 对象转换成字符串(对象的字符串表示法)

unicode(obj) 把对象转换成 Unicode 字符串(使用默认编码)

basestring() 抽象工厂函数,其作用仅仅是为 str 和 unicode 函数提供父类，所以不能被实例化,也不能被调用

tuple(iter) 把一个可迭代对象转换成一个元组对象

序列操作（Operational）

Python 为序列类型提供以下可操作：

enumerate(iter)

接受一个可迭代对象作为参数,返回一个 enumerate 对象(同时也是一个迭代器),该对象生成由 iter 每个元素的 index 值和 item 值组成的元组

len(seq)

返回 seq 的长度

max(iter,key=None) or max(arg0,arg1…,key=None)

返回 iter 或(arg0,arg1,…)中的最大值,如果指定了 key,这个 key 必须是一个可以传给 sort()方法的,用于比较的回调函数

min(iter, key=None) or min(arg0, arg1…. key=None)

返回 iter 里面的最小值;或者返回(arg0,arg2,…)里面的最小值;如果指定了 key,这个 key 必须是一个可以传给sort()方法的,用于比较的回调函数

reversed(seq)

接受一个序列作为参数,返回一个以逆序访问的迭代器

sorted(iter, func=None, key=None, reverse=False)

接受一个可迭代对象作为参数,返回一个有序的列表;可选参数func,key 和 reverse 的含义跟 list.sort()内建函数的参数含义一样

sum(seq, init=0)

返回 seq 和可选参数 init 的总和 , 其效果等同于reduce(operator.add,seq,init)

zip([it0, it1,… itN])

返回一个列表,其第一个元素是 it0,it1,…这些元素的第一个元素组成的一个元组,第二个…,类推

以上所列函数中len(),reversed()和 sum()函数只能接受序列类型对象作为参数,而剩下的则还可以接受可迭代对象做为参数,另外,max() 和 min()函数也可以接受一个参数列表。

cmp() 函数

cmp() 函数用于比较两个对象x和y，如果x < y ,返回负数；x == y, 返回0；x > y,返回正数。但是该函数只有在python2中可用，在python3中该函数已经被废弃。所以在比较对象时，可以直接用比较运算符。在 Python3 中页出现了替代 cmp 的函数，即 lt、le、eq、ne、ge、gt：

lt(a, b) 相当于 a < b

le(a,b) 相当于 a <= b

eq(a,b) 相当于 a == b

ne(a,b) 相当于 a != b

gt(a,b) 相当于 a > b

ge(a, b)相当于 a>= b

待续

码农公寓

python序列

相关文章