python序列
序列(sequence)官方定义(https://docs.python.org/zh-cn/3/glossary.html#term-sequence):
一种 iterable,它支持通过 __getitem__() 特殊方法来使用整数索引进行高效的元素访问,并定义了一个返回序列长度的 __len__() 方法。内置的序列类型有 list、str、tuple 和 bytes。注意虽然 dict 也支持 __getitem__() 和 __len__(),但它被认为属于映射而非序列,因为它查找时使用任意的 immutable 键而非整数。
collections.abc.Sequence 抽象基类定义了一个更丰富的接口,它在 __getitem__() 和 __len__() 之外又添加了 count(), index(), __contains__() 和 __reversed__()。 实现此扩展接口的类型可以使用 register() 来显式地注册。
【immutable(不可变)官方定义https://docs.python.org/zh-cn/3/glossary.html#term-immutable
具有固定值的对象。不可变对象包括数字、字符串和元组。这样的对象不能被改变。如果必须存储一个不同的值,则必须创建新的对象。它们在需要常量哈希值的地方起着重要作用,例如作为字典中的键。】
序列有着相同的访问模式,它们的每一个元素可以通过指定一个偏移量的方式得到。而多个元素可以通过切片操作的方式一次得到。序列是 Python 中最基本的数据结构。 序列中的每个元素都分配一个索引,及其在序列中的位置,第一个索引是0,第二个索引是1,依此类推。序列都可以进行的操作包括索引,切片,加,乘,检查成员等。
序列类型操作符
序列类型的操作符主要有如下几种,按照优先级从高到底的顺序排列:
seq[ind] 获得下标为 ind 的元素
seq[ind1:ind2] 获得下标从 ind1 到 ind2 间的元素集合
seq * expr 序列重复 expr 次
seq1 + seq2 连接序列 seq1 和 seq2
obj in seq 判断 obj 元素是否包含在 seq 中
obj not in seq 判断 obj 元素是否不包含在 seq 中
成员关系操作符 (in, not in)
成员关系操作符用于判断一个元素是否属于一个序列。比如对字符串类型来说,就是判断一个字符是否属于这个字符串,对和元组类型来说,就代表了一个对象是否属于该对象序列。in/not in 操作符的返回值一般来讲就是 True/False,满足成员关系就返回 True,否则返回 False。该操作符的语法如下:
obj [not] in sequence
连接操作符( + )
连接操作符用于把一个序列和另一个相同类型的序列做连接,语法如下:
sequence1 + sequence2
该表达式的结果是一个包含 sequence1 和 sequence2 的内容的新序列。但是这个操作不是最快或者说最有效的。对字符串来说,这个操作不如把所有的子字符串放到一个列表或可迭代对象中,然后调用一个 join 方法来把所有的内容连接在一起节约内存;类似地,对列表来说,我们推荐读者用列表类型的 extend() 方法来把两个或者多个列表对象合并.当你需要简单地把两个对象的内容合并, 或者说不能依赖于可变对象的那些没有返回值(实际上它返回一个 None)的内建方法来完成的时候时,连接操作符还是很方便的一个选择。
重复操作符 ( * )
当你需要需要一个序列的多份拷贝时,重复操作符非常有用,它的语法如下:
sequence * copies_int
copies_int 必须是一个整数(不能是长整数)。像连接操作符一样,该操作符返回一个新的包含多份原对象拷贝的对象。
切片操作符 ( [], [:], [::] )
简单地讲, 所谓序列类型就是包含一些顺序排列的对象的一个结构。序列的访问方式类似于其他高级语言的数组,访问某一个元素时,可以通过使用方括号[ ]指定下标来实现,其语法如下:
sequence[index]
Python 序列的访问还可以通过用 : 来访问某一区间的元素,这就是所谓的切片,其语法如下:
sequence[starting_index:ending_index]
通过这种方式可以得到从起始索引到结束索引之间的一”片”元素。需要注意的是,切片操作的区间是前闭后开的,也就是结束索引对应的元素不包含在切片所选的元素内。
序列还可以用步长索引来进行扩展的切片操作,即 [::],它多出来的第三个索引值被用做步长参数。如:
序列类型内建函数
类型转换
内建函数 list(),str()和 tuple()被用做在各种序列类型之间转换。这类似于其他语言里的类型转换,但是并没有进行任何的转换。这些转换实际上是工厂函数,将对象作为参数,并将其内容(浅)拷贝到新生成的对象中。因为一个 Python 的对象被建立,就不能更改其身份或类型。所谓浅拷贝就是只拷贝了对对象的索引,而不是重新建立了一个对象!序列类型的转换函数如下:
list(iter) 把可迭代对象转换为列表
str(obj) 把 obj 对象转换成字符串(对象的字符串表示法)
unicode(obj) 把对象转换成 Unicode 字符串(使用默认编码)
basestring() 抽象工厂函数,其作用仅仅是为 str 和 unicode 函数提供父类,所以不能被实例化,也不能被调用
tuple(iter) 把一个可迭代对象转换成一个元组对象
序列操作(Operational)
Python 为序列类型提供以下可操作:
enumerate(iter)
接受一个可迭代对象作为参数,返回一个 enumerate 对象(同时也是一个迭代器),该对象生成由 iter 每个元素的 index 值和 item 值组成的元组
len(seq)
返回 seq 的长度
max(iter,key=None) or max(arg0,arg1…,key=None)
返回 iter 或(arg0,arg1,…)中的最大值,如果指定了 key,这个 key 必须是一个可以传给 sort()方法的,用于比较的回调函数
min(iter, key=None) or min(arg0, arg1…. key=None)
返回 iter 里面的最小值;或者返回(arg0,arg2,…)里面的最小值;如果指定了 key,这个 key 必须是一个可以传给sort()方法的,用于比较的回调函数
reversed(seq)
接受一个序列作为参数,返回一个以逆序访问的迭代器
sorted(iter, func=None, key=None, reverse=False)
接受一个可迭代对象作为参数,返回一个有序的列表;可选参数func,key 和 reverse 的含义跟 list.sort()内建函数的参数含义一样
sum(seq, init=0)
返 回 seq 和 可 选 参 数 init 的 总 和 , 其 效 果 等 同 于reduce(operator.add,seq,init)
zip([it0, it1,… itN])
返回一个列表,其第一个元素是 it0,it1,…这些元素的第一个元素组成的一个元组,第二个…,类推
以上所列函数中len(),reversed()和 sum()函数只能接受序列类型对象作为参数,而剩下的则还可以接受可迭代对象做为参数,另外,max() 和 min()函数也可以接受一个参数列表。
cmp() 函数
cmp() 函数用于比较两个对象x和y,如果x < y ,返回负数;x == y, 返回0;x > y,返回正数。但是该函数只有在python2中可用,在python3中该函数已经被废弃。所以在比较对象时,可以直接用比较运算符。在 Python3 中页出现了替代 cmp 的函数,即 lt、le、eq、ne、ge、gt:
lt(a, b) 相当于 a < b
le(a,b) 相当于 a <= b
eq(a,b) 相当于 a == b
ne(a,b) 相当于 a != b
gt(a,b) 相当于 a > b
ge(a, b)相当于 a>= b
待续