《Python基础教程(第二版)》学习笔记 -> 第十章 充电时刻 之 标准库

SYS


  sys这个模块让你能够访问与Python解释器联系紧密的变量和函数,下面是一些sys模块中重要的函数和变量:

函数和变量 描述
argv   命令行参数,包括脚本和名称
exit([arg])                退出当前的程序,可选参数为给定的返回值或者错误信息
modules 映射模块名字到载入模块的字典
path 查找模块所在目录的目录名列表
platform 平台标识符
stdin 标准输入流-- 一个类文件对象
stdout 标准输出流-- 一个类文件对象
stderr   标准错误流-- 一个类文件对象

OS


  OS模块为你提供了访问多个操作系统服务的功能。

OS模块中一些重要函数和变量
函数和变量 描述
environ             对环境变量进行映射
system(command) 在子shell中执行操作系统命令
sep   路径中的分隔符
pathsep 分割路径的分隔符
linesep 行分隔符(\n、\r、\r\n)
urandom(n) 返回n字节的加密强随机数据

fileinput


  fileinput模块让你能够轻松地遍历文件的所有行。

fileinput模块中重要的函数
函数   描述
input([files[,inplace[,backup]]]) 便于遍历多个输入流中的行
filename() 返回当前文件的名称
lineno() 返回当前(累计)的行数
filelineno() 返回当前文件的行数
isfirstline() 检查当前行是否是文件的第一行
isstdin() 检查最后一行是否来自sys.stdin
nextfile() 关闭当前文件,移动到下一个文件
close() 关闭序列

集合、堆和双堆队列


  1. 集合
    集合是有序列(或者其他可迭代的对象)构建的。它们主要用于检查成员资格,因此副本是被忽略的:
    >>> set([0,1,2,3,0,1,2,3])
    set([0, 1, 2, 3])

    和字典一样,集合元素的顺序是随意的,因此我们不应该以元素的顺序作为依据进行编程:

    >>> set(['e','r','t'])
    set(['r', 'e', 't'])

    求两个集合的并集:

    >>> a = set([1,2,3])
    >>> b = set([2,3,4])
    >>> a.union(b)
    set([1, 2, 3, 4])
    >>> a|b
    set([1, 2, 3, 4])

  2. 堆(heap)是优先队列的一种,使用优先队列能够以任意顺序增加对象,并且能在任何时间找到最小的元素,也就是说它比用于列表的min方法要有效得多。
    Python中并没有独立的堆类型--只有一个包含一些堆操作的函数模块,这个模块叫做heapq,包括6个函数,前四个直接和堆操作相关。你必须将列表作为堆对象本身。
    heapq模块中重要的函数
    函数   描述
    heappush(heap,x) 将x入堆
    heappop(heap) 将堆中最小的元素弹出
    heapify(heap) 将heap属性强制应用到任意一个列表
    heapreplace(heap,x) 将堆中最小的元素弹出,同事将x入堆
    nlargest(n,iter) 返回iter中第n大的元素
    nsmallest(m,iter) 返回iter中第n小的元素

    heappush函数用于增加堆的项。

    >>> from heapq import *
    >>> from random import shuffle
    >>> data = range(10)
    >>> shuffle(data)
    >>> heap = []
    >>> for n in data:
        heappush(heap,n)
    
    >>> heap
    [0, 4, 1, 5, 7, 3, 2, 9, 6, 8]
    >>> heappush(heap,0.5)
    >>> heap
    [0, 0.5, 1, 5, 4, 3, 2, 9, 6, 8, 7]

    heappop函数弹出最小的元素-- 一般来说都是在索引0出的元素,并且会确保生育元素中最小的那个占据这个位置。

    >>> heappop(heap)
    0
    >>> heappop(heap)
    0.5
    >>> heap
    [1, 4, 2, 5, 7, 3, 8, 9, 6]

    heapify函数使用任意列表作为参数,并且通过尽可能少的移位操作,将其转换为合法的堆。

    >>> heap = [5,3,4,7,9,8,]
    >>> heapify(heap)
    >>> heap
    [3, 5, 4, 7, 9, 8]

    heapreplace函数不想其他函数那么常用,它弹出堆的最小元素,并且将新元素推入。

    >>> heap = [5,3,4,7,9,8,]
    >>> heapreplace(heap,0.5)
    3
    >>> heap
    [0.5, 5, 4, 7, 9, 8]
  3. 双端队列(以及其他集合类型)
    双端队列(Double-ended queue,或称deque)在需要按照元素增加的顺序来移除元素时非常有用。
    双端队列通过可迭代对象(比如集合)创建,而且有些非常有用的方法,如下例所示:
    >>> from collections import deque
    >>> q = deque(range(5))
    >>> q.append(5)
    >>> q.appendleft(6)
    >>> q
    deque([6, 0, 1, 2, 3, 4, 5])
    >>> q.pop()
    5
    >>> q.popleft()
    6
    >>> q.rotate(3)
    >>> q
    deque([2, 3, 4, 0, 1])
    >>> q.rotate(-1)
    >>> q
    deque([3, 4, 0, 1, 2])

    双端队列好用的原因是它能够有效地在开头增加和弹出元素。

Time


  time模块所包括的函数能够实现以下功能:获得当前时间、操作时间和日期、从字符串读取时间以及格式化时间为字符串。

  函数time.asctime()将当前时间格式化为字符串:  

>>> import time
>>> time.asctime()
'Mon Apr 28 15:22:24 2014'
time模块中重要的函数
函数 描述
asctime([tuple]) 将时间元组转换为字符串
localtime([secs]) 将描述转换为日期元组,以本地时间为准
mktime(tuple) 将时间元组转换为本地时间
sleep(secs) 休眠 secs秒
strptime(string[,format]) 将字符串解析为时间元组
time() 当前时间

random


  random模块包括返回随机数的函数,可以用于模拟或者用于任何产生随机输出的程序。

random模块中的一些重要函数
函数 描述
random() 返回0≤n<1之间的随机实数,其中0<n≤1
getrandbits(n) 以长整型形式返回n个随机位
uniform(a,b) 返回随机实数n,其中a≤n<b
randrange([start],stop,[step]) 返回range(start,stop,step)中的随机数
choice(seq) 从序列seq中返回随意元素
shuffle(seq[,random]) 原地制定序列seq
sample(seq,n) 从序列seq中选择n个随机切独立的元素

shelve


简单的存储方案 P188

re


  1. 什么是正则表达式
    正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通的字符串,可以匹配其*身。
    · 通配符
    正则表达式可以匹配多余一个字符串,你可以使用一些特殊字符创建这类模式。比如点号(.)可以匹配任何字符(除了换行符),所以正则表达式‘.ython’可以匹配字符串'python'和‘jython’格式字符串

    · 对特殊字符串进行转义
    'python\\.org'可以匹配'python.org'

    · 字符集
    你可以使用中括号括住字符串来创建字符集。字符集可以匹配它所包括的任意字符,所以'[pj]ython'能匹配'python'和'jython',而非其他内容。
    为了反转字符集,可以在开头使用^字符,比如'[^abc]'可以匹配任何除了a、b和c之外的字符。

    · 选择符和子模式
    匹配'python'和'perl',可以写成'python|perl',或者'p(ython|erl)'
    括号括起来的部分,称为子模式。

    · 可选项和重复子模式
    在子模式后面加上问号,它就变成了可选项。它可能出现在匹配字符串中,但并非必须的。例如,下面模式:
    r'(http://)?(www\.)?python\.org'
    只能匹配下列字符串:
    'http://www.python.org'
    ‘http://python.org'
    ’www.python.org'
    ’python.org'

  2. re模块的内容
    re模块中一些重要的函数
    函数 描述
    compile(pattern[,flags]) 根据包含正则表达式的字符串创建模式对象
    search(pattern.string[,flags]) 在字符串中寻找模式
    match(pattern,string[,flags]) 在字符串的开始处匹配模式
    split(pattern,string[,maxsplit=0]) 更具模式的匹配项来分割字符串
    findall(pattern,string) 列出字符串中模式的所有匹配项
    sub(pat,repl,string[,count=0]) 将字符串中所有的pat的匹配项用repl替换
    excape(string) 将字符串中所有特殊正则表达式字符转义

(未完待续)

上一篇:阿里云生活物联网平台3.0发布,助力智能家电“中国造、全球卖”


下一篇:ES5-ES6-ES7_let关键字声明变量