python中常用模块详解二

2021-12-18 01:54:45

log模块的讲解

 Python 使用logging模块记录日志涉及四个主要类，使用官方文档中的概括最为合适：

 logger提供了应用程序可以直接使用的接口API；

 handler将(logger创建的)日志记录发送到合适的目的输出；

 formatter决定日志记录的最终输出格式

 filter提供了细度设备来决定输出哪条日志记录；

 logger

 每个程序在输出信息之前都要获得一个Logger。Logger通常对应了程序的模块名，

 比如聊天工具的图形界面模块可以这样获得它的Logger：LOG=logging.getLogger(”chat.gui”)

 还可以绑定handler和filters

 Logger.setLevel(lel):指定最低的日志级别，低于lel的级别将被忽略。debug是最低的内置级别，critical为最高

 Logger.addFilter(filt)、Logger.removeFilter(filt):添加或删除指定的filter

 Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)：增加或删除指定的handler

 每个Logger可以附加多个Handler。接下来我们就来介绍一些常用的Handler：

 logging.StreamHandler 使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。

 logging.FileHandler 和StreamHandler 类似，用于向一个文件输出日志信息。不过FileHandler会帮你打开这个文件

 logging.handlers.RotatingFileHandler

 这个Handler类似于上面的FileHandler，但是它可以管理文件大小。

 当文件达到一定大小之后，它会自动将当前日志文件改名，然后创建 一个新的同名日志文件继续输出。

 比如日志文件是chat.log。当chat.log达到指定的大小之后，

 RotatingFileHandler自动把 文件改名为chat.log.1。

 不过，如果chat.log.1已经存在，会先把chat.log.1重命名为chat.log.2。。。

 最后重新创建 chat.log，继续输出日志信息。

 函数格式： RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]])  maxBytes最大长度 backupCount保留的文件个数

 logging.handlers.TimedRotatingFileHandler

 这个Handler和RotatingFileHandler类似，不过，它没有通过判断文件大小来决定何时重新创建日志文件，

 而是间隔一定时间就 自动创建新的日志文件。重命名的过程与RotatingFileHandler类似，

 不过新的文件不是附加数字，而是当前时间。

 它的函数是：TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]])

                                         when=“S” 秒计算 interveal间隔 backupCount保留的文件个数

 S 秒   M 分   H 小时   D天   W  每星期（interval==0时代表星期一）midnight 每天凌晨

 formatter 组件

 日志的formatter是个独立的组件，可以跟handler组合

 fh = logging.FileHandler("access.log")

 formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')

 fh.setFormatter(formatter) #把formmater绑定到fh上

 如果你想对日志内容进行过滤，就可自定义一个filter

 class IgnoreBackupLogFilter(logging.Filter):

     """忽略带db backup 的日志"""

     def filter(self, record): #固定写法

         return   "db backup" not in record.getMessage()

 # 注意filter函数会返加True or False，logger根据此值决定是否输出此日志

 # 然后把这个filter添加到logger中

 # logger.addFilter(IgnoreBackupLogFilter())

说明解析

import logging

from logging import handlers

# 设置一个输出到屏幕上的handler

log_p_handler = logging.StreamHandler()

# 定义一个输入文件的handler

log_f_handler = logging.FileHandler("xx.log", encoding="utf8")

# 这个是那日志截断的例子，按照长度截断

log_f_handler_1 = handlers.RotatingFileHandler("xxx.log", maxBytes=10, backupCount=2, encoding="utf8")

log_f_handler_1.setLevel(logging.WARNING)

log_f_handler.setLevel(logging.WARNING)  # 给出入到文件的handler定义一个日志级别

log_p_handler.setLevel(logging.INFO)  # 给出入到屏幕的handler定义一个日志级别

fm_p = logging.Formatter("%(asctime)s-%(levelname)s->%(message)s", datefmt="%Y-%m-%d %I:%M:%S")  # 定义两个格式

fm_f = logging.Formatter("%(asctime)s-%(filename)s-%(levelname)s->%(message)s", datefmt="%Y-%m-%d %I:%M:%S")

# 把格式分别加到 对用的handler中

log_f_handler.setFormatter(fm_f)

log_f_handler_1.setFormatter(fm_f)

log_p_handler.setFormatter(fm_p)

log = logging.getLogger("test")  # 生成一个log接口

# 将自己定义的handler 加到log中

log.addHandler(log_p_handler)

log.addHandler(log_f_handler)

log.addHandler(log_f_handler_1)

# 设置log全局的日志级别  如果不设置  则默认WARNING级别

log.setLevel(logging.INFO)

log.info("info log")

log.warning("warn log")

log.debug("debug log")

subproess模块提供统一的模块来实现对系统命令或脚本的调用

# 三种执行命令的方法

# subprocess.run(*popenargs, input=None, timeout=None, check=False, **kwargs) #官方推荐

# subprocess.call(*popenargs, timeout=None, **kwargs) #跟上面实现的内容差不多，另一种写法

# #subprocess.Popen() #上面各种方法的底层封装

# run的标准写法

import subprocess

subprocess.run(['df', '-h'], stderr=subprocess.PIPE, stdout=subprocess.PIPE, check=True)

# 参数解析：['df','-h'] 列表 执行命令 subprocess 会拼接起来  stdout 标准输出=PIPE管道符 check  检查TRUE则报错

# 此外还可以跟shell=TRUE  这样就可以直接写命令 ：

subprocess.run('df -h|grep disk1', shell=True)  # shell=True的意思是这条命令直接交给系统去执行，不需要python负责解析

# 执行命令，返回命令执行状态 ， 0 or 非0

retcode = subprocess.call(["ls", "-l"])

# 执行命令，如果命令结果为0，就正常返回，否则抛异常

subprocess.check_call(["ls", "-l"])

# 0

# 接收字符串格式命令，返回元组形式，第1个元素是执行状态，第2个是命令结果

subprocess.getstatusoutput('ls /bin/ls')

# (0, '/bin/ls')

# 接收字符串格式命令，并返回结果

subprocess.getoutput('ls /bin/ls')

# '/bin/ls'

# 执行命令，并返回结果，注意是返回结果，不是打印，下例结果返回给res

res = subprocess.check_output(['ls', '-l'])

# res= b'total 0\ndrwxr-xr-x 12 alex staff 408 Nov 2 11:05 OldBoyCRM\n'

# Popen   不会等待命令执行返回结果 而是返回一个句柄 a调用poll()方法可以检测a的指定状态

a = subprocess.Popen('sleep 10', shell=True, stdout=subprocess.PIPE)

#这里还有其他方法  就不一一赘述了

# a.wait()  a.kill()  a.pid()

# a.send_signal()  a.terminate()

hashlib：用于加密相关的操作，代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法

import hashlib

# 用于加密相关的操作，3.x里代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法

m=hashlib.md5()

m.update(bytes("我", encoding="utf8"))

m.update(b'it is me ')

print("二进制", m.digest())

print("十六进制", m.hexdigest())

#以上加密算法虽然依然非常厉害，但时候存在缺陷，即：通过撞库可以反解。所以，有必要对加密算法中添加自定义key再来做加密。

print("".center(50,"*"))

m1=hashlib.md5(bytes("生成时加密",encoding="utf8"))

m1.update(bytes("我", encoding="utf8"))

m1.update(b'it is me ')

print("二进制", m.digest())

print("十六进制", m.hexdigest())

re模块：正则表达式就是字符串的匹配规则，在多数编程语言里都有相应的支持，python里对应的模块是re

'.'     默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行

# '^'     匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)

# '$'     匹配字符结尾， 若指定flags MULTILINE ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1

# '*'     匹配*号前的字符0次或多次， re.search('a*','aaaabac')  结果'aaaa'

# '+'     匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']

# '?'     匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次

# '{m}'   匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group()  匹配到'bbb'

# '{n,m}' 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']

# '|'     匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'

# '(...)' 分组匹配， re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'

#

#

# '\A'    只从字符开头匹配，re.search("\Aabc","alexabc") 是匹配不到的，相当于re.match('abc',"alexabc") 或^

# '\Z'    匹配字符结尾，同$

# '\d'    匹配数字0-9

# '\D'    匹配非数字

# '\w'    匹配[A-Za-z0-9]

# '\W'    匹配非[A-Za-z0-9]

# 's'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'

#

# '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city")

#  结果{'province': '3714', 'city': '81', 'birthday': '1993'}

模式详解

import re

s = 'ab23cd121rf'

res=re.match("[0-9]",s) #从头开始匹配  匹配一个就结束

print(res)

res = re.search("[0-9]{2}", s)  # 从全部的字符匹配  匹配一个就结束

print(res)  # 对象 取里面的值则为group  没有则报错，那结果之前需要判断

if res:

    print(res.group())

else:

    print("none!")

print(re.findall("[0-9]", s))  # 匹配所有 符合 就 把它放在列表

print(re.search(".", "aaa"))  # 从开头一直找 找到 任意字符返回

print(re.search("^a", "aaa"))  # 相当于match('a')

print(re.search("^ab", "abaab"))  # 相当于match('a')

print(re.search("ab+$", "abaabb"))  # 从最后开始找。以abb(多个b)结尾的

print(re.search("[a|A]lex","alexAlex"))   #自己的理解就是拿着alex

 #或 Alex在字符里面找  找到一个满足就可以

print(re.search("[a|A]lex","aaAlex"))

s = '120980199612098769'

#必须是字符匹配

print(re.search("(\d{6})(\d{4})(\d{4})",s).groups())

#分组匹配的装逼

print(re.search("(?P<province>\d{6})(?P<year>\d{4})(?P<mothon>\d{4})", s).groupdict())

f = open("联系方式.txt", encoding="gbk")

data = f.read()

print(data)

f.close()

res = re.findall("(1\d{10})", data)  # 手机号码

print(res)

s = "alex22jack22rain33"

print(re.split("\d", s))  # 按照一种格式分割

print(re.split("\d+", s))

s1 = "alex22jack22rain33#mock-oldboy"

print(re.split("\d+|#|-", s1))

# 所给字符全部匹配成功则返回字符否则为0

# print(re.fullmatch('\w+@\w+\.(com|cn|edu)',"alex@oldboyedu.cn"))

# 模糊找到需要匹配的字符替换

print(re.sub("[\d+|#|-]", "_", s1))

s = '9-2*5/3+7/3*99/4*2998+10*568/14'

# print(re.split('[\*\-/+]',s))   #转义需要\ 来表达

print(re.split('[\*\-/+]', s, maxsplit=2))  # 转义需要\ 来表达 maxsplit 匹配前几个之后停止匹配

# ['9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14']

码农公寓

hashlib：用于加密相关的操作，代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法

相关文章