python学习笔记(5-1)-基本数据类型-字符串类型及操作

五、字符串处理函数

 len(x):字符串x的长度。如len("12345")结果为5

 str(x):任意类型x所对应的字符串形式。

>>> str(123)
'123'
>>> str([1,2])
'[1, 2]'

 hex(x)或oct(x):整数x的十六进制或八进制小写形式字符串。

 chr(x):x为Unicode编码,返回其对应的字符

  ord(x):x为字符,返回其对应的Unicode编码。Unicode编码,即统一字符编码,即覆盖几乎所有字符的编码方式(包括各个国家不同语言的不同字符,将不同语言同一起来,有一套对应的统一编码),从0到0x10FFFF空间大小,即从0到1114111个字符编码,每个编码对应一个字符,python字符串中的每个字符都是Unicode编码字符。我们看一些有趣的例子:

>>> "1+1 = 2" + chr(10004)
'1+1 = 2✔'
这里对号对应的unicode编码为10004
>> "金牛星座符号的unicode值是:" + str(ord("♉"))
'金牛星座符号的unicode值是:9801'
>>> for i in range(12):
print(chr(9800 + i), end="")
♈♉♊♋♌♍♎♏♐♑♒♓
这里要注意这个end="",加上它,表示字符不换行,否则会换行。
>>> for i in range(3):
print(chr(9800 + i))


六、字符串处理方法

str.lower()或者str.upper():返回字符串的副本,全部字符小写或大写

>>> "ABCdsf".lower()
'abcdsf'
>>> "abcECF".upper()
'ABCECF'

str.split(sep=None):返回一个列表,由str根据sep被分隔的部分组成,返回为一个列表类型

>>> "A,B,C,D,E,F,".split(",")
['A', 'B', 'C', 'D', 'E', 'F', '']

str.count(sub):返回子串sub在str中出现的次数

>>> "what day is it today".count("a")
3

str.replace(old,new):返回字符串str副本,所有old子串被替换为new

>>> "abc".replace("a","what")
'whatbc'

str.center(width[,fillchar]):字符串str根据宽度width居中,fillchar可选,为填充的字符。默认填充空格

>>> "python".center(20)
' python '
>>> "python".center(20,"-")
'-------python-------'

str.strip(chars):从str中去掉在其左侧和右侧chars中列出的字符

>>> "*:audit-2-7-5.x86.rpm".strip("*:.x86rpm")
'audit-2-7-5'

str.join(iter):在iter变量除最后元素外每个元素后增加一个str

>>> ",".join("12345")
'1,2,3,4,5'

七、字符串类型的格式化

<模板字符串>.format(<逗号分隔的参数>)

我们把将要格式话的字符串用{}槽来表示,按照默认顺序来进行格式化,从0开始,也可以自己定义格式化的顺序,如下:

>>> "{}:CPU{}的CPU占用率为{}%".format("log", 1, 20)
'log:CPU1的CPU占用率为20%'
>>> "{1}:CPU{0}的CPU占用率为{2}%".format(1,"log",20)
'log:CPU1的CPU占用率为20%'

format方法的格式控制

:<填充><对齐><宽度><,><.精度><类型>

:为引导符号,对应format中的第几个参数,如果为空,表示按顺序对应,从0开始;

<填充>用于填充的单个字符;<对齐>对齐方式,<左对齐  >右对齐  ^居中对齐;<宽度>槽设定的输出宽度;前面三个为字符串的操作,主要是用来排版对齐,这种对齐填充方式,对于排版来说非常方便有用。format中的参数为数字也是可以的。

>>> "{:=^20}".format("python")
'=======python======='
>>> "{:*<20}python".format("BIT")
'BIT*****************python'
>>> "{:10}".format("BIT") ‘'''默认填充空格'''
'BIT '
>>> "{:<<10}".format("BIT") '''第一个参数为填充,第二个为对齐方式'''
'BIT<<<<<<<'

<,>数字的千位分隔符;<.精度>浮点数或小数精度或字符串最大输出长度;<类型>整数类型:b,c,d,o,x,X  浮点数类型:e,E,f,% ; 后面三个为数字的操作,我们看一些列子:

>>> "{:,.2f}".format(12345.456)
'12,345.46'
>>> "{0:b}, {0:c}, {0:d}, {0:o}, {0:x}, {1:X}".format(, )
'110101001, Ʃ, 425, 651, 1a9, 1AA' '''分别对应,二进制,字符,十进制,八进制,十六机制小写,十六进制大写'''
>>> "{0:e}, {0:E}, {0:f}, {0:%}".format(3.14)
'3.140000e+00, 3.140000E+00, 3.140000, 314.000000%' '''最后一个为 输出百分号形式'''

当宽度为变量时,可以以槽来表示,看如下这个例子,输出为以*组成的等边三角形。

#test4.py
n=int(input())
for i in range(n+)[::]:
print("{: ^{}}".format("*"*i,n))

结果为

  *
***
*****
上一篇:shell脚本学习积累笔记(第一篇)


下一篇:day29 python 套接字socket TCP udp 形式发送信息的区别