Python_day04

字符串_unicode字符集_三种创建字符串方式_len()

字符串

字符串基本特点
  • 字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但是,我们可以将字符串一部分复制到新创建的字符串中,达到“看起来修改”的效果。

  • Python不支持单字符类型,单字符也是作为一个字符串使用的。

字符串的编码
  • Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。

  • 使用内置函数 ord()可以把字符串转换成对应的Unicode编码的子集。

  • 使用内置函数chr()可以把十进制数字转换成对应的字符。
    (注:本质上就是将数字和字符对应起来,和C语言中的ASCII编码类似,只不过这里Unicode编码更丰富而已。)

>>>ord(‘A’)
65
>>>ord(‘高’)
39640
>>>chr(66)
‘B’
>>>ord(‘淇’)
28103

引号创建字符串

我们可以通过单引号或者双引号创建字符串。例如:a=’abc’ b=”python”

  • 使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。
    例如:
>>>a=”teacher”
>>>print(a)
teacher
>>>b=’name is “tom”’
>>>print(b)
name is “tom”
  • 连续三个单引号或者三个双引号,可以帮助我们创建多行字符串
    例如:
>>>resume=’’’ name=”gaoqi”
company=”sxt” age=18
lover=”tom” ’’’
>>>print(resume)
name=”gaoqi”
company=”sxt” age=18
lover=”tom”

空字符串和len()函数

  • Python允许空字符串存在,不包含任何字符且长度为0。
    例如:
>>>c=’’
>>>len(c)
0
  • len()用于计算字符串含有多少字符。
    例如:
>>>str=’abcdef’
>>>len(str)
6

字符串_转义字符_字符串拼接_字符串复制_input()

转义字符

我们可以使用“/ + 特殊字符”,实现某些难以用字符表示的效果。比如:换行等。
常见转义字符有:

转义字符 描述
|(在行尾时) 续行符
\ 反斜杠符号
\’ 单引号
\” 双引号
\b 退格(Backspace)
\n 换行
\t 横向制表符
\r 回车

【操作】测试转义字符的使用

>>>a=’I\nlove\nU’
>>>a
‘I\nlove\nU’
>>>print(a)
I
love
U

续行符\

>>>print(‘aabbcc\
ccddee’)
aabbccccddee

【操作】使用原始字符串输出的技巧

>>>c=’c:\aa\bb.mp4’
>>>c
‘c:\x07a\x08b.mp4’
>>>c=’\c:\\aa\\bb.mp4’
>>>c
‘\\c:\\aa\\bb.mp4’
>>>c=r’c:\aa\bb.mp4’
>>>c
‘c:\\aa\\bb.mp4’

字符串拼接

  • 可以使用+将多个字符串拼接起来。
    例如:‘aa’+’bb’==>’aabb’
  1. 如果两边都是字符串,则拼接
  2. 如果两边都是数字,则加法运算
  3. 如果两边类型不同,则抛出异常
  • 可以将多个字面字符串直接放到一起实现拼接。例如:‘aa’ ’bb’==>’aabb’

【操作】字符串拼接操作

>>>a=’sxt’+’gaoqi’
>>>a
‘sxtgaoqi’
>>>b=’sxt’’gaoqi’
>>>b
‘sxtgaoqi’

字符串复制

使用*可以实现字符串复制。

【操作】字符串复制操作

>>>a=’sxt’*3
>>>a
‘sxtsxtsxt’

不换行打印

我们前面调用print函数时,会自动打印一个换行符。有时,我们并不想进行换行,不想它自动添加换行符。这时我们可以通过参数end=“任意字符串”。实现末尾添加任何内容:

>>>print(‘sxt’,end=’’)
>>>print(‘sxt’,end=’##’)
>>>print(‘sxt’)
sxtsxt##sxt

(注:end使得以任意字符串结尾,而不是默认的以换行符结尾)

从控制台读取字符串

我们可以使用input()函数从控制台读取键盘输入的内容。

>>>myname=input(‘请输入名字:’)
请输入名字:Liuan
>>>myname
‘Liuan’

字符串_str()_使用[]提取字符_replace()替换生成新字符串_内存分析

str()实现数字转为字符串

  • str()可以帮我们将其他类型数据转换为字符串。例如:
    str(5.20)==>‘5.20’ str(3.14e2)==>’314.0’ str(True)==>’True’

  • 当我们调用print()函数时,解释器自动调用str()将非字符串的对象转成了字符串。我们在面向对象章节中详细介绍。

使用[]提取字符

  • 字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
  1. 正向搜索:
    最左侧第一个字符,偏移量为0,第二个偏移量为1,以此类推。直到len(str)-1为止。
  2. 反向搜索:
    最右侧第一个字符,偏移量为-1,倒数第二个偏移量为-2,以此类推。直到-len(str)为止。

【操作】使用[]提取字符串中的字符

>>>a=’abcdefghijklmnopqrstuvwxyz’
>>>a
‘abcdefghijklmnopqrstuvwxyz’
>>>a[0]
‘a’
>>>a[3]
‘d'
>>>a[26-1]
‘z'
>>>a[-1]
‘z'
>>>a[-26]
‘a'

(注:像一把刻度尺。以第一个字符为0刻度,往左为负,往右为正)

replace()实现字符串替换

字符串是不可改变的(比如定义一个字符串str=’abc’,str[0]=’z’是错误的,python会抛出一个Error)

但是我们有时候确实需要替换某些字符。这时,只能通过创建新的字符串来实现。

>>>a=’abcdefghijklmnopqrstuvwxyz’
>>>a
‘abcdefghijklmnopqrstuvwxyz’
>>>a=a.replace(‘c’,’安’)
>>>a
‘ab安defghijklmnopqrstuvwxyz’
>>>a='abcdefghijklmnopqrstuvwxyz'
>>>print(a)
abcdefghijklmnopqrstuvwxyz
>>>len(a)
26
>>>b=a.replace('c','安')
>>>print(b)
ab安defghijklmnopqrstuvwxyz
>>>len(a);len(b)
26
26
>>>c=a.replace('c','刘安')
>>>print(c)
ab刘安defghijklmnopqrstuvwxyz
>>>len(c)
27

整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串。内存图见下:
Python_day04

字符串_切片slice操作_逆序

字符串切片slice操作

切片slice操作可以让我们快速的截取字符串。标准格式为:
[起始偏移量start:终止偏移量end:步长step]

  1. 典型操作(三个量为正数的情况下
    Python_day04

  2. 其他操作(三个量为负数的情况下):

示例 说明 结果
‘abcdefghijklmnopqrstuvwxyz’[-3:] 倒数三个 ‘xyz’
‘abcdefghijklmnopqrstuvwxyz’[-8:-3] 倒数第八个到倒数第三个(不包括倒数第三个) ‘stuvw’
‘abcdefghijklmnopqrstuvwxyz’[::-1] 步长为负,从右往左反向提取 ‘zyxwvutsrqponmllkjihgfedcba’
  • 切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]范围内,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成长度-1。
    例如:
>>>’abcdefg’[3:50]
‘defg’

我们发现正常输出结果,没有报错。

【操作】

  1. 将“to be or not to be”逆序输出

  2. 将’sxtsxtsxtsxt’字符串中所有s输出
    (Tips:用[::-1]和设置step步长分别实现)

上一篇:Day04 人机交互input


下一篇:Day04