Python的基本数据类型2

2024-02-27 14:38:33

1、str（字符串）

　　1、切片

str = "你好，我是Python"

s = str[0:4]    #用法[start:end:step]，指定开始下标和结束下标，step是步长，默认是1，可以不指定
#包括开头的下标，但是不包括结尾的下标，所以结果是：你好，我

　　2、字符串相关方法

str = "ok，你好，我是Python，我包括123456789，还包括abcdefghijklmnopQRstuvwxyz"

str.capitalize()    #首字母大写，其他都小写
str.upper()        #字母全部转大写
str.lower()        #全部字母转小写
str.swapcase()    #大小写转换
str.title()        #被字符隔开的首字母大写
str.center(90,"*")    #将str居中，字符串拉长到90，其他字符补*
str.strip()        #去左右两端空格
str.lstrip()    #去左边的空格
str.rstrip()    #去右边的空格
str.strip("abc")    #去左右两端的abc
str.replace("123","哈哈")    #替换字符串,还可以指定替换的个数用法：replace("","",2)
str.split(",")    #以逗号分割字符串

　　3、字符串查找的方法

str = "ok，你好，我是Python，我包括123456789，还包括abcdefghijklmnopQRstuvwxyz"

str.startswith("o")    #查询是否以o开头，返回True或False
str.endswith("z")    #查询是否以z结尾，返回True或False
str.count("o")    #查询o出现的次数
str.find("n")    #查询n第一次出现的位置，没有返回-1
str.find("n",8,12)    #切片查询n第一次出现的位置，没有返回-1
str.index("n")    #查询n的索引位置，和find用法结果相同，但是找不到会报错

　　4、字符串条件判断

str = "ok，你好，我是Python，我包括123456789，还包括abcdefghijklmnopQRstuvwxyz"

str.isalnum()    #是否有字母和数字组成，只要含字母就为True
str.isalpha()    #是否有字母组成，只要含字母就为True
str.isdigit()    #是否有数字构成，不含小数点

len(str)    #计算字符串的长度

2、字符串的编码以及常量池

　　1、is和==的区别

s = 'alex'
print(id(s)) # 4326667072
s1 = "alex"
print(id(s1)) # 4326667072
print(s == s1)    #True

lst = [1, 2, 4]
print(id(lst)) # 4326685768
lst1 = [1, 2, 4]
print(id(lst1)) # 4326684360
print(lst == lst1)    #True

#首先id是比较内存地址，==比较的是值
#其次str和int都是在常量池中，所以他的内存地址都相同，但是list不在常量池中，所以他的内存地址不相同

　　2、编码

1. ASCII : 最早的编码. ⾥里里⾯面有英⽂文⼤大写字⺟母, ⼩小写字⺟母, 数字, ⼀一些特殊字符. 没有中⽂文,
8个01代码, 8个bit, 1个byte
2. GBK: 中⽂文国标码, ⾥里里⾯面包含了了ASCII编码和中⽂文常⽤用编码. 16个bit, 2个byte
3. UNICODE: 万国码, ⾥里里⾯面包含了了全世界所有国家⽂文字的编码. 32个bit, 4个byte, 包含了了
ASCII
4. UTF-8: 可变⻓长度的万国码. 是unicode的⼀一种实现. 最⼩小字符占8位

　　　　2.1、字符串串在传输时转化成bytes=> encode(字符集)来完成

s = "alex"
print(s.encode("utf-8")) # 将字符串串编码成UTF-8
print(s.encode("GBK")) # 将字符串串编码成GBK
结果:
b'alex'
b'alex'

s = "中"
print(s.encode("UTF-8")) # 中⽂文编码成UTF-8
print(s.encode("GBK")) # 中⽂文编码成GBK
结果:
b'\xe4\xb8\xad'
b'\xd6\xd0'

#英文编码之后的结果和源字符串一致. 中文编码之后的结果根据编码的不同.

　　　　2.2、那么在对方接收的时候. 也是接收的bytes类型的数据. 我们可以使用decode()来进行解码操作. 把bytes类型的数据还原回我们熟悉的字符串:

s = bs.decode("GBK") # 解码
# 然后需要进⾏行行重新编码成UTF-8
bss = s.encode("UTF-8") # 重新编码

3、深拷贝和浅拷贝

　　1、浅拷贝

lst1 = ["何炅", "杜海涛","周渝民"]
lst2 = lst1.copy()
lst1.append("李嘉诚")
print(lst1)
print(lst2)
print(id(lst1), id(lst2))
结果:
两个lst完全不一样. 内存地址和内容也不一样. 发现实现了内存的拷贝

lst1 = ["何炅", "杜海涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = lst1.copy()
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
4417248328 4417248328

#经过上面的方法，我们可以看出，浅拷贝只能拷贝最外一层的，如果拷贝深层的，就是直接指定内存地址了，不再是拷贝内容了

　　2、深拷贝

import copy
lst1 = ["何炅", "杜海涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = copy.deepcopy(lst1)
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅']]
4447221448 4447233800

#都不一样了. 深度拷贝. 把元素内部的元素完全进行拷贝复制. 不会产生一个改变另一个跟着改变的问题

码农公寓

1、str（字符串）

2、字符串的编码以及常量池

3、深拷贝和浅拷贝

相关文章