基础数据类型
基础数据类型,有7种类型,存在即合理。
1.int 整数
主要是做运算的 。比如加减乘除,幂,取余 + - * / ** %...
2.bool布尔值
判断真假以及作为条件变量
3.str 字符串
存储少量的数据。‘太白’,'password'... 操作简单,便于传输。
4.list 列表[1,2,'alex',{name:'zhang'}]
存放大量的数据,大量的数据放到列表中便于操作
5.tuple 元组
也叫只读列表。(1,2,'alex',{name:'zhang'}) 一些重要的数据或者不想被更改的数据,使用元组
6.dict 字典{‘name_list’:'[zhang,lisi]'}
,存储关系型的数据,查询速度非常快,二分查找。
7.set 集合
交集,并集,差集...
分别举例
int整型
i = 4
#转化成二进制的最小位数
print(i.bit_length())
'''
1 0000 0001
1 0000 0010
3 0000 0011
4 0000 0100
'''
执行输出: 3
数据类型转换:int --> str:n = str(1)
执行输出: 1
int --> bool:n = bool(1)
执行输出: True
str --> bool:n = bool('')
执行输出: False
空字符串是False,其他都是True
str 字符串索引与切片
先讲索引
字符串是有序的,有索引的,索引从0开始,默认取值是从左至右
s = 'python是最好的语言'
#取第一个字符
s1 = s[0]
#取索引值为2的元素
s2 = s[2]
#最后一个
s3 = s[-1]
print(s1)
print(s2)
print(s3)
执行输出:
p
t
言
切片
语法: [起始索引:截止索引:步长]
步长默认为1,表示从头开始取
切片,也就是取连续的多个值
切片原则,顾头不顾尾
什么意思?举例说明
s = 'python是最好的语言'
s1 = s[0:2]
print(s1)
执行输出:
py
全取
s = 'python是最好的语言'
s1 = s[:]
print(s1)
执行输出:
python是最好的语言
切片会产生新的变量,在内存中,原字符串和切片后的字符串,是2个变量s4 = s[:]
虽然结果是一样的,但它是2个变量
对字符串操作,都会产生新的变量,除了赋值以外。
取最后5个字符串
s = 'python是最好的语言'
s1 = s[-5:]
print(s1)
执行输出:
最好的语言
步长
默认步长为1
隔一个取1个,步长为2
反向取值,也就是从后向前取,步长为-1
隔1个,取一个
s = 'python是最好的语言'
s1 = s[::2]
print(s1)
执行输出:
pto是好语
反向取5个
s = 'python是最好的语言'
s1 = s[:-5:-1]
print(s1)
执行输出:
言语的好
反向全取
s = 'python是最好的语言'
s1 = s[::-1]
print(s1)
执行输出:
言语的好最是nohtyp
字符串常用操作方法
capitalize()
首字母大写,其他字母小写
s = 'laoshi'
s1 = s.capitalize()
print(s1)
执行输出:
Laoshi
upper()
全部大写、lower()
全部小写
s = 'laoshi'
s1 = s.upper()
s2 = s.lower()
print(s1)
print(s2)
执行输出:
LAOSHI
laoshi
比如验证码判断功能
code = 'aeQu'
your_code = input('请输入验证码:')
if your_code == 'aequ' or your_code == 'Aequ'...
如果不使用字符串内置方法,这需要写16个if,代码质量非常low
下面使用字符串内置方法
code = 'aeQu'
your_code = input('请输入验证码:')
if your_code.upper() == code.upper():
print('验证码验证成功')
执行输出:
代码优化一下
code = 'aeQu'.upper()
your_code = input('请输入验证码:').upper()
if your_code == code:
print('验证码验证成功')
center()
居中
s = 'laoshi'
#总宽度为30,并且字符串居中,不足30,默认用空格填充
s1 = s.center(30)
#使用*填充
s2 = s.center(30,'*')
print(s1)
print(s2)
执行输出:
如果宽度小于字符串,按照原来的字符串显示
s = 'laoshi'
s1 = s.center(3)
print(s1)
执行输出:
laoshi
swapcase()
大小写反转
s = 'LaoShi'
s1 = s.swapcase()
print(s1)
执行输出:
lAOsHI
title()
每个单词的首字母大写(非字母隔开)
s = 'xiao wusir*nanhai21shui'
s1 = s.title()
print(s1)
执行输出:Xiao Wusir*Nanhai21Shui
startswith()
判断以什么为开头,endswith()
以什么为结尾
startswith 的start和end参数是切片如果想取到最后,end参数,不需要指定。
s = 'xiao wusir*nanhai21shui'
s1 = s.startswith('a')
s2 = s.endswith('i')
#切片,取索引访问1~4,再判断是否以i开头
s3 = s.startswith('i',1,4)
#切片,取索引范围5~结束,结束位置参数没给,默认一直取到尾
s4 = s.startswith('w',5)
print(s1)
print(s2)
print(s3)
print(s4)
执行输出:
False
True
True
True
strip()
去除首尾的空格,换行符(\n),tab键(4个空格 用\t表示)
s = '\nlaoshi\t '
s1 = s.strip()
print(s1)
执行输出: laoshi
在input程序中,会经常使用
name = input('请输入用户名:')
if name == 'xiao':
print('ok')
如果用户输入的,不小心包含了空格,会导致验证失败
下面加入strip()
即使输入有空格,也可以验证通过
name = input('请输入用户名:').strip()
if name == 'xiao':
print('ok')
执行输出:
后续操作文件读取一行内容的时候,也会带有换行符,虽然你看不见,使用strip(),就可以去除了类似功能的2个的方法
lstrip()
去除左边的空格、换行符、tab键rstrip()
去除右边的空格、换行符、tab键
strip()
还可以去除指定的字符串
s = 'laoshijintianzalill'
#去除字符串l
s1 = s.strip('l')
print(s1)
执行输出:aoshijintianzali
解释一下执行过程 ☻→ string ← ☻
strip()相当于 ☻,就像吃豆游戏一样。
strip()会同时向左右2边,挨个挨个字符寻找字符串l 如果发现了l,就去除,如果没有发现,终止寻找,最后输入结果比如头部的lao 找到了字符串l,开始删除。再继续找下一个字符a,发现不匹配,终止寻找同时,尾部的lill,找到l,开始删除。继续找下一个,找到l,删除。再继续下一个,发现字符串i,不匹配,终止寻找最终输出: aoshijintianzali
find()
通过元素找索引
还有一个函数index()
,也是同样的功能不同的是,index()
找不到,直接报错find()
找不到时,会返回-1
s = 'xiaoxx'
s1 = s.find('a')
s2 = s.index('a')
print(s1)
print(s2)
执行输出: 2
count()
寻找元素出现的个数,可切片
s = 'xiaomingtongxue'
s1 = s.count('x')
#从第5个索引一直到最后,寻找字符串o出现的次数
s2 = s.count('o',5)
print(s1)
print(s2)
执行输出:
2
1
replace()
替换
s = '我的老家在东北,东北有很多人'
#默认是全文替换
s1 = s.replace('东北','黑龙江')
#替换一次
s2 = s.replace('东北','黑龙江',1)
print(s1)
print(s2)
执行输出:
我的老家在黑龙江,黑龙江有很多人
我的老家在黑龙江,东北有很多人
替换,是从左至右的
如果想要替换中间某部分,需要用到正则表达式
split()
分割,将字符串转换为列表,默认按照空格分隔:
s = 'wo zai tai bei'
s1 = s.split()
print(s1)
执行输出:['wo', 'zai', 'tai', 'bei']
指定分割符
s = 'wo,zai,tai,bei'
s1 = s.split()
print(s1)
执行输出,效果同上
指定字符串a
s = 'awozaiataiabei'
s1 = s.split('a')
print(s1)
执行输出:['', 'woz', 'i', 't', 'i', 'bei']
注意:如果关键字左边没有字符串,那么结果为[],也就是空字符串
结果不包含关键字,被剔除了
比如面试题:
有下面一段日志,包含了IP地址和时间...需要切割日志
216.244.66.227,[20/Mar/2018:17:03:52 +0800],"Mozilla/5.0"
114.215.45.101,[20/Mar/2018:17:16:30 +0800],"BUbiNG"
106.11.152.107,[20/Mar/2018:17:22:40
+0800],"YisouSpider"
可以用正则表达式,但是比较麻烦,有没有更简单的办法呢?用split(),指定逗号分割,就可以实现
format()
格式化输出这个很牛逼,一定要重点掌握!有三种用法:
第一种用法:
s = '我叫{},今年{},爱好{}'.format('MT',18,'打怪')
print(s)
执行输出:
我叫MT,今年18,爱好打怪
{}表示一个占位符
isalnum()
字符串由字母或数字组成isalpha()
字符串只能由字母组成isdigit()
字符串只能由数字组成
name = 'jingsan123'
s1 = name.isalnum()
s2 = name.isalpha()
s3 = name.isdigit()
print(s1)
print(s2)
print(s3)
执行输出:
True
False
False
isdigit()
比较常用,比如判断用户输入的,是否是数字。
或者将字符串转换为数字类型时,要判断字符串是否由纯数字组成,否则报错。
name = '123a'
if name.isdigit():
name = int(name)
else:
print('您输入的含有非数字元素')
执行输出:
您输入的含有非数字元素
len()
查看数据的长度
name = 'zhangsan'
print(len(name))
执行输出: 8
for循环
先来使用while循环,打印每一个字符串
s = 'abcdef'
count = 0
while count < len(s):
print(s[count])
count += 1
执行输出:
a
b
c
d
e
f
使用for循环完成上面的功能
s = 'abcdef'
for i in s:
print(i)
执行程序,效果同上
for循环和while循环的区别在于
for 循环是有限循环
while 循环是无限循环
有些情况,在不需要终止条件的情况下,使用for循环
有终止条件的,使用while循环
for循环会自动停止 使用for循环实现九九乘法表:
for i in range(1, 10):
for j in range(1, i + 1):
print('{}x{}={}\t'.format(j, i, i * j), end='')
print('\n')
执行输出:
1x1=1
1x2=2 2x2=4
1x3=3 2x3=6 3x3=9
1x4=4 2x4=8 3x4=12 4x4=16
1x5=5 2x5=10 3x5=15 4x5=20 5x5=25
1x6=6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36
1x7=7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49
1x8=8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64
1x9=9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81
作业
有变量name = "aleX leNb" 完成如下操作:
1) 移除name变量对应的值两边的空格,并输出处理结果
2) 移除name变量左边的'al'并输出处理结果
3) 移除name变量右面的'Nb',并输出处理结果
4) 移除name变量开头的a'与最后的'b',并输出处理结果
name = "aleX leNb"
s1 = name.strip()
s2 = name.lstrip('al')
s3 = name.rstrip('Nb')
s4 = name.lstrip('a').rstrip('b')
print(s1)
print(s2)
print(s3)
print(s4)
5) 判断 name 变量是否以 "al" 开头,并输出结果
6) 判断name变量是否以"Nb"结尾,并输出结果
s5 = name.startswith('al')
s6 = name.endswith('Nb')
print(s5)
print(s6)
7) 将name变量对应的值中的 所有的"l" 替换为 "p",并输出结果
8) 将name变量对应的值中的第一个'l'替换成'p',并输出结果
s7 = name.replace('l','p')
s8 = name.replace('1','p',1)
print(s7)
print(s8)
9) 将 name 变量对应的值根据 所有的"l" 分割,并输出结果。
10) 将name变量对应的值根据第一个'l'分割,并输出结果。
s9 = name.split('l')
s10 = name.split('l',1)
print(s9)
print(s10)
11) 将 name 变量对应的值变大写,并输出结果
12) 将 name 变量对应的值变小写,并输出结果
s11 = name.upper()
s12 = name.lower()
print(s11)
print(s12)
13) 将name变量对应的值首字母'a'大写,并输出结果
14) 判断name变量对应的值字母'l'出现几次,并输出结果
15) 如果判断name变量对应的值前四位'l'出现几次,并输出结果
s13 = name.capitalize()
s14 = name.count('l')
s15 = name.count('l',4)
print(s13)
print(s14)
print(s15)
16) 从name变量对应的值中找到'N'对应的索引(如果找不到则报错),并输出结果
17) 从name变量对应的值中找到'N'对应的索引(如果找不到则返回-1)输出结果
18) 从name变量对应的值中找到'X le'对应的索引,并输出结果
s16 = name.index('N')
s17 = name.find('N')
s18 = name.find('X le')
print(s16)
print(s17)
print(s18)
19) 请输出 name 变量对应的值的第 2 个字符?
20) 请输出 name 变量对应的值的前 3 个字符?
21) 请输出 name 变量对应的值的后 2 个字符?
22) 请输出 name 变量对应的值中 "e" 所在索引位置?
s19 = name[2]
s20 = name[:3]
s21 = name[-2:]
s22 = name.find('e')
s23 = name[:-1:]
print(s19)
print(s20)
print(s21)
print(s22)
23)获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。
name = "oldboay"
#使用split对最后一个字符分割,并取第一个元素
s3 = name.split(name[-1])[0]
print(s3)
有字符串s = '123a4b5c'
1)通过对li列表的切片形成新的字符串s1,s1 = '123'
2)通过对li列表的切片形成新的字符串s2,s2 = 'a4b'
3)通过对li列表的切片形成新的字符串s3,s3 = '1345'
4)通过对li列表的切片形成字符串s4,s4 = '2ab'
5)通过对li列表的切片形成字符串s5,s5 = 'c'
6)通过对li列表的切片形成字符串s6,s6 = 'ba2'
s = '123a4b5c'
s1 = s[0:3]
s2 = s[3:6]
s3 = s[0]+s[2]+s[4]+s[6]
s4 = s[1]+s[3]+s[5]
s5 = s[-1]
s6 = s[5]+s[3]+s[1]
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)
使用while和for循环分别打印字符串s='asdfer'中每个元素。
s = 'asdfer'
count = 0
while count < len(s):
print(s[count])
count += 1
实现一个整数加法计算器(两个数相加):
如:content = input('请输入内容:') # 如用户输入:5+9或5+ 9或5 + 9,然后进行分割再进行计算。
content = input('请输入内容:')
num = content.split('+')
sum = 0
for i in num:
sum += int(i)
print(sum)
计算用户输入的内容中有几个整数(以个位数为单位)。
如:content = input('请输入内容:') # 如fhdal234slfh98769fjdla
count = 0
content = input('请输入内容:')
for i in content:
if i.isdigit():
count += 1
print(count)
集合
集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:
去重,把一个列表变成集合,就自动去重了。
关系测试,测试两组数据之前的交集、差集、并集等关系。
1.集合的创建
set1 = set({1,2,'barry'})
set2 = {1,2,'barry'}
print(set1,set2)
执行输出
{1, 2, 'barry'} {1, 2, 'barry'}
2.集合的增
set1 = {'alex','wusir','ritian','egon','barry'}
set1.add('景女神')
print(set1)
#update:迭代着增加
set1.update('A')
print(set1)
set1.update('老师')
print(set1)
set1.update([1,2,3])
print(set1)
执行输出:
{'wusir', 'egon', 'alex', 'ritian', 'barry', '景女神'}
{'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '景女神'}
{'老', 'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}
{'老', 'wusir', 1, 2, 3, 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}
3.集合的删
set1 = {'alex','wusir','ritian','egon','barry'}
set1.remove('alex') # 删除一个元素
print(set1)
set1.pop() # 随机删除一个元素
print(set1)
set1.clear() # 清空集合
print(set1)
del set1 # 删除集合
执行输出
{'ritian', 'wusir', 'egon', 'barry'}
{'wusir', 'egon', 'barry'}
set()
4.集合的其他操作:
交集。(& 或者 intersection)
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 & set2)
print(set1.intersection(set2))
执行输出:
{4, 5}
{4, 5}
并集。(| 或者 union)
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 | set2)
print(set2.union(set1))
执行输出
{1, 2, 3, 4, 5, 6, 7, 8}
{1, 2, 3, 4, 5, 6, 7, 8}
差集。(- 或者 difference)
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 - set2)
print(set1.difference(set2))
执行输出
{1, 2, 3}
{1, 2, 3}
反交集。 (^ 或者 symmetric_difference)
set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 ^ set2)
print(set1.symmetric_difference(set2))
执行输出
{1, 2, 3, 6, 7, 8}
{1, 2, 3, 6, 7, 8}
子集与超集
set1 = {1,2,3}
set2 = {1,2,3,4,5,6}
print(set1 < set2)
print(set1.issubset(set2)) # 这两个相同,都是说明set1是set2子集。
print(set2 > set1)
print(set2.issuperset(set1)) # 这两个相同,都是说明set2是set1超集。
frozenset不可变集合,让集合变成不可变类型。
s = frozenset('barry')
print(s,type(s))
执行输出
frozenset({'b', 'a', 'r', 'y'}) <class 'frozenset'>
深浅copy
1.先看赋值运算
l1 = [1,2,3,['barry','alex']]
l2 = l1
l1[0] = 111
print(l1)
print(l2)
l1[3][0] = 'wusir'
print(l1)
print(l2)
执行输出:
[111, 2, 3, ['barry', 'alex']]
[111, 2, 3, ['barry', 'alex']]
[111, 2, 3, ['wusir', 'alex']]
[111, 2, 3, ['wusir', 'alex']]
对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。
2.浅拷贝copy
l1 = [1,2,3,['barry','alex']]
l2 = l1.copy()
print(l1,id(l1))
print(l2,id(l2))
l1[1] = 222
print(l1,id(l1))
print(l2,id(l2))
l1[3][0] = 'wusir'
print(l1,id(l1[3]))
print(l2,id(l2[3]))
执行输出
[1, 2, 3, ['barry', 'alex']] 2200143751176
[1, 2, 3, ['barry', 'alex']] 2200143750920
[1, 222, 3, ['barry', 'alex']] 2200143751176
[1, 2, 3, ['barry', 'alex']] 2200143750920
[1, 222, 3, ['wusir', 'alex']] 2200143749768
[1, 2, 3, ['wusir', 'alex']] 2200143749768
对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。
3.深拷贝deepcopy
import copy
l1 = [1,2,3,['barry','alex']]
l2 = copy.deepcopy(l1)
print(l1,id(l1))
print(l2,id(l2))
l1[1] = 222
print(l1,id(l1))
print(l2,id(l2))
l1[3][0] = 'wusir'
print(l1,id(l1[3]))
print(l2,id(l2[3]))
执行输出
[1, 2, 3, ['barry', 'alex']] 1722671719688
[1, 2, 3, ['barry', 'alex']] 1722671719816
[1, 222, 3, ['barry', 'alex']] 1722671719688
[1, 2, 3, ['barry', 'alex']] 1722671719816
[1, 222, 3, ['wusir', 'alex']] 1722671720456
[1, 2, 3, ['barry', 'alex']] 1722671720200
对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。