python-数据类型补充及文件处理操作

___数据类型____

一、列表的复制

浅复制和深复制

  浅复制只复制一层,深复制完全克隆,慎用

1、实现浅复制的三种方式:

name=['song','xiao','nan']
import copy
name1=copy.copy(name)#相当于列表中中 name1=name.copy()
name2=name[:]
name3=list(name)

浅复制的适用场合

person=['name',['saving',100]]
p1=person[:]
p2=person[:]
p1[0]='songxiaonan'
p2[0]='ying'
print(p1)
print(p2)
p1[1][1]=1000
print(p1)
print(p2)#因为是浅复制,所以在更改p1【1】【1】的时候,p2【1】【1】也会跟着更改

   2、深复制

name5=copy.deepcopy(name)

二、元组

  元组是不可变的,已经设定不可再更改,只能进行查询操作,别名“制度列表”、

  元组只有两种内置操作:index和count

name=('song','xiao')
print(name.count('song'))
print(name.index('xiao'))

  适用场合:写的程序希望存储的数据不能被更改,比如程序中数据库的连接信息,一旦被更改就会影响连接数据库,可以用元组来存储该信息

三、字典

  字典是无序的,是通过key来查找信息,不需要下标

定义字典:info={

       'stu1101':'song',

       'stu1102':'xiao',

         'stu1103':'nan',
}

'stu1101','stu1102','stu1103'代表key,冒号后面的是相应值

  字典的增删改查
#查询   2种方式
info[stu1101]#这种方式,如果指定的key不存在就会报错
info.get('stu1101')#如果key不存在,返回None,建议使用这种查询方法
#修改
info[stu1101]='lallalallalal'#如果key不存在,就会想字典中插入该key以及该key的值
#删除 2种方法
del info['stu1101']
info.pop('stu1101') #判断某key是否存在
‘stu1101’ in info 返回值true false

   字典其他用法

#打印字典所有的key(第一层key)
print(info.keys())
#打印字典所有值
print(info.vaules())
#将字典转换为列表
info.items()
#合并两个字典update
catalog2={
"stu1101":'song111',
1:3,
2:4
}
catalog2.update(info)#重复key更新,不重复的key,合并
print(catalog2) #setdfualt:如果字典中存在指定的key,这种使用原数据,如果不存在key,则插入一条新数据
info.setdefualt('*',{'wwww.*.com':[1,2]) #fromkeys:初始化一个新的字典
print(info.fromkeys([6,7,8]))#注意:3个key共享一个内存地址

  字典的循环

print(info)
for i in info:
print(i)# 以为字典是通过key来查询的,所以i代表的是key,打印出来的结果也只是key
for i in info:
print(i,info[i])#只打印值
for a,b in info.items():
print(a,b)#相比两种方法,上面的方法比价高效

____文件处理____

小知识点:

    shell的sed命令:逐行处理文件内容,并将结果输出到屏幕

         sed的替换命令:

sed  ‘s/abc/def/g’ file 把行内的所有abc替换成def,如果没有g,则只替换行内的第一个abc
sed  -n ‘s/abc/def/p’ file 只打印发生替换的那些行
sed  ‘s/abc/&def/’ file 在所有的abc后面添加def(&表示匹配的内容)
sed  -n ‘s/abc/def/gp’ file 把所有的abc替换成def,并打印发生替换的那些行
sed  ‘s#abc#def#g’ file 把所有的abc替换成def,跟在替换s后面的字符就是查找串和 
替换串之间的分割字符,本例中试#

  1、打开文件   (默认字符集为utf8)   

 f=open('file','r',encoding='utf-8')
#with 语句打开文件
with open('file','r',encoding='utf-8') as f,\
open('file2','w',encoding='utf-8') as f2:
............. #with 语句打开文件后,等with模块执行完毕,自动关闭文件,减少资源占用

  2、读取文件

f.read()#读取全部文件
f.readline()#逐行读取文件
f.readines()#读取全部文件,读取出来的文件为一个列表,每行是一个元素 #注意1:文件还能读取一遍,执行一次read()后,光标置在文件最后一行,不能回到首行,再次执行read()的时候,只能从文件最后位置往下读,所有第二次read(),返回结果为空 #注意2:read()读取方式是,将文件全部从硬盘写到内存后,再输出,如果文件比较大,则需要等一段时间才能看到但会的及结果,有一种边写边读的方法的:for line in f。。。。
for line in f:
print(line)
#这种方法读取文件的时候,读取一行删除一行,即内存中只存一行数据,适合大文件读取

  3、设置光标位置

f.tell() #打印目前光标所在位置    按字符计数
f.seek()#设置光标的返回位置 参数为0,将光标返回到文件开始位置
f.encoding#返回文件的字符编码
f.fileno()#返回文件句柄在内存中编号
f.readable()#判断文件是否可读
f.flush()#刷新文件
f.truncate()#截断文件,只有在文件在写属性的时候才可以使用,不加参数,默认清空文件

  4、写

b=open('file','w')
#w模式 创建一个新文件
# a模式 追加
b.write('sldksjfisdjisjoifd\n') #____________进度条________________
impory sys,time
for i in range(20):
sys.stdout.write('#')
sys.stdout.flush()
time.sleep(0.5)

  5、修改文件

#读写属性 r+   读并追加
file=open('file','r+',encoding='utf-8')
file.readline()
file.write('-----------------------------')
file.seek(0)
print(file.read())
#写读 w+ 先创建一个新文件 无卵用
#追加读 a+ #rb属性:以二进制模式读取文件 适用场合1 网络传输 2 打开视频文件
r=open('erjinzhiFile.py','rb')
#wb属性:写二进制文件
wb=open('erjinzhi','wb')
wb.write('songxiaonan song'.encode()) #写一个文件到一个新文件:一行一行的读取文件,边读边写,如果不是要修改的行,直接将该行写入到新文件,如果是要修改的行,修改完该行,再将该行写入到新文件中
#需要两个文件:源文件和新文件
#将文件中的‘12345678’换成‘000000000’
with open('file','f',encoding='utf-8') as f,\
open('filenew','w',encoding=‘utf-8’) as fnew:
for line in f:
if ‘12345678’ in line:
line=line.replace('','')
fnew.write(line
l

____集合____

  作用:去重和关系测试

   将列表转为集合后,就会自动去重

集合也是无序的

1、去重

name=[1,1,2,3,4,5,6,7,8,9,9,9,9,9,9]
name=set(name)

  2、关系测试

name1=[1,2,3,4,4,5,5,6,6,7,100]
name1=set(name1)
name2=set([2,3,4,9])
#交集
name1.intersection(name2)
#并集
name.union(name2)
#差集 name1有的 name2没有的
name1.difference(name2)
#判断是否是子集
name1.issubset(name2)
#判断是否是父集
name1.issuprset(name2)
#对称差集 交集取反
print(name1.symmetric_difference(name2))
#判断 是否没有交集 没有交集返回true 有交集返回False
print(name1.isdisjoint(name2))

运算符进行集合的关系测试

print(name1&name2)#交集
print(name1|name2)#并集
print(name1-name2)#差集
print(name1^name2)#对称差集

  3集合的方法

#增加
#集合中无插入,只有添加
name1.add(9999) #删除
name1.remove('song')#如果没有指定的字符串,报错
name1.discard('song')#如果没有指定的字符串,不报错 print(len(name1))#集合长度
1 in name1#1 是否咋 name1中

____字符编码和转码____

1、万国编码unicode,兼容gbk,utf-8等等,存一个英文和中文字符都占用2个字节16位,可以显示各个国家的语言

2、ASCII码,默认值占用一个字节8位,不能存储中文

3、为了解决浪费空间的问题,出现了另一个字符编码utf-8,是可变字符长,所有英文字符依然按照ASCII的总是存储,占用1个字节,中文字符占用3个字节

py3默认所有字符编码的unicode

要在py2使用中中文字符集,首先

#-*- coding:utf-8 -*-

name

name='绿萝植物'
name_to_unicode=name.decode('utf-8').encode('gbk')#decode 解码 encode编码

无论是在py2合适在py3,字符编码之间的转换都要先解码成unicode,再编码

上一篇:[LeetCode] 40. Combination Sum II 组合之和之二


下一篇:Java序列化相关