python的散列类型与字符编码

文章目录

  • 一、 初识散列类型(无序序列)
  • 二、认识集合
    • 集合的方法
  • 二、认识字典
    • 字典方法
    • 声明空变量
  • 三、字符编码元组名=() #声明一个空元组

在这里插入图片描述

一、 初识散列类型(无序序列)

数据类型分为3种:
python的序列类型有好几种,之前的博文讲到了两种类型
1.数值类型:int/float/bool 只能存储单个数据

2.序列类型:str/list/tuple,有序的存储多个数据–有序类型 有下标 可以进行索引,切片,步长的操作

散列类型:集合/字典
1.可以存放多个数据
2.内部是无序的(没有下标)
3.内部数据不重复

二、认识集合

集合(set):
表示形式为:用{}大括号包裹起来的数据,里面的数据用逗号隔开
集合的特性:主要是用来进行去重和逻辑判断
1.唯一性
2.无序性

语法:
集合名={数据1,数据2,数据3,…}

语法:

room={'夏洛特','狂魔张三','刘金连','勇哥随便学','玖玖归壹'}
print(room)
print(type(room)) #<class 'set'>

num={1,5,6,7,8,9,1,5,6,2}
print(num) #正常输出一个集合,里面重复元素自动去除 代表集合的唯一性
#print(num[4]) #报错 因为集合是无序类型 没有下标

集合可以进行简单的逻辑运算 交并差集
集合1&集合2–>获取交集–一个数据,两个集合里都有它
集合1|集合2–>获取并集–>两个集合里的所有数据(去重)
集合1-集合2–>获取差集–两个集合之间,自己独有的数据

符号输入
& --> shift + 7
| --> shift +
- --> 减号

生活例子:
现在有两个碗
碗A:{花菜,鸡肉,凤爪}
碗B:{鸡肉,豆腐,梅菜}
交集–>两个碗里都有的菜–>鸡肉
并集–>两个碗里所有的菜–>花菜,鸡肉,凤爪,豆腐,梅菜
差集–>碗A-碗B–>碗A独有的菜 花菜,凤爪
碗B-碗A–> 碗B独有的菜 豆腐,梅菜

num1={1,2,3}
num2={3,4,5}
print(num1&num2) #交集{3}
print(num1|num2) #并集{1, 2, 3, 4, 5}
print(num1-num2) #差集{1, 2}
print(num2-num1) #差集{4, 5}

集合里可以放很多数据(不能放列表)
集合里只能放不可变数据!!!
demo={'你好',55,9.9,True,(12,3),[12,3]}
# print(demo) #不能放列表,会报错

集合的本质:
1.存储非重复数据–>去重
2.进行逻辑判断,进行交并差集运算

集合的方法

add: 添加一个数据到集合里

集合.add(数据)
	room.add('好好学习')#随机 因为是无序所以随机增加
	print(room) 

update: 把一个序列类型打散后添加到集合里

集合.update(序列数据)
	room.update('天天向上') #打散添加,打散后cc重复的内容会自动去重
	print(room)

pop: 删除一个数据(随机删除)

集合.pop()
room.pop()
print(room)

remove: 删除指定的数据

集合.remove(数据)
room.remove('1024程序员节')
print(room)

clear:清除所有数据

集合.clear()
room.clear() #set()空集合
print(room)

二、认识字典

字典(dict)
表示形式为:用大括号{}包裹起来的数据,存储数据是以键值对的方式来存储,数据之间用逗号隔开,主要存储一些带有’说明性质’的数据
键值对: 左边是键 中间冒号 右边是值
key:value–>键相当于名字,值就是数据

键名一般是用字符串或整型来表示
值里面什么都可以放,放变量,函数,杂七杂八都可以

声明语法:

字典名={:,:}
	info={'国家':'中国','年龄':75}
    info={
        '国家':'中国',
        '年龄':75
    }
    #国家=中国,年龄=75 
    #这里的字典的作用是一个说明效果,方便理解,有一个好的可读性

用字典类型保存数据的有一点好处:比起用列表/元组存储数据, 他看起来更加清晰
info={‘中国’,75} #这里的一些数据如果不加注释,可能不清楚表示的是什么东西
所以如果要的数据,有明显的对照关系,就可以用字典来保存,看起来也更加的清晰明了

字典的输出:

print(字典名)
print(info)
print(type(info)) #<class 'dict'>
print(字典名[键名])#输出指定键的值
print(info['国家']) #输出值,中国

字典的特性:
1.字典是通过键值对的方式来获取数据,而不是通过下标索引获取
2.字典里的键是不可变的,只能使用数字,字符串或者元组,不能使用列表

day=(2,3)
food={
	1:'肉',
	'水果':'葡萄',
	day:'打折'
}
print(food)

# info2={
#     [1,2]:'伊诺'
# }
#print(info2) #报错,键不可以放列表

3.字典里的键值是可以修改的,还可以嵌套(字典里还可以放个字典)

info3={
	'国家':'中国',
	'地址':{1:'工作地址XXX',2:'家乡地址XXX'}
}
print(info3)

总结:用一个看起来更清晰的方式来保存数据,保存方式为键值对可以把键值对理解为变量 键就是变量名,值就是变量值

字典方法

info={
    '国家':'中国',
    '年龄':75
}

setdefault: 给字典添加一个键值对. 如果已经有这个键了.就不会新增。
1.新增一个键,没有写值,值默认为空

字典.setdefault(键名)
	info.setdefault('身高') #没有写值,值默认为空 None
	print(info)

2.新增一个键值对

字典.setdefault(键名,)
	info.setdefault('家乡','湖南')
	print(info)

pop: 通过键名删除指定的数据

字典.pop(键名)
	info.pop('年龄') #删除年龄这一个键值对
	print(info)

popitem: 删除一个键值对,从最后一个数据开始删

字典.popitem()
	info.popitem()
	print(info)

clear: 清除整个字典

字典.clear()
	info.clear() #{} 空字典
	print(info)

update: 以键值对的方式修改数据.如果没有就新增

1.修改键的值

字典.update({:})
	info.update({'国家':'中国'})
	print(info)

2.如果没有这个键值对.就转为新增

字典.update({:})
	info.update({'毕业学校':'XX学校'})
	print(info)

3.增加多个键值对

字典.update({:,:})
	info.update({'职业':'讲师','性别':'女'})
	print(info) 

字典[键名]=值 #修改指定键的值,键是存在的情况下,会将原来的值进行修改,否则添加新的键值对

info['国家']='俄罗斯' #找到info里面的性别,把值改为俄罗斯
info['生肖']='鸡' #也算是一个新增方法,创建新的键值对
print(info)

字典跟集合一样是无序序列,所以是无法通过下标进行获取数据,但是字典有查询数据的方法,但是查询的方法依旧也需要加print包裹输出

get: 通过键名,获取值. 如果没有这个键,输出None

字典.get(键名)
   	print(info.get('余额'))
	print(info.get('籍贯')) #没有籍贯这个键值对,输出None

keys: 获取所有的键

字典.keys()
  	print(info.keys())

values: 获取所有的值

字典.values()
 	print(info.values())

items: 获取所有的键值对

字典.items()
	print(info.items())

声明空变量

列表名=[] #声明一个空列表
元组名=() #声明一个空元组
字符串名=‘’ #声明一个空字符串
字典名={} #声明一个空字典
集合名=set() #声明一个空集合

三、字符编码元组名=() #声明一个空元组

计算机语言最底层是由0和1组成,计算机是怎么做到把一堆的0和1变成我们看到的字–>字符编码–>在计算机里面有一个翻译工具,作用就是把机器码数据转换为人类看懂的字

字符编码–翻译工具–把计算机的东西翻译成人类能理解的东西

第一套字符编码叫ascii码,里面收纳了一些常用符号,数字,字母–>没有中文和其他语言
ascii码表用法有点类似于字典–>每个字在表里都有一个对应的序号,可以通过序号找到字,也可以通过字找到序号

后面很多国家 地区都自己研发了一套字符编码
中国研发出GBK编码–>有两万多个汉字
同时间中国*–>BIG5,大五码.繁体字

每个国家的语言不同,所以只显示自己国家的文字
用别的国家软件就很容易出现问题
#就比如说如果用GBK写的内容用BIG5码打开就可能会乱码不通用 看不懂

针对这个问题,有个国际组织,专门收集了全世界大部分国家的语言文字,汇总做了一个大的字典并推行使用,以后统一用大字典就可以尽量避免乱码–>utf-8

核心点:
1.目前世界上最主流的编码是utf-8,#大部分默认用utf-8
2.一个程序是用什么编码写的,你就要用对应的编码去读取,否则会出现乱码问题

在程序每个字都是有对应的序号
ord(字符)-->通过字符,找到序号
chr(序号)-->通过序号,找到字符

print(ord('A'))
print(chr(66))
print('a'>'b')
上一篇:globalAlpha:深入解析Canvas中的全局透明度


下一篇:Python闭包和修饰器