数据类型
引子
- 什么是数据?
x=10, 10 是我们要存储的数据 - 为啥数据要分不同的类型
数据是用来表示状态的,不同的状态就应该用不同的类型的数据去表示 - 数据类型
数字(整形,长整型,浮点型,复数)
字符串
字节串:在介绍字符编码时介绍字节 bytes 类型
列表
元祖
字典
集合 - 按照以下几个点展开数据类型的学习
- 基本使用
(1) 用途
(2) 定义方式
(3) 常用操作+内置的方法 - 该类型总结
(1) 存一个值或存多个值
(2) 有序或无序
(3) 可变或不可变
!!! 可变:值变,id不变。可变==不可 hash
!!! 不可变:值变,id就变。不可变==可 hash
- 基本使用
数字
整形与浮点型
- 整形 int
作用:年纪,等级,身份证号,qq号等整形数字相关
定义:
age=10 # 本质 age=int(10) - 浮点型 float
作用:薪资,身高,体重,体质参数等浮点数相关
salary=3000.3 # 本质 salary=float(3000.3) - 二进制,十进制,八进制,十六进制
其他数字类型(了解)
-
长整型
在python2中(python3中没有长整形的概念)1
2
3>>> num=2L
>>> type(num)
<type 'long'> -
复数
1
2
3
4
5>>> x=1-2j
>>> x.real
1.0
>>> x.imag
-2.0
字符串
作用:姓名,性别,国籍,地址等描述信息
定义:再单引号、双引号、三引号内,由一串字符组成
name=’egon’
-
优先掌握的操作:
- 按索引取值(正向取+反向取):只能取
- 切片(顾头不顾尾,步长)
- 长度 len
- 成员运算 in 和 not in
- 移除空白 strip
- 切分 split
- 循环
-
需要掌握的操作
- strip, lstrip, rstrip
- lower, upper
- startswith, endswith
- format 的三种用法
- split, rsplit
- join
- replace
- isdigit
示例
1 |
#strip |
-
其他操作
- find,rfind,index,rindex,count
- center,ljust,rjust,zfill
- expandtabs
- captalize,swapcase,title
- is数字系列
- is其他
示例
1 |
#find,rfind,index,rindex,count |
列表
作用:多个装备,多个爱好,多门课程,多个女朋友等
定义:[] 内可以有多个任意类型的值,逗号分隔
my_girl_friends=[‘alex’, ‘wupeiqi’, ‘yuanhao’, 4, 5] # 本质 my_girl_friends=list([])
或
l=list(‘abc’)
- 优先掌握的操作:
- 按索引存取值(正向存取+反向存取):即可存也可取
- 切片(顾头不顾尾,步长)
- 长度
- 成员运算 in 和 not in
- 追加
- 删除
- 循环
1 |
#ps:反向步长 |
元组
作用:存多个值,对比列表来说,元组不可变(是可以当做字典的 key 的),主要是用来读
定义:与列表类型比,只不过[]换成()
age=(11, 22, 33, 44, 55) # 本质 age=tuple((11, 22, 33, 44, 55))
- 优先掌握
- 安索引取值(正向取+反向取);只能取
- 切片(顾头不顾尾,步长)
- 长度
- 成员运算 in 和 not in
- 循环
字典
作用:存多个值,key-value 存取,取值速度快
定义:key 必须是不可变类型,value 可以是任意类型
1 |
info={'name':'egon','age':18,'sex':'male'} #本质info=dict({....}) |
- 优先掌握
- 按 key 存取值:可存可取
- 长度 len
- 成员运算 in 和 not in
- 删除
- 键 keys(), 值 values(), 键值对 items()
- 循环
集合
作用:
可变类型是不可hash类型
不可变类型是可hash类型
定义集合:
集合:可以包含多个元素,用逗号分隔
集合的元素遵循三个原则:
1. 每个元素必须是不可变类型(可 hash,可作为字典的 key)
2. 没有重复的元素
3. 无序
注意集合的目的是将不同的值存放在一起,不同的集合间用来做关系运算,无需纠结于集合中单个值
- 优先掌握的操作
- 长度 len
- 成员运算 in 和 not in
- |合集
- &交集
- -差集
- ^ 对称差集
- ==
- 父集:>,>=
- 子集:<,<=
数据类型总结
-
按存储空间的占用分(从高到低)
- 数字
- 字符串
- 集合:无序,即无需存索引相关信息
- 元组:有序,需要存索引相关信息,不可变
- 列表:有序,需要存索引相关信息,可变,需要处理数据的增删改
- 字典:无序,需要存key于value映射的相关信息,可变,需要处理数据的增删改
按存值个数区分
标量、原子类型 | 数字,字符串 |
---|---|
容器类型 | 列表、元祖、字典 |
- 按可变不可变区分
可变 | 列表、字典 |
---|---|
不可变 | 数字,字符串,元组 |
- 按访问顺序区分
直接访问 | 数字 |
---|---|
顺序访问(序列类型) | 字符串,列表,元组 |
key值访问(映射类型) | 字典 |
运算符
身份运算(is ,is not)
is比较的是id,而双等号比较的是值
毫无疑问,id若相同则值肯定相同,而值相同id则不一定相同
1 |
>>> x=1234567890 |