Python基础5:列表 元祖 字典 集合 Json

[ 列表]

列表(list)是Python以及其他语言中最常用到的数据结构之一。Python使用使用中括号 [ ] 来解析列表。

列表是可变的(mutable)——即:可以改变列表的内容。

相关操作:

1 查([])

names_class2=['张三','李四','王五','赵六']

# print(names_class2[2])
# print(names_class2[0:3])
# print(names_class2[0:7])
# print(names_class2[-1])
# print(names_class2[2:3])
# print(names_class2[0:3:1])
# print(names_class2[3:0:-1])
# print(names_class2[:]) 

2 增(append,insert)

insert 方法用于将对象插入到列表中,而append方法则用于在列表末尾追加新的对象

names_class2.append('jesson')
names_class2.insert(2,'pitter')
print(names_class2)

 3 改(重新赋值)

names_class2=['张三','李四','王五','赵六']

names_class2[3]='赵七'
names_class2[0:2]=['jesson','pitter']
print(names_class2)

4 删(remove,del,pop)

names_class2.remove('jesson')
del names_class2[0]
del names_class2
names_class2.pop()#注意,pop有返回值 

5 其他操作

5.1  count

count 方法统计某个元素在列表中出现的次数:

>>> ['to', 'be', 'or', 'not', 'to', 'be'].count('to')
2
>>> x = [[1,2], 1, 1, [2, 1, [1, 2]]]
>>> x.count(1)
2
>>> x.count([1,2])
1

5.2 extend

extend 方法可以在列表的末尾一次性追加另一个序列中的多个值。

>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6]

    extend 方法修改了被扩展的列表,而原始的连接操作(+)则不然,它会返回一个全新的列表。

>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a.extend(b)
>>> a
[1, 2, 3, 4, 5, 6]
>>>
>>> a + b
[1, 2, 3, 4, 5, 6, 4, 5, 6]
>>> a
[1, 2, 3, 4, 5, 6]

5.3  index

index 方法用于从列表中找出某个值第一个匹配项的索引位置:

names_class2.index('李四')

5.4  reverse

reverse 方法将列表中的元素反向存放。

names_class2.reverse()
print(names_class2)

5.5  sort

sort 方法用于在原位置对列表进行排序。

x = [4, 6, 2, 1, 7, 9]
x.sort()#x.sort(reverse=True) 

注意:

列表中有个地方需要注意下,即Python在操作列表的时候,None数据类型 和 空‘ ’保存在列表中的时候,都是有效元素。

Python 3.5.2 (v3.5.2:4def2a2901a5,2016, 22:18:55) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> L = []
>>> L.append('')
>>> L
['']
>>> len(L) # 列表元素个数
1
>>> L.append(None)
>>> L
['', None]
>>> len(L)
2

5.6  列表的切片操作

Python2中可以直接用L=range(0,100)构造一个列表:[0,1,2,3,4,........,98,99]

python3中的构造方法有点区别:L = list(range(0,100))

可以通过切片轻松取出某一段数列。比如前10个数:

>>> L[:]
[, , , , , , , , , ]

后10个数:

>>> L[-:]
[, , , , , , , , , ]

前11-20个数:

>>> L[:]
[, , , , , , , , , ]

前10个数,每两个取一个:

>>> L[::]
[, , , , ]

所有数,每5个取一个:

>>> L[::]
[, , , , , , , , , , , , , , , , , , , ]

甚至什么都不写,只写[:]就可以原样复制一个list:

>>> L[:]
[, , , , ..., ]

tuple也是一种list,唯一区别是tuple不可变。因此,tuple也可以用切片操作,只是操作的结果仍是tuple:

>>> (, , , , , )[:]
(, , )

字符串'xxx'也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:

>>> 'ABCDEFG'[:]
'ABC'
>>> 'ABCDEFG'[::]
'ACEG'

[ tuple (元组) ]

元组被称为只读列表,即数据可以被查询,但不能被修改,所以,列表的切片操作同样适用于元组。

元组类似与列表,用逗号(,)来分隔存储的数据,与列表不同的是元组是不可变类型(immutable),列表可以任你插入或改变,而元组不行。所以,元组适用于你的数据是固定且不需改变的情形。从内存的角度来看,使用元组有一大好处是,Python可以明确地知道需要分配多少内存给元组(同样 Frozensets 也有这个好处)。

元组写在小括号(())里,元素之间用逗号隔开。

虽然tuple的元素不可改变,但它可以包含可变的对象,比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:

tup1 = ()    # 空元组
tup2 = (20,) # 元组中只有一个元素的时候,需要在元素后添加逗号,以消除歧义,避免解释器误解成数学计算意义上的括号。
# 这是因为括号()既可以表示tuple,又可以表示数学公式中的小括号,一个元素不加逗号,就产生了歧义。
Python规定,不加逗号情况下,按小括号进行计算,这里计算结果是20;
所以,只有1个元素的元组定义时,元素后边必须加一个逗号,,来消除歧义。
作用:
1 对于一些数据我们不想被修改,可以使用元组;

2 另外,元组的意义还在于,元组可以在映射(和集合的成员)中当作键使用——而列表则不行;元组作为很多内建函数和方法的返回值存在。

元组相关操作:

1 创建元组

tup1 = ('jesson', 'pitter', 1997, 2000);
tup2 = (1, 2, 3, 4, 5 );
tup3 = "a", "b", "c", "d"; print(tup1,type(tup1))
print(tup2,type(tup2))
print(tup3,type(tup3)) # 输出结果
# ('jesson', 'pitter', 1997, 2000) <class 'tuple'>
# (1, 2, 3, 4, 5) <class 'tuple'>
# ('a', 'b', 'c', 'd') <class 'tuple'>

元组与字符串类似,下标索引从0开始,可以进行截取,组合等。

2 访问元组

tup1 = ('jesson', 'pitter', 1997, 2000);
tup2 = (1, 2, 3, 4, 5, 6, 7 ); print ("tup1[0]是: ", tup1[0]) # 访问元组tup1的第一个元素
print ("tup2[1:5]是: ", tup2[1:5]) # 对元组tup2中的元素 从索引下标1开始到4 进行切片操作 # 输出结果:
# tup1[0]是: jesson
# tup2[1:5]是: (2, 3, 4, 5)

3 修改元组

元组中的元素值是不允许修改的,但我们可以对元组进行连接组合,如下实例:

tup1 = (12, 34.56);
tup2 = ('abc', 'xyz'); # tup1[0] = 100; # 这种修改元组元素操作是非法的,编译的时候会报错。
tup3 = tup1 + tup2; # 可以 创建一个新的元组
print(tup3) # 输出结果:
#(12, 34.56, 'abc', 'xyz')

4 删除元组

元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组。

tup = ('jesson', 'pitter',"你好",1997, 2000);
print(tup) del(tup)
print("执行del删除操作后的元组 tup:")
print(tup) # 以上实例元组被删除后,输出变量会有异常信息,输出如下所示:
# Traceback (most recent call last):
# File "J:/元组 tuple.py", line 51, in <module>
# print(tup)
# NameError: name 'tup' is not defined

5 元组运算符
   与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。

6 元组内置函数

Python元组包含了以下内置函数
1、cmp(tuple1, tuple2):比较两个元组元素。
2、len(tuple):计算元组元素个数。
3、max(tuple):返回元组中元素最大值。
4、min(tuple):返回元组中元素最小值。
5、tuple(seq):将列表转换为元组。

7 元组总结

tuple和list非常类似,但是tuple一旦初始化就不能修改;这样也就有了一个要求,就是:当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来。

既然元组是不能修改的,那么它的这种不可变性有什么意义?

因为tuple不可变,所以代码更安全;如果可能,能用tuple(元组)代替list(列表)就尽量用tuple。

[ Dictionary (字典) ]

字典是python中唯一的映射类型,采用键值对(key-value)的形式存储数据。python对key进行哈希函数运算,根据计算的结果决定value的存储地址,所以字典是无序存储的,且key必须是可哈希的。可哈希表示key必须是不可变类型,如:数字、字符串、元组。

字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。

创建字典:

dic1={'name':'jesson','age':26,'sex':'male'}
dic2=dict((('name','jesson'),))
print(dic1)
print(dic2)

相关操作:

1 增

dic3={}

dic3['name']='jesson'
dic3['age']=26
print(dic3)#{'name': 'jesson', 'age': 26} a=dic3.setdefault('name','pitter')
b=dic3.setdefault('ages',25)
print(a,b)
print(dic3)

2 查

dic3={'name': 'jesson', 'age': 26}

# print(dic3['name'])
# print(dic3['names'])
#
# print(dic3.get('age',False))
# print(dic3.get('ages',False)) print(dic3.items())
print(dic3.keys())
print(dic3.values()) print('name' in dic3)# py2: dic3.has_key('name')
print(list(dic3.values()))

3 改

dic3={'name': 'jesson', 'age': 26}
dic3['name']='pitter'
dic4={'sex':'male','hobby':'sports','age':26}
dic3.update(dic4)
print(dic3)

4 删

dic4={'name': 'jesson', 'age': 26,'class':1}

# dic4.clear()
# print(dic4)
del dic4['name']
print(dic4) a=dic4.popitem()
print(a,dic4) # print(dic4.pop('age'))
# print(dic4) # del dic4
# print(dic4)

5 字典其他操作以及涉及到的方法

5.1 dict.fromkeys

d1=dict.fromkeys(['host1','host2','host3'],'Mac')
print(d1) d1['host1']='jesson'
print(d1)
#######
d2=dict.fromkeys(['host1','host2','host3'],['Mac','huawei'])
print(d2)
d2['host1'][0]='jesson'
print(d2)

5.2  d.copy() 对字典 d 进行浅复制,返回一个和d有相同键值对的新字典

5.3 sorted(dict) : 返回一个有序的包含字典所有key的列表

dic={5:'',2:'',4:''}
print(sorted(dic)) 

5.4 d.get() 获取字典 d 中的相关值;

d = {'name':'jesson','age':''}
print(d['name']) # 输出结果:jesson 通过字典的键 获取对应值
print(d.get('name')) # 输出结果:jesson 通过get方法获取相应键的值 print(d.get('sex','male')) #输出结果:male # 字典的get()方法操作,如果字典中没有键(sex)
# 默认返回值是:none 这里可以在键"sex"后 添加默认值,比如:(male)
# 如果原字典中可以找到该键,就输出相应的值;如果找不到键,就输出添加的默认值。

5.5 字典的遍历

dic5={'name': 'jesson', 'age': 26}
# print(dic5.keys())
# print(dic5.values()) for i in dic5:
print(i, dic5[i])
#输出结果
# age 26
# name jesson for items in dic5.items():
print(items)
# 输出结果
# ('age', 26)
# ('name', 'jesson') for keys, values in dic5.items():
print('key:{},value:{}'.format(keys,values)) # Python两种字符串拼接方式 实现输出功能一样
print('key:%s,value:%s' %(keys, values))
# 输出结果
# age 26
# name jesson

5.6 通过字典来存取班级学生信息:

dic={'zhangsan':{'age':23,'sex':'male'},
'李四':{'age':33,'sex':'male'},
'王五':{'age':27,'sex':'women'}
}

5.7 update合并:

用法待补充

[ Set (集合) ]

把不同的元素组成一起形成集合,是python基本的数据类型。

集合元素(set elements):组成集合的成员(不可重复)

li=[1,2,'a','b']
s =set(li)
print(s) # {1, 2, 'a', 'b'} li2=[1,2,1,'a','a']
s=set(li2)
print(s) #{1, 2, 'a'}

集合对象是一组无序排列的可哈希的值:集合成员可以做字典的键

li=[[1,2],'a','b']
s =set(li) #TypeError: unhashable type: 'list'
print(s)

集合分类:可变集合、不可变集合

可变集合(set):可添加和删除元素,非可哈希的,不能用作字典的键,也不能做其他集合的元素

不可变集合(frozenset):与上面恰恰相反

li=[1,'a','b']
s =set(li)
dic={s:''} #TypeError: unhashable type: 'set'

集合相关操作:

1、创建集合

由于集合没有自己的语法格式,只能通过集合的工厂方法set()和frozenset()创建

s1 = set('jesson')
s2 = frozenset('pitter') print(s1,type(s1)) #{'l', 'v', 'i', 'a', 'n'} <class 'set'>
print(s2,type(s2)) #frozenset({'n', 'y', 'a', 'u'}) <class 'frozenset'>

2、访问集合

由于集合本身是无序的,所以不能为集合创建索引或切片操作,只能循环遍历或使用in、not in来访问或判断集合元素。

s1 = set('jesson')
print('a' in s1)
print('b' in s1)
# s1[1] #TypeError: 'set' object does not support indexing for i in s1:
print(i)

#输出结果:
False
False
s
j
n
o
e

3、更新集合

可使用以下内建方法来更新:

s.add()
s.update()
s.remove()

注意只有可变集合才能更新:

# s1 = frozenset('jesson')
# s1.add(0) #输出报错:AttributeError: 'frozenset' object has no attribute 'add' s2 = set('jesson') # s2.add('mm')
# print(s2) #输出结果: {'e', 'mm', 'o', 's', 'n', 'j'} # 注意:.add()和.update()的区别,两者都可以更新集合内元素,
但是.add()方法是把()中新值,当作整体去更新;而.update()方法是将()中的新值分开,单个,一个一个的添加更新。 # s2.update('HO') # 添加多个元素
# print(s2) #输出结果: {'j', 'o', 'n', 'e', 'H', 'O', 's'} # s2.remove('e')
# print(s2) #输出结果: {'j', 'o', 's', 'n'}

del:删除集合本身

4、集合类型操作符 

(1)   in ,not in
(2)   集合等价与不等价(==, !=)
(3)   子集、超集

s=set('jessonwang')
s1=set('jesson')
print('e' in s)
print(s1<s)

(4)   联合(|)

联合(union)操作与集合的or操作其实等价的,联合符号有个等价的方法,union()。

s1=set('jesson')
s2=set('wang')
s3=s1|s2
print(s3) #输出结果:{'e', 'o', 'a', 'w', 's', 'g', 'n', 'j'}
print(s1.union(s2)) #输出结果:{'e', 'o', 'a', 'w', 's', 'g', 'n', 'j'}

(5) 交集(&)

与集合and等价,交集符号的等价方法是intersection()

s1 = set('jessonWang')
s2 = set('pitterZhao')
s3 = s1 & s2
print(s3) # 输出结果:{'e', 'a', 'o'} print(s1.intersection(s2)) # 输出结果:{'e', 'a', 'o'}

(6) 查补(-)
      等价方法是difference()

s1 = set('jesson')
s2 = set('wang')
s3 = s1 - s2
print(s3) #输出结果:{'j', 's', 'o', 'e'} print(s1.difference(s2)) #输出结果:{'j', 's', 'o', 'e'}

(7) 对称差分(^)

对称差分是集合的XOR(‘异或’),取得的元素属于s1,s2但不同时属于s1和s2.其等价方法symmetric_difference()

s1 = set('jesson')
s2 = set('wang')
s3 = s1 ^ s2
print(s3) #输出结果: {'s', 'a', 'o', 'w', 'e', 'j', 'g'} print(s1.symmetric_difference(s2)) #输出结果:{'s', 'a', 'o', 'w', 'e', 'j', 'g'}

应用技巧:

'''最简单的去重方式'''

lis = [1,2,3,4,1,2,3,4]
print list(set(lis)) #[1, 2, 3, 4]

补充:http://www.jb51.net/article/84869.htm

Json 序列化数据

Json数据类型 虽然不是Python的基本数据类型,但是,在日常开发中,涉及到的数据交互类型中,却经常会遇到Json 数据类型,因此这里有必要,针对性的学习一下。

Json 数据类型格式:

小技巧:学习json的时候,格式类比python中的字典!但是,Python中一切皆对象,字典是字典对象,json是json格式的字符串对象;另外,注意,Json格式的数据中,没有单引号!!!一般都是双引号!!!

Json相关的操作中,常用的有四个参数,分别是:json.dumps和json.loads  json.dump和json.load,它们是成对出现的。

json.dumps 是将一个Python数据类型列表进行json格式的编码解析,

示例如下:

>>> import json #导入python 中的json模块
>>> l = [‘iplaypython’,[1,2,3], {‘name’:’xiaoming’}] #创建一个l列表
>>> encoded_json = json.dumps(l) # 将l列表,进行json格式化编码
>>> print repr(l) #输出结果: ['iplaypython', [1, 2, 3], {'name': 'xiaoming'}]
>>> print encoded_json #输出结果 ["iplaypython", [1, 2, 3], {"name": "xiaoming"}]

这样我们就将一个list列表对象,进行了json格式的编码转换。

解码python json格式,可以用这个模块的json.loads()函数的解析方法,
示例如下:

>>> decode_json = json.loads(encoded_json)
>>> print type(decode_json) #查看一下解码后的对象类型 <class 'list'>
>>> print decode_json #输出结果 ['iplaypython', [1, 2, 3], {'name': 'xiaoming'}]

将python json格式解码成Python数据风格

json.dump和json.dumps很不同,json.dump主要用来json文件读写,和json.load函数配合使用。

json.dump(x,f),x是对象,f是一个文件对象,这个方法可以将json字符串写入到文本文件中。

import json

data = [{"a":"aaa","b":"bbb","c":[1,2,3,(4,5,6)]},33,'tantengvip',True]
data2 = json.dumps(data)
print(data2)
f = open('./tt.txt','a')
json.dump(data2,f)
这样就生成了一个tt.txt文件,保存了json格式的数据。dumps还提供pritty print,格式化的输出。

json.load加载json格式文件   下面是从txt文件中读取了json数据。

f = open('./tt.txt','r')
hehe = json.load(f)
print(hehe)
dumps & loads 针对内存对象,
即将Python内置数据序列化为字串
如使用json.dumps序列化的对象d_json=json.dumps({'a':1, 'b':2}),在这里d_json是一个字串'{"b": 2, "a": 1}'
d=json.loads(d_json) #{ b": 2, "a": 1},使用load重新反序列化为dict

dump & load
针对文件句柄,(即,json.dump()方法,增加了对文件的操作,可以直接将支持序列化的数据,dump成json格式的字符串,并将其保存到指定文件;反之,json.load()方法是将json格式字符串
从指定文件中读取出来,反序列化为原来dump之前的数据格式!) 比如:本地有一个json文件a.json则可以d=json.load(open('a.json')), 而如果是dump操作,就是将内置类型序列化为json对象后写入指定的文件!

Json总结:

json.dumps : dict转成str      json.dump 是将python数据---->>序列化为json格式的字符串,并将其保存到指定文件中;

json.loads :  str转成dict       json.load 是从某个数据文件中读取json格式的数据  ---->>将其反序列化成Python数据

上一篇:阿里云GIS曾志明:空间数据中台是什么,怎么用


下一篇:Python基础5:列表 元祖 字典 集合