Python序列化之json与pickle

1、json介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming LanguageStandard ECMA-262 3rd Edition - December 1999的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。 这些特性使JSON成为理想的数据交换语言。

Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:

  1. json.dumps():对数据进行编码
  2. json.loads():对数据进行解码

json.dumps与json.loads实例

以下实例演示了 Python 数据结构转换为JSON

 #!/usr/bin/env python
 # _*_ coding:utf-8 _*_
 # Author: enzhi.wang
 import json
 # 将python的基础数据类型转化成字符串
 dic = {"k1":"v1","k2":"v2"}
 print("Python原始数据:",repr(dic),type(dic))
 result = json.dumps(dic)    #将字典类型转换为字符串类型
 print("JSON对象:",result,type(result))

执行以上代码输出结果为:

C:\Python3.5\python.exe C:/Users/root/PycharmProjects/S14/day4/json序列化.py
Python原始数据: {'k1': 'v1', 'k2': 'v2'} <class 'dict'>
JSON对象: {"k1": "v1", "k2": "v2"} <class 'str'>

通过输出的结果可以看出,简单类型通过编码后跟其原始的repr()输出结果非常相似。

接着以上实例,我们可以将一个JSON编码的字符串转换回一个Python数据结构:

 #!/usr/bin/env python
 # _*_ coding:utf-8 _*_
 # Author: enzhi.wang
 import json
 # 将python的基础数据类型转化成字符串
 dic = {"k1":"v1","k2":"v2"}
 print("Python原始数据:",repr(dic),type(dic))
 result = json.dumps(dic)    #将字典类型转换为字符串类型
 print("JSON对象:",result,type(result))

 # 将python字符串类型转化为python基本数据类型
 result = json.loads(result)
 print("result['k1']:",result['k1'])
 print("result['k2']:",result['k2'])

执行以上代码输出结果为:

C:\Python3.5\python.exe C:/Users/root/PycharmProjects/S14/day4/json序列化.py
Python原始数据: {'k1': 'v1', 'k2': 'v2'} <class 'dict'>
JSON对象: {"k1": "v1", "k2": "v2"} <class 'str'>
result['k1']: v1
result['k2']: v2

如果你要处理的是文件而不是字符串,你可以使用 json.dump() 和 json.load() 来编码和解码JSON数据。例如:

 data = {
     "name":"wangenzhi",
     "age":25,
     "job":"ops"
 }
 # 写入json数据
 with open('db.json','w') as f:
     json.dump(data,f)

 # 读取json数据
 with open('db.json','r') as f:
     res = json.load(f)
     print(res,type(res))

更多资料请参考:https://docs.python.org/3/library/json.html

2、pickle介绍

pickle模块使用的数据格式是python专用的,并且不同版本不向后兼容,同时也不能被其他语言说识别。要和其他语言交互,可以使用内置的json 包使用pickle模块你可以把Python对象直接保存到文件,而不需要把他们转化为字符串,也不用底层的文件访问操作把它们写入到一个二进制文件里。 pickle模块会创建一个python语言专用的二进制格式,你基本上不用考虑任何文件细节,它会帮你干净利落地完成读写独享操作,唯一需要的只是一个合法的文件句柄。

python3中可以使用pickle模块,对数据进行编解码。它包含两个函数:

  1. pickle.dumps()
  2. pickle.loads()

pickle.dumps与pickle.loads实例

 #!/usr/bin/env python
 # _*_ coding:utf-8 _*_
 # Author: enzhi.wang
 import pickle

 data = {
     "name":"wangenzhi",
     "age":25,
     "job":"ops"
 }

 print("原始python对象:",repr(data))
 r = pickle.dumps(data)
 print("pickle转换后的对象:",r)
 res = pickle.loads(r)
 print("res['name']:",res['name'])
 print("res['age']:",res['age'])
 print("res['job']:",res['job'])

执行以上代码输出结果为:

C:\Python3.5\python.exe C:/Users/root/PycharmProjects/S14/day4/pickle序列化.py
原始python对象: {'name': 'wangenzhi', 'job': 'ops', 'age': 25}
pickle转换后的对象: b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\t\x00\x00\x00wangenzhiq\x02X\x03\x00\x00\x00jobq\x03X\x03\x00\x00\x00opsq\x04X\x03\x00\x00\x00ageq\x05K\x19u.'
res['name']: wangenzhi
res['age']: 25
res['job']: ops

如果你要处理的是文件而不是字符串,你可以使用 pickle.dump() 和 pickle.load() 来编码和解码JSON数据。例如:

 import pickle

 data = {
     "name":"wangenzhi",
     "age":25,
     "job":"ops"
 }
 # 写入数据,要以wb格式写入
 pickle.dump(data,open('db','wb'))
 # 读取数据,要以rb格式读取
 f = open('db','rb')
 res = pickle.load(f)
 print(res)

执行以上代码输出结果为:

C:\Python3.5\python.exe C:/Users/root/PycharmProjects/S14/day4/pickle序列化.py
{'job': 'ops', 'name': 'wangenzhi', 'age': 25}

小结

JSON:适合跨语言,对于python而言仅适用于Python基本数据类型

pickle:仅适用于python,pickle适用于python所有数据类型的序列化

上一篇:爬取WX小程序的数据


下一篇:Go语言之进阶篇 netcat工具的使用