Python中一切皆对象,包括实例对象和类型对象,如整数、浮点数、字符串是实例对象,整数类型、浮点数类型、字符串类型是类型对象。
# [Python]
>>> n=10 >>> type(n) <type 'int'> >>> type(int) <type 'type'>
>>> sys.getsizeof(n)
20
>>> sys.getsizeof(int)
444
>>>
如演示代码所示,整数对象(n)的类型是int(整数类型),整数类型对象的类型是type(类型的类型对象);其中整数对象占用20字节内存,而整数类型对象占用444字节内存[这些数值取决于测试所使用的设备和系统]。
看到占用内存的数值大小,一定会非常好奇这些内存用来做什么,后面会贴源码来进行说明。对象是数据以及基于这些数据的操作的集合,在Python中对象一旦被创建,其在内存中的大小就固定不变。
PyObject
PyObject是对象系统的核心,所有的对象都包含这部分数据。它主要包括:用于内存管理的引用计数(ob_refcnt)、类型对象指针(ob_type)、堆内存中对象管理用的双向链表指针(_ob_next, _ob_prev)[总共16字节]。
其中ob_type指向对象所属的类型对象,而类型对象是有定义操作集合的,所以在运行时通过ob_type找到合适的操作(函数调用),实现了Python的动态机制。
// [C] typedef struct _object { struct _object *_ob_next; struct _object *_ob_prev; Py_ssize_t ob_refcnt; struct _typeobject *ob_type; } PyObject;
PyVarObject
整数对象、浮点数对象是定长的,而字符串对象是变长的,取决于字符串长度,这种变长对象用PyVarObject结构体来表示。
// [C] typedef struct { PyObject_HEAD // PyObject数据部分 Py_ssize_t ob_size; // 大小 } PyVarObject;
相对于PyObject,定长对象只增加了变长对象的大小字段(ob_size)。
PyObject和PyVarObject的数据中,都有指向类型对象的指针,类型对象是_typeobject结构体,即PyTypeObject。
PyTypeObject
类型对象也包含实例对象的数据部分(引用计数、类型对象指针,对象双链表指针),它包含的更多字段是适用于此类型的操作。比如:
标准操作:释放内存(tp_dealloc)、打印(tp_print)、获取属性(tp_getattr)、设置属性(tp_setattr)、比较(tp_compare)。
数值对象操作集合(tp_as_number)、序列对象操作集合(tp_as_sequence)、关联对象操作集合(tp_as_mapping)等[限于篇幅省略了很多字段]。
// [C] typedef struct _typeobject { PyObject_VAR_HEAD const char *tp_name; // 类型名 Py_ssize_t tp_basicsize, tp_itemsize; // 内存分配 // 标准操作 destructor tp_dealloc; printfunc tp_print; getattrfunc tp_getattr; setattrfunc tp_setattr; cmpfunc tp_compare; reprfunc tp_repr; PyNumberMethods *tp_as_number; // 数值对象应该支持的操作 PySequenceMethods *tp_as_sequence; // 序列对象应该支持的操作 PyMappingMethods *tp_as_mapping; // 关联对象应该支持的操作 ... } PyTypeObject;
注:像cmpfunc是定义的函数指针,其它的函数指针也有类似的定义。
typedef int (*cmpfunc)(PyObject *, PyObject *); // 比较两个PyObject对象的函数指针
在Python中,一般来说对象是不能被静态初始化的也不能在栈空间生存。但内建的类型对象都是被静态初始化的,如PyInt_Type、PyFloat_Type、PyString_Type等,其中PyInt_Type的初始化代码如下:
// [C] PyTypeObject PyInt_Type = { PyVarObject_HEAD_INIT(&PyType_Type, 0) // ob_type == &PyType_Type "int", sizeof(PyIntObject), 0, (destructor)int_dealloc, /* tp_dealloc */ (printfunc)int_print, /* tp_print */ 0, /* tp_getattr */ 0, /* tp_setattr */ (cmpfunc)int_compare, /* tp_compare */ (reprfunc)int_to_decimal_string, /* tp_repr */ &int_as_number, /* tp_as_number */ ... };
注:PyType_Type是类型的类型。
说完了内建类型,那自定义类型在Python中是如何表示的呢?
自定义class演示代码如下:
# [Python] >>> class A(object): ... def __init__(self): ... pass ... >>> A.__class__ <type 'type'> >>> type.__class__ <type 'type'>
可以看到自定义class的类型对象是PyType_Type,即用PyType_Type对象来创建自定义的类型对象。
PyType_Type的初始化代码如下:
// [C] PyTypeObject PyType_Type = { PyVarObject_HEAD_INIT(&PyType_Type, 0) // ob_type == &PyType_Type "type", /* tp_name */ sizeof(PyHeapTypeObject), /* tp_basicsize */ sizeof(PyMemberDef), /* tp_itemsize */ (destructor)type_dealloc, /* tp_dealloc */ 0, /* tp_print */ 0, /* tp_getattr */ 0, /* tp_setattr */ 0, /* tp_compare */ (reprfunc)type_repr, /* tp_repr */ 0, /* tp_as_number */ ... };
自此把实例对象、类型对象基本讲清楚了,至于具体类型的实现、特性则需要后续再具体讲解。