Python回顾与整理1:Python基础

        学习Python其实也有好一段时间了,之前也做了不少笔记,但是要真正把Python学得很扎实,没有对Python系统的了解是远远不够的,哪怕是最基础的知识点,所以决定好好地回顾整理。

        当然,就以《Python核心编程》这本书为纲,希望可以把自己对Python的理解连成系统的一条线。




1.语句和语法


  • `#`:注释

  • `\`:换行,如果是闭合操作符如`( )`,`[ ]`,`{ }`等,可以不使用`\`

  • `:`:分号将代码头和代码体分开

  • `缩进`:用以区分不同的代码块

  • `;`:同一行写多个语句,但不建议

  • `模块`:一个.py脚本文件就是一个模块




2.变量赋值


(1)赋值操作符:=

  • 在Python中,对象是通过引用传递的,赋值时,是将该对象的引用(不是一个值)赋给这个变量。

  • 另外,Python赋值语句没有返回值,但可以使用赋值链:

1
2
3
4
5
6
>>> a  =  (a = 3)
  File "<stdin>", line 1
    = (a=3)
          ^
SyntaxError: invalid syntax
>>> y = = 3


(2)增量赋值

  • 只有类似+=这样的增量赋值,没有自增自减的方法

  • 特性:可变对象(列表,字典等)就修改(无需拷贝引用),不可变对象(数字,元组等)则分配一个新对象


(3)多重赋值

  • 一个对象可被多个变量引用,多个对象也可被多个对象引用

1
>>> x = = =1


(4)多元赋值:元组赋值

1
>>> (x, y, z) = (12'a string')
  • 不加括号也可以,但建议加上

  • 可用于两值的交换

1
2
3
4
5
6
>>> x = 3; y = 4
>>> print x, y
3 4
>>> x, y = y, x
>>> print x, y
4 3




3.标识符


  • 关键字标识符:保留字,不能用于其他用途,否则会引起SyntaxError异常

  • 内建(built-in)标识符:是__builtins__模块的成员,在程序开始或交互解释器开始时,由Python解释器自动导入,可以将其作为Python全局变量,可以重新赋值,但不建议

1
2
3
4
>>> dir
<built-in function dir>
>>> dir()
['__builtins__''__doc__''__name__''__package__']
  • __专用下划线标识符:

    __xxx:类中的私有变量名,不能用`from module import *`导入,变量是私有时,建议使用这种方法

    __xxx__:系统定义名字,如内建标识符


    另外,Pythonn不支持标识符重载,所以任何时刻都只有一个名字绑定。




4.基本风格指南


  • 注释:#号

  • 文档:模块,类声明或函数声明中第一个没有赋值的字符串,可通过obj.__doc__访问

  • 缩进:以空格代替制表符

  • 标识符名称:名字简短有意义

  • Python风格指南:import this



(1)模块结构和布局

  • 起始行(Unix)

1
#/usr/bin/env python

        这样仅输入脚本名字就可以执行脚本,无需直接调用解释器。

  • 模块文档

1
''this is a test module''

        可通过obj.__doc__访问

  • 模块导入

  • 变量定义:尽量使用局部变量代替全局变量

  • 类定义

  • 函数定义

  • 主程序

1
2
3
4
if __name__ == '__main__':
    My_function()
#如果模块是被导入,__name__的值为模块名字;
#如果模块是被直接执行,__name__的值为'__main__';

        关于主程序,注意下面几点:

  • 1.绝大部分模块创建的目的是被其它模块导入而不是作为脚本执行,总之只有一个模块,也就是包含主程序的模块会被执行;

  • 2.*别的Python语句(没有缩进)在模块被导入时就会被执行;

  • 3.通常只有主程序模块中有大量的*可执行代码,所有其他被导入模块只应该有很少的*执行代码,所有的功能代码都应该封装在函数或类当中。

    对于上面三点,只要联系自己在实际项目开发中的例子就可以很好的理解了。


(2)在主程序中书写测试代码

    如果想测试被导入的模块的某个函数的功能,就可以使用主程序的方法,引入并执行该函数,这就是测试功能的使用,当然在大型程序中,更倾向使用unittest。




5.内存管理


  • 变量定义:变量无须事先声明

    在Python中无需显式变量声明语句,变量在第一次赋值时自动声明。

  • 动态类型:变量无须指定类型

    Python中对象的类型和内存占用都是运行时确定的。

  • 内存分配:不用关心内存管理

    Python解释器承担了内在管理的复杂任务。

  • 引用计数:对象回收

(1)增加引用计数

  • 当对象被创建并(将其引用)赋值给变量时,该对象的引用计数就被设置为1

  • 当一个对象(的引用)又被赋值给其他变量时,或作为参数传递给函数,方法或类实例时,或者被赋值为一个窗口对象(列表,字典等)的成员时,该对象新的一个引用会被创建,引用计数加1

1
2
3
4
>>> x = 3.14    #加1,下面每一步同理
>>> y = x
>>> foobar(x)
>>> myList = [123, x, 'xyz']

(2)减少引用计数

  • 一个本地引用离开其作用范围

    如函数执行完毕后局部变量被销毁。

  • 对象别名被显式销毁

1
>>> del y
  • 当变量被赋值给另外一个对象时,原对象的引用计数也会自动减1

1
2
3
>>> foo = 'xyz'
>>> bar = foo
>>> foo = 123
  • 对象被从一个窗口对象中移除

1
myList.remove(x)
  • 窗口对象本身被销毁

1
del myList

        即执行del y会产生下面两个结果:

  • 1.从现在名称空间中删除y

  • 2.y变量对应的对象的引用计数减1

    需要注意的是,如果内存中仍然有在使用该对象,这会增加一个额外的引用,则它还不会被回收。


  • 垃圾收集

        解释器跟踪对象的引用计数,垃圾收集器负责释放内存。其实际,垃圾收集器是一块独立代码,用来查找引用计数为0的对象和那些引用计数虽然大于0但也应该被销毁的对象(如循环引用的对象)。

        垃圾收集器 = 引用计数器 + 循环垃圾计数器,这在存在循环引用的情况中非常有用:

  • 循环引用:发生在至少两个对象互相引用时,也就是当其它所有对它们的引用都消失时,他们两者所产生的对各自的引用仍然存在,例如两个类中有各自的一个实例

  • 引用计数器作用:当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问(可到达的)其它对象(这样的话,其它对象的引用计数必然是1)

  • 循环垃圾计数器作用:作为引用计数器的补充,垃圾收集器也会留心被分配的总量很大的(及未通过引用计数销毁的那些)对象,在这种情况下,解释器也会停下来,试图清理所有未引用的循环

        基本可以理解,但具体怎么实现的,就需要看Python的源码分析了。




6.第一个Python程序


    主要提及一点:使用局部变量替换模块变量

    例如,你要使用os.linesep,如果你多次使用,那么建议将其定义为一个本模块的全局变量或局部变量,这将会加快查询的速度,因为对于os.linesep,要进行下面两步:

  • 首先要查找os,确认其是一个模块

  • 在这个模块中查找linesep变量

    将经常用到的模块属性替换为一个本地引用,可以让程序跑得更快。




本文转自 xpleaf 51CTO博客,原文链接:http://blog.51cto.com/xpleaf/1750127,如需转载请自行联系原作者
上一篇:在Delphi.net中使用内联代码功能


下一篇:《Excel高手捷径:一招鲜,吃遍天》一第22招 怎样把一个单元格内多行内容分成多个单元格