Python 自动化第一周

2021-08-23 22:29:28

1.Python简介

1.1、Python介绍

python的创始人为吉多·范罗苏姆（Guido van Rossum）。1989年的圣诞节期间，吉多·范罗苏姆（中文名字：龟叔）为了在阿姆斯特丹打发时间，决心开发一个新的脚本解释程序，作为ABC语言的一种继承。

（龟叔：2005年加入谷歌至2012年，2013年加入Dropbox直到现在，依然掌握着Python发展的核心方向，被称为仁慈的*者）。

Python 是由 Guido van Rossum 在八十年代末和九十年代初，在荷兰国家数学和计算机科学研究所设计出来的。

Python 本身也是由诸多其他语言发展而来的,这包括 ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unix shell 和其他的脚本语言等等。

像 Perl 语言一样，Python 源代码同样遵循 GPL(GNU General Public License)协议。Python崇尚优美、清晰、简单，是一个优秀并广泛使用的语言。

1.2、Python的应用领域

Python可以应用于众多领域，如：数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python，如：Youtube、Dropbox、BT、Quora（中国知乎）、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。

目前Python主要应用领域：

云计算: 云计算最火的语言， 典型应用OpenStack

WEB开发: 众多优秀的WEB框架，众多大型网站均为Python开发，Youtube, Dropbox, 豆瓣。。。， 典型WEB框架有Django

科学运算、人工智能: 典型库NumPy, SciPy, Matplotlib, Enthought librarys,pandas

系统运维: 运维人员必备语言

金融：量化交易，金融分析，在金融工程领域，Python不但在用，且用的最多，而且重要性逐年提高。原因：作为动态语言的Python，语言结构清晰简单，库丰富，成熟稳定，科学计算和统计分析都很牛逼，生产效率远远高于c,c++,java,尤其擅长策略回测

图形GUI: PyQT, WxPython,TkInter

Python在一些公司的应用： 

谷歌：Google App Engine 、code.google.com 、Google earth 、谷歌爬虫、Google广告等项目都在大量使用Python开发

CIA: 美国中情局网站就是用Python开发的

NASA: 美国航天局(NASA)大量使用Python进行数据分析和运算

YouTube:世界上最大的视频网站YouTube就是用Python开发的

Dropbox:美国最大的在线云存储网站，全部用Python实现，每天网站处理10亿个文件的上传和下载

Instagram:美国最大的图片分享社交网站，每天超过3千万张照片被分享，全部用python开发

Facebook:大量的基础库均通过Python实现的

Redhat: 世界上最流行的Linux发行版本中的yum包管理工具就是用python开发的

豆瓣: 公司几乎所有的业务均是通过Python开发的

知乎: 国内最大的问答社区，通过Python开发(国外Quora)

春雨医生：国内知名的在线医疗网站是用Python开发的

除上面之外，还有搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝 、土豆、新浪、果壳等公司都在使用Python完成各种各样的任务。

1.3、Python是什么语言

编程语言主要从以下几个角度为进行分类，编译型和解释型、静态语言和动态语言、强类型定义语言和弱类型定义语言，每个分类代表什么意思呢，我们一起来看一下。

1.3.1 编译型与解释型

编译器是把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机可以直接以机器语言来运行此程序,速度很快;

而解释器则是只在执行程序时,才一条一条的解释成机器语言给计算机来执行,所以运行速度是不如编译后的程序运行的快的.

这是因为计算机不能直接认识并执行我们写的语句,它只能认识机器语言(是二进制的形式)

编译型
优点：编译器一般会有预编译的过程对代码进行优化。因为编译只做一次，运行时不需要编译，所以编译型语言的程序执行效率高。可以脱离语言环境独立运行。
缺点：编译之后如果需要修改就需要整个模块重新编译。编译的时候根据对应的运行环境生成机器码，不同的操作系统之间移植就会有问题，需要根据运行的操作系统环境编译不同的可执行文件。

解释型
优点：有良好的平台兼容性，在任何环境中都可以运行，前提是安装了解释器（虚拟机）。灵活，修改代码的时候直接修改就可以，可以快速部署，不用停机维护。

缺点：每次运行的时候都要解释一遍，性能上不如编译型语言。

1.3.  动态语言和静态语言

通常我们所说的动态语言、静态语言是指动态类型语言和静态类型语言。

（）动态类型语言：动态类型语言是指在运行期间才去做数据类型检查的语言，也就是说，在用动态类型的语言编程时，永远也不用给任何变量指定数据类型，该语言会在你第一次赋值给变量时，在内部将数据类型记录下来。Python和Ruby就是一种典型的动态类型语言，其他的各种脚本语言如VBScript也多少属于动态类型语言。

（）静态类型语言：静态类型语言与动态类型语言刚好相反，它的数据类型是在编译其间检查的，也就是说在写程序时要声明所有变量的数据类型，C/C++是静态类型语言的典型代表，其他的静态类型语言还有C#、JAVA等。

1.3.  强类型定义语言和弱类型定义语言

（）强类型定义语言：强制数据类型定义的语言。也就是说，一旦一个变量被指定了某个数据类型，如果不经过强制转换，那么它就永远是这个数据类型了。举个例子：如果你定义了一个整型变量a,那么程序根本不可能将a当作字符串类型处理。强类型定义语言是类型安全的语言。

（）弱类型定义语言：数据类型可以被忽略的语言。它与强类型定义语言相反, 一个变量可以赋不同数据类型的值。

   强类型定义语言在速度上可能略逊色于弱类型定义语言，但是强类型定义语言带来的严谨性能够有效的避免许多错误。另外，“这门语言是不是动态语言”与“这门语言是否类型安全”之间是完全没有联系的！

例如：Python是动态语言，是强类型定义语言（类型安全的语言）; VBScript是动态语言，是弱类型定义语言（类型不安全的语言）; JAVA是静态语言，是强类型定义语言（类型安全的语言）。

通过上面这些介绍，我们可以得出，python是一门动态解释性的强类型定义语言。

1.4、Python的优缺点

先看优点

Python的定位是“优雅”、“明确”、“简单”，所以Python程序看上去总是简单易懂，初学者学Python，不但入门容易，而且将来深入下去，可以编写那些非常非常复杂的程序。
开发效率非常高，Python有非常强大的第三方库，基本上你想通过计算机实现任何功能，Python官方库里都有相应的模块进行支持，直接下载调用后，在基础库的基础上再进行开发，大大降低开发周期，避免重复造*。
高级语言————当你用Python语言编写程序的时候，你无需考虑诸如如何管理你的程序使用的内存一类的底层细节
可移植性————由于它的开源本质，Python已经被移植在许多平台上（经过改动使它能够工作在不同平台上）。如果你小心地避免使用依赖于系统的特性，那么你的所有Python程序无需修改就几乎可以在市场上所有的系统平台上运行
可扩展性————如果你需要你的一段关键代码运行得更快或者希望某些算法不公开，你可以把你的部分程序用C或C++编写，然后在你的Python程序中使用它们。
可嵌入性————你可以把Python嵌入你的C/C++程序，从而向你的程序用户提供脚本功能。

再看缺点：

速度慢，Python 的运行速度相比C语言确实慢很多，跟JAVA相比也要慢一些，因此这也是很多所谓的大牛不屑于使用Python的主要原因，但其实这里所指的运行速度慢在大多数情况下用户是无法直接感知到的，必须借助测试工具才能体现出来，比如你用C运一个程序花了0.01s,用Python是0.1s,这样C语言直接比Python快了10倍,算是非常夸张了，但是你是无法直接通过肉眼感知的，因为一个正常人所能感知的时间最小单位是0.15-0.4s左右，哈哈。其实在大多数情况下Python已经完全可以满足你对程序速度的要求，除非你要写对速度要求极高的搜索引擎等，这种情况下，当然还是建议你用C去实现的。
代码不能加密，因为PYTHON是解释性语言，它的源码都是以名文形式存放的，不过我不认为这算是一个缺点，如果你的项目要求源代码必须是加密的，那你一开始就不应该用Python来去实现。
线程不能利用多CPU问题，这是Python被人诟病最多的一个缺点，GIL即全局解释器锁（Global Interpreter Lock），是计算机程序设计语言解释器用于同步线程的工具，使得任何时刻仅有一个线程在执行，Python的线程是操作系统的原生线程。在Linux上为pthread，在Windows上为Win thread，完全由操作系统调度线程的执行。一个python解释器进程内有一条主线程，以及多条用户程序的执行线程。即使在多核CPU平台上，由于GIL的存在，所以禁止多线程的并行执行。关于这个问题的折衷解决方法，我们在以后线程和进程章节里再进行详细探讨。

当我们编写Python代码时，我们得到的是一个包含Python代码的以.py为扩展名的文本文件。要运行代码，就需要Python解释器去执行.py文件。

由于整个Python语言从规范到解释器都是开源的，所以理论上，只要水平够高，任何人都可以编写Python解释器来执行Python代码（当然难度很大）。事实上，确实存在多种Python解释器。

1.5、Python2和Python3的区别

a：Python2：源码重复，不规范；Python3：整合源码，更清晰简单优美。
b:python2:默认的编码是ASCII,默认会中文乱码或报错（解决方法：程序前加上
#！/usr/bin/env python
# encoding:utf-8）
Python3：默认的编码是utf-8,写中文时，不会报错，默认包括中文
Python2：long int
print 'abc' print ('abc')
python3:无long int

2、Python基础知识

2.1、变量

变量：把程序运行的中间结果临时的存在内存里，以便后续的代码调用。

变量定义的规则：

#变量:变量是由数字，字母，下划线任意组合；

变量不能是数字开头；

变量要具有可描述性；

变量不建议使用中文；

变量不能过长。

变量不能是下面Python中的关键字

['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

例：

a =

b =

c=

print(a,b,c)

2.2、常量

常量：一直不变的量，在计算机程序运行时，不会被程序修改的量
约定俗称全部大写的变量为常量，放到文件最上面。

在c语言中有专门的常量定义语法，const int count = ;一旦定义为常量，更改即会报错

2.3、注释

单行注释：# 被注释内容

多行注释：'''被注释内容'''，或者"""被注释内容"""

注释快捷键：把需要注释的行选上，再按ctrl+/

2.4、基础数据类型

什么是数据类型？

　　我们人类可以很容易的分清数字与字符的区别，但是计算机并不能呀，计算机虽然很强大，但从某种角度上看又很傻，除非你明确的告诉它，1是数字，“汉”是文字，否则它是分不清1和‘汉’的区别的，因此，在每个编程语言里都会有一个叫数据类型的东东，其实就是对常用的各种数据类型进行了明确的划分，你想让计算机进行数值运算，你就传数字给它，你想让他处理文字，就传字符串类型给他。Python中常用的数据类型有多种，今天我们暂只讲3种，数字、字符串、布尔类型。

2.4.1、整数类型（int）

在32位机器上，整数的位数为32位，取值范围为-2**31～2**31-1，即-2147483648～2147483647

在64位系统上，整数的位数为64位，取值范围为-2**63～2**63-1，即-9223372036854775808～9223372036854775807

2.4.2、长整型

跟C语言不同，Python的长整数没有指定位宽，即：Python没有限制长整数数值的大小，但实际上由于机器内存有限，我们使用的长整数数值不可能无限大。

注意，自从Python2.2起，如果整数发生溢出，Python会自动将整数数据转换为长整数，所以如今在长整数数据后面不加字母L也不会导致严重后果了。

注意：在Python3里不再有long类型了，全都是int

>>> a= 2**64

>>> type(a)  #type()是查看数据类型的方法

<type 'long'>

>>> b = 2**60

>>> type(b)

<type 'int'>

2.4.3、字符串类型（str）

在Python中,加了引号的字符都被认为是字符串！

>>> name = "dadong" #双引号

>>> age = ""       #只要加引号就是字符串

>>> age2 =           #int

>>>

>>> msg = '''My name is dadong, I am 22 years old!'''  #我擦，3个引号也可以

>>>

>>> hometown = 'henan'   #单引号也可以

那单引号、双引号、多引号有什么区别呢？单双引号木有任何区别，只有下面这种情况你需要考虑单双的配合

msg = "My name is Alex , I'm 22 years old!"

多引号什么作用呢？作用就是多行字符串必须用多引号

msg = '''

锄禾日当午，

汗滴禾下土，

谁知盘中餐，

粒粒皆辛苦。

'''

print(msg)

字符串拼接

数字可以进行加减乘除等运算，字符串呢？让我大声告诉你，也能？what ?是的，但只能进行"相加"和"相乘"运算。

>>> name

'da dong'

>>> age

''

>>>

>>> name + age #相加其实就是简单拼接

'da dong22'

>>>

>>> name *  #相乘其实就是复制自己多少次，再拼接在一起

'dong dadong dadong dadong dadong dadong dadong dadong dadong dadong Li'

注意，字符串的拼接只能是双方都是字符串，不能跟数字或其它类型拼接

>>> type(name),type(age2)

(<type 'str'>, <type 'int'>)

>>>

>>> name

'da dong'

>>> age2

>>> name + age2

Traceback (most recent call last):

File "<stdin>", line , in <module>

TypeError: cannot concatenate 'str' and 'int' objects #错误提示数字 和 字符 不能拼接

2.4.4、布尔值（True，False）

布尔类型很简单，就两个值，一个True(真)，一个False(假), 主要用记逻辑判断

但其实你们并不明白对么？ let me explain, 我现在有2个值， a=3, b=5 , 我说a>b你说成立么? 我们当然知道不成立，但问题是计算机怎么去描述这成不成立呢？或者说a< b是成立，计算机怎么描述这是成立呢？

没错，答案就是，用布尔类型

>>> a=

>>> b=

>>>

>>> a > b #不成立就是False,即假

False

>>>

>>> a < b #成立就是True, 即真

True

2.5、格式化输出

2.5.1、元组形式替换：占位符

%s就是代表字符串占位符，除此之外，还有%d,是数字占位符。

模板：

# msg1 = ''' ------------ info of %s -----------

# Name  : %s

# Age   : %d

# job   : %s

# Hobbie: %s

# ------------- end -----------------

例子：

name = input("Name:")

age = input("Age:")

job = input("Job:")

hobbie = input("Hobbie:")

info = '''

------------ info of %s ----------- #这里的每个%s就是一个占位符，本行的代表 后面拓号里的 name

Name  : %s  #代表 name

Age   : %s  #代表 age

job   : %s  #代表 job

Hobbie: %s  #代表 hobbie

------------- end -----------------

''' %(name,name,int(age),job,hobbie)  # 这行的 % 号就是 把前面的字符串 与拓号 后面的 变量 关联起来 

print(info)

input接收的所有输入默认都是字符串格式！

2.5.2、字典

# dic = {'name':'拉泡泡'，'age':45,'job':'teacher','hobby':'吹'}

2.6、基本运算符

运算符

　　计算机可以进行的运算有很多种，可不只加减乘除这么简单，运算按种类可分为算数运算、比较运算、逻辑运算、赋值运算、成员运算、身份运算、位运算，今天我们暂只学习算数运算、比较运算、逻辑运算、赋值运算

2.6.1、算数运算

以下假设变量： a=10，b=20：

运算符	描述	实例
+	加 - 两个对象相加	a + b 输出结果 30
-	减 - 得到负数或是一个数减去另一个数	a - b 输出结果 -10
*	乘 - 两个数相乘或是返回一个被重复若干次的字符串	a * b 输出结果 200
/	除 - x除以y	b / a 输出结果 2
%	取模 - 返回除法的余数	b % a 输出结果 0
**	幂 - 返回x的y次幂	a**b 为10的20次方，输出结果 100000000000000000000
//	取整除 - 返回商的整数部分	9//2 输出结果 4 , 9.0//2.0 输出结果 4.0

2.6.2、比较运算

以下假设变量a为10，变量b为20：

运算符	描述	实例
==	等于 - 比较对象是否相等	(a == b) 返回 False。
!=	不等于 - 比较两个对象是否不相等	(a != b) 返回 true.
>	大于 - 返回x是否大于y	(a > b) 返回 False。
<	小于 - 返回x是否小于y。所有比较运算符返回1表示真，返回0表示假。这分别与特殊的变量True和False等价。注意，这些变量名的大写。	(a < b) 返回 true。
>=	大于等于 - 返回x是否大于等于y。	(a >= b) 返回 False。
<=	小于等于 - 返回x是否小于等于y。	(a <= b) 返回 true。

2.6.3、赋值运算

以下假设变量a为10，变量b为20：

运算符	描述	实例
=	简单的赋值运算符	c = a + b 将 a + b 的运算结果赋值为 c
+=	加法赋值运算符	c += a 等效于 c = c + a
-=	减法赋值运算符	c -= a 等效于 c = c - a
*=	乘法赋值运算符	c = a 等效于 c = c a
/=	除法赋值运算符	c /= a 等效于 c = c / a
%=	取模赋值运算符	c %= a 等效于 c = c % a
**=	幂赋值运算符	c = a 等效于 c = c a
//=	取整除赋值运算符	c //= a 等效于 c = c // a

2.6.4、逻辑运算

Python语言支持逻辑运算符，以下假设变量 a 为 10, b为 20:

运算符	逻辑表达式	描述	实例
and	x and y	布尔"与" - 如果 x 为 False，x and y 返回 False，否则它返回 y 的计算值。	(a and b) 返回 20。
or	x or y	布尔"或" - 如果 x 是非 0，它返回 x 的值，否则它返回 y 的计算值。	(a or b) 返回 10。
not	not x	布尔"非" - 如果 x 为 True，返回 False 。如果 x 为 False，它返回 True。	not(a and b) 返回 False

针对逻辑运算的进一步研究：

　　1,在没有()的情况下not 优先级高于 and，and优先级高于or，即优先级关系为( )>not>and>or，同一优先级从左往右计算。

例题：

判断下列逻辑语句的True，False。

,> or < and ==

, <  and  <  or >

, >  and  <  or  >  and  <

, >  and  <  or  >  and  >  or  <

, >  and  <  or  >  and  >  and  >  or  <

,not  >  and  <  or  >  and  >  and  >  or  <

2.7、流程控制语句

2.7.1、流程控制------if

假如把写程序比做走路，那我们到现在为止，一直走的都是直路，还没遇到过分叉口，想象现实中，你遇到了分叉口，然后你决定往哪拐必然是有所动机的。你要判断那条岔路是你真正要走的路，如果我们想让程序也能处理这样的判断怎么办？很简单，只需要在程序里预设一些条件判断语句，满足哪个条件，就走哪条岔路。这个过程就叫流程控制。

if...else 语句

单分支

if 条件:

    满足条件后要执行的代码

双分支

"""

if 条件:

    满足条件执行代码

else:

    if条件不满足就走这段

"""

AgeOfOldboy = 48

if AgeOfOldboy > 50 :

    print("Too old, time to retire..")

else:

    print("还能折腾几年!")

缩进

这里必须要插入这个缩进的知识点

你会发现，上面的if代码里，每个条件的下一行都缩进了4个空格，这是为什么呢？这就是Python的一大特色，强制缩进，目的是为了让程序知道，每段代码依赖哪个条件，如果不通过缩进来区分，程序怎么会知道，当你的条件成立后，去执行哪些代码呢？

Python的缩进有以下几个原则:

*代码必须顶行写，即如果一行代码本身不依赖于任何条件，那它必须不能进行任何缩进
同一级别的代码，缩进必须一致
官方建议缩进用4个空格，当然你也可以用2个，如果你想被人笑话的话。

多分支

回到流程控制上来，if...else ...可以有多个分支条件

if 条件:

    满足条件执行代码

elif 条件:

    上面的条件不满足就走这个

elif 条件:

    上面的条件不满足就走这个

elif 条件:

    上面的条件不满足就走这个

else:

    上面所有的条件不满足就走这段

例子：

要求用户输入0-100的数字后，你能正确打印他的对应成绩

复制代码

score = int(input("输入分数:"))

if score > :

    print("不能超过最高分100分...")

elif score >= :

    print("A")

elif score >= :

    print("B")

elif score >= :

    print("C")

elif score >= :

    print("D")

else:

    print("重新学吧，老铁")

2.7.2、流程控制-----while循环

while 条件:

# 循环体

# 如果条件为真，那么循环体则执行

# 如果条件为假，那么循环体不执行

循环中止语句 

如果在循环的过程中，因为某些原因，你不想继续循环了，怎么把它中止掉呢？这就用到break 或 continue 语句

break用于完全结束一个循环，跳出循环体执行循环后面的语句

continue和break有点类似，区别在于continue只是终止本次循环，接着还执行后面的循环，break则完全终止循环

例子：break

i =

while i <=  : #只要i<=100就不再执行下面的代码

    print("loop ", i)

    if i == :

        break

    i += #每执行一次，就把i+，要不然就变成死循环啦，因为i一直是0

print("-----out of while loop ------")

输出结果：

world

world

world

world

world

world

-----out of while world ------

例子：continue

i =

while i <=  :

    i +=

    if i >  and i < : #只要i在6-94之间，就不走下面的print语句，直接进入下一次world

        continue

    print("world ", i)

print("-----out of while world ------")

输出：

world

world

world

world

world

world

world

world

world

world

world

world

-----out of while world ------

练习题：

# 、使用while循环输入

#!/usr/bin/python

#coding:utf-

count =

while count <:

    # if count ==:

    #     count +=              #此处注释部分代码表示如果遇到7就直接+，然后打印出来。

    print(count)

    count+=

# 、求1-100的所有数的和

第一种方法：

count =

sum =

while count <:

    sum +=count

    print(sum)

    count +=

第二种方法：

n =

for x in range():

    n+=x  #n=n+x

    print(n)

x =   n=n+x  n=+

x =   n=n+x  n=+

x =          n=+

......

# 、输出 - 内的所有奇数

count =

while count < :

    if count %==:

        print(count)

    count +=

# 、输出 - 内的所有偶数

count =

while count <:

    if count %==:

        print(count)

    count +=

# 、求1-+-+ ... 99的所有数的和

sum =

count =

while count < :

    if count %  == :

        sum -= count

    else:

        sum += count

    count +=

print(sum)

练习题

码农公寓