Python基础学习二
1.编码
utf-8编码:自动将英文保存为1个字符,中文3个字符。ASCll编码被囊括在内。
unicode:将所有字符保存为2给字符,容纳了世界上所有的编码。
2.字符串内置函数
replace()函数:替换字符串内字符
str1='a1234'
str2=str1.replace('a','A') #将字符a替换为A
需要注意的是,在函数replace()的作用下,虽然修改了str1的内容,但是变量str1不变,其修改存储在str2中。
ord()函数:获取字符的utf-8编码的整数形式。
ord('A') #输出65
ord('中') #输出20013
chr()函数:将utf-8的整数形式转换为对应字符。
chr('67') #输出'C'
chr('25991') #输出'文'
encode()函数:获取字符对应编码方式的16进制形式。
'我'.encode('utf-8') #输出b'\xe6\x88\x91'
其中b表示以字节的方式存储,在utf-8编码中,中文有3个字节,转化为三个16进制数。
decode()函数:解码函数,将上述得到的数字按照对应的编码形式翻译为对应字符
b'\xe6\x88\x91'.decode('utf-8',errors='ignore') #输出'我'
其中errors='ignore'表示忽视错误字节,如输入四个字节时,默认读取前三个。
len()函数:用于计算字符串的长度或字节数
3.指定utf-8编码
为了确保解释器以utf-8编码读取文件,需要在文件开头写上两行注释
# !/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行用于告诉Linux操作系统,这是Python文件,第二行说明文字编码方式。
4.变量输出
与C语言相同,用“%”获取,格式如下
'Today is %s , i have $' % ('good','10000')
格式 | 内容 |
---|---|
%d | 整数 |
%f | 浮点数 |
%s | 字符串 |
%x | 16进制数 |
%% | % |
format()函数:用于传入参数
'Hello, {0}! You have ${1}'.format('li',100000)