python自学笔记（二）python基本数据类型之字符串处理

2023-11-30 12:37:28

一、数据类型的组成分3部分：身份、类型、值

身份：id方法来看它的唯一标识符，内存地址靠这个查看

类型：type方法查看

值：数据项

二、常用基本数据类型

int 整型

boolean 布尔型

string 字符串

list 列表

tuple 元组

dict 字典

三、数据类型的可变和不可变

不可变类型：int，string，tuple

可变类型：list，dict

python基本数据类型讲解

一、len 之需注意

例如：字符串"asd234"

默认的文件编码都是ascii码

unicode编码能描述全世界大部分语言，它只是一套标准，各国家的存储方式不一致

utf8是一种unicode编码的实现标准，这期间万维网的出现，正好需要一套标准来统一，utf8能根据各国操作系统的语言不同，选择对应的unicode编码

a = "哈" 默认是ascii编码 3个字节

a = u"哈" 用前面带u 这中方式转成unicode编码或者 b = a.decode('uft-8') 解码，两种方式打印出的len 就是一个字节了。

二、转义符让文本更好处理

a = "ad\n\r" 换行回车

三、字符串前面的小尾巴作用

a = r"abc\n" 不转义输出 ab\n

四、访问子字符串，序列来了（查找字符串）

a = "abcde"

print a[0] -->a

print a[len(a) - 1] 或 a[-1] 表示最后一个元素

a[0:] 从0位到最后 abcde

a[0:1] 大于等于左边的，小于右边的，就是大于等于第0位置，小于第一位，那就只剩下是第0位元素了就是输出 a

a[1:3] 输出 bc

a[4:3] 大于等于第4位，小于第3位，也就是从后往前查找，也就是输出 e

a[:-1] 默认从第0位开始，可以省略0 不写，小于最后一位(不包括最后一位) 输出 abcd

五、字符串拼接

1、超级丑陋的（不推荐）

a = 'ab'

b = 'cd'

c = a + b 输出 abcd

2、可选方案支字符串模板（占位符）

例如输出 "my name is niuniu"

print ("my name is %s" % "niuniu") %s 是字符串占位符 %d是数字占位符

print ("my name is %s %s" % ("niuniu","zhenshuai")) 元组方式

3、推荐拼接的方案

a = "a"

b = "bcd"

c = "ef"

"".join([a,b,c]) 里面是list(数组) -->"abcdef"

",".join([a,b,c])-->"a,bcd,ef" 也可以用其他字符分割

六、字符串修改和查询 replace、find

a.replace("旧"，"新") 替换

a.find("world") 返回下标，-1为没找到

a.rfind()从右向左查找

a.index("world")返回下标，没找到会报错

a.count(",")查找有个数

七、formart格式化（%s %d的格式化不容易管理，位置不能变）

用法1

b = "this {1}{0}".format("apple","my")

print b --> this is my apple

用法2

b = "this is{whose}{fruit}".format(fruit = "apple", whose = "my")

print b --> this is my apple

用法3 用字典来完善 %s %d的格式化

b = "this is %(whose)s %(fruit)s" %{"whose":"my","fruit":"apple"}

print b --> this is my apple

ps：help("str") 命令行方法，可查找所有系统封装的字符串函数方法

码农公寓

相关文章