[正则表达式实践1] 使用正则表达式提取商品的数字属性

1. 需求背景

商品名称或商品详情中往往直接包含了商品的数字特性,有时需要提取这些数字特性再进行下一步的处理,如:

-----------------------------------------------------
商品的价格,X1元X2元X3元

商品的规格,10个装20个装50个装

商品的长度,1米1.5米2米5米

商品的尺寸,5cm10cm20厘米

商品的功率, 10w15w20w25w

-----------------------------------------------------

2. 实例实践

以提取白炽灯的功率数字特性为例进行说明

import re
str = "普通灯泡e27/e14螺口钨丝小球泡5w15w25w40W老式白炽灯可调光灯泡 E27球明(球型) 40瓦 其它"
# 输出所有的数字特性
print(re.findall(r"\d+",str)
# 输出数字特性及紧跟其后的一个字符
print(re.findall(r"\d+\w",str))
# 输出指定单位的数字特性
print(re.findall(r"(\d+)[w,W,瓦]",str))

输出结果为:

[正则表达式实践1] 使用正则表达式提取商品的数字属性

 

 

上一篇:爬虫需要用到的正则表达式


下一篇:python学习(十)正则表达式