1. 需求背景
商品名称或商品详情中往往直接包含了商品的数字特性,有时需要提取这些数字特性再进行下一步的处理,如:
-----------------------------------------------------
商品的价格,X1元X2元X3元商品的规格,10个装20个装50个装
商品的长度,1米1.5米2米5米
商品的尺寸,5cm10cm20厘米
商品的功率, 10w15w20w25w
-----------------------------------------------------
2. 实例实践
以提取白炽灯的功率数字特性为例进行说明
import re
str = "普通灯泡e27/e14螺口钨丝小球泡5w15w25w40W老式白炽灯可调光灯泡 E27球明(球型) 40瓦 其它"
# 输出所有的数字特性
print(re.findall(r"\d+",str)
# 输出数字特性及紧跟其后的一个字符
print(re.findall(r"\d+\w",str))
# 输出指定单位的数字特性
print(re.findall(r"(\d+)[w,W,瓦]",str))
输出结果为: