string = re.sub(r"[^A-Za-z0-9(),!?’`]", " “, string) 除A-Za-z0-9(),!?’`外的字符,去除
string = re.sub(r’(.)\1+’, r’\1\1’, string) 匹配两个以上连续的字符,只保留两个连续的字符
string = re.sub(r”'s", " 's", string) 匹配 '跟一个空格字符,在’前加个空格
string = re.sub(r"'ve", " 've", string) 've 在’前加个空格
string = re.sub(r"n’t", " n’t", string) n’跟制表符,在n前加空格
string = re.sub(r"'re", " 're", string) 're 在’前加个空格
string = re.sub(r"'d", " 'd", string) 'd在’前加个空格
string = re.sub(r"'ll", " 'll", string) 'll在’前加个空格
string = re.sub(r",", " , “, string) ,前后各加空格
string = re.sub(r”!", " ! “, string) !前后 各加空格
string = re.sub(r”(", " ( “, string) (前后加空格
string = re.sub(r”)", " ) “, string) )前后加空格
string = re.sub(r”?", " ? “, string) ?前后 加空格
string = re.sub(r”\s{2,}", " ", string) 两个以上连续的空白符,删除
相关文章
- 04-10字符串预处理
- 04-10日期类型/字符串类型互转
- 04-10获取唯一字符串
- 04-10NSAttributedString字符串属性类
- 04-10PowerSensorAI教程2-石头剪刀布-彩色数据预处理
- 04-10ListBox获取行字符串
- 04-10C语言输入和输出字符串的三种方式
- 04-10长度有限制的字符串hash函数
- 04-10数据预处理
- 04-10字符串格式化