最近写程序,遇到了一些问题然后整理一下解决方法。
- 怎么将一句话中的中文数字转换为阿拉伯数字
比如 “第两千三百二十章” —> 2320
方法一: 可以使用cn2an
参考链接:Python使用cn2an实现中文数字与阿拉伯数字的相互转换
有normal模式和smart模式,分别可以将“一二三”转换为“123”、“一万二”转换为12000
但是我安装这个包出错了,所以没有用。
方法二:
Python实现中文数字转换为阿拉伯数字的方法示例
python将中文数字与阿拉伯数字互换
代码如下:
def trans_han_to_nums(uchars_chinese):
common_used_numerals_tmp ={'零':0, '一':1, '二':2, '两':2, '三':3, '四':4, '五':5, '六':6, '七':7, '八':8, '九':9, '十':10, '百':100, '千':1000, '万':10000, '亿':100000000}
common_used_numerals = {}
for key in common_used_numerals_tmp:
common_used_numerals[key.encode('utf-8').decode('utf-8')] = common_used_numerals_tmp[key]
if u'十' in new_chapter_han or u'百' in new_chapter_han or u'千' in new_chapter_han: #解决“一万二”这种问题
total = 0
r = 1 # 表示单位:个十百千...
for i in range(len(uchars_chinese) - 1, -1, -1):
val = common_used_numerals.get(uchars_chinese[i])
if val >= 10 and i == 0:
if val > r:
r = val
total = total + val
else:
r = r * val
elif val >= 10:
if val > r:
r = val
else:
r = r * val
else:
total = total + r * val
else: #解决“一二三”这种问题
val = []
for s in uchars_chinese:
val.append(str(common_used_numerals.get(s)))
num = ''.join(val)
total = eval(num)
return total
new_chapter_nums = trans_han_to_nums(new_chapter_han.encode('utf-8').decode('utf-8'))
tips: 改了一下链接1中的cp936,cp936为gbk编码,换成了utf-8,还有先编码再解码,不知道为啥需要这样,不然会报错。
- 提取出的数字可能以0开头,这样就不能比较大小,因此,需要
判断数字是否以0开头,是的话去掉0
if new_chapter_num.startswith('0'):
new_chapter_nums = eval(new_chapter_num[1:])
使用了startswith() 函数。
- 怎么根据某个字把字符串分开,比如“第两千三百二十章 终结” 提取出“两千三百二十”
new_chapter = '第两千三百二十章 终结'
new_chapter_temp = new_chapter.split('章')[0][1:] #两千三百二十
e.g.
s=‘hello! my word’
print s.split()
#输出结果为[‘hello!’, ‘my’, ‘word’]
- 判断字符串是否为字母或数字
参考链接Python判断字符串是否为字母或者数字
isdigit()、isalpha()、isalnum()函数
但我的需求是判断一句话种是否有数字,因此这个方法不适合,采用的是:
new_chapter_temp = '第230章'
if bool(re.search(r'\d', new_chapter_temp)): #如果有数字则为True
print('xx')
–>> xx