前言
emoji也属于字符串的范围。
Emoji是用于电子信息和网页的表意文字和表情符号,起源于20世纪90年代。
安装
pypi 有现成的库 emoji 来处理 emoji 字符串:
pip install emoji
函数列表
demojize: 将unicode emoji替换为字符串简码用于存储
emoji_count: 返回字符串中emoji的数量
emoji_lis: 返回字符串中emoji的位置
emojize: 将字符串简码替换成unicode emoji
get_emoji_regexp: 返回编译后的正则表达式,匹配`emoji.UNICODE_EMOJI_ALIAS`
其实emoji库主要也就是最常用的有两个函数:
emojize() ——>生成emoji表情
demojize() ——>emoji表情解码
全部表情
1、共有2811个emoji
import emoji print(len(emoji.EMOJI_UNICODE)) # 2811
2、全部输出
import emoji for k, v in emoji.EMOJI_UNICODE.items(): print(v, end=‘ ‘)
输出结果:
示例
import emoji print(emoji.emojize(‘Python is :thumbs_up:‘)) print(emoji.emojize(‘Python is :thumbsup:‘, use_aliases=True)) # 使用别名 print(emoji.demojize(‘Python is ??‘))
# Python is ?? # Python is ?? # Python is :thumbs_up:
输出结果:
①Windows的PyCharm输出emoji:
②CentOS 7.4输出emoji:
③手机输出emoji:
用Python输出Emoji表情
1、代码示例:
print("\U0001F917") print("\U0001F637") print("\U0001F62A") print("\U0001F618") print("\U0001F600")
2、输出结果:
??
??
??
??
??
3、更多Emoji Unicode编码请参照:
https://apps.timwhitlock.info/emoji/tables/unicode#block-6c-other-additional-symbols
python之emoji表情处理
源数据:
处理:
我的目的是把emoji表情剃掉,所以还需要用到re库,re就不详细叙述了。
# 导入库 import emoji import re # 打开文件 with open(‘E:/python练习文件/emoji_txt.txt‘,encoding=‘UTF-8‘) as f: data = f.read() # print(emoji.demojize(data)) #测试一下成功没?以及看看emoji代码 content = re.sub(‘(\:.*?\:)‘, ‘‘, emoji.demojize(data)) print(content)
结果:
源文件
记录:face_with_tears_of_joy:
嗯嗯
组长:party_popper::party_popper::party_popper:
来吧
回收:face_with_tears_of_joy:
大家记得哈:face_with_tears_of_joy:
你坐哪呢?
处理后
记录
嗯嗯
组长
来吧
回收
大家记得哈
你坐哪呢?