您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

找出字符的unicode脚本

找出字符的unicode脚本

我希望有人以前做过,但是显然没有,所以这就是我最后的目的。下面的模块(我称它为unicodedata2)进行了扩展,unicodedata并提供了script_cat(chr)它为unicode char返回一个元组(脚本名称,类别)。例:

# coding=utf8
import unicodedata2
print unicodedata2.script_cat(u'Ф')  #('Cyrillic', 'L')
print unicodedata2.script_cat(u'の')  #('Hiragana', 'Lo')
print unicodedata2.script_cat(u'★')  #('Common', 'So')

模块:https//gist.github.com/2204527

其他 2022/1/1 18:27:24 有403人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶