您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

如何在Python中按字母顺序对unicode字符串排序?

如何在Python中按字母顺序对unicode字符串排序?

IBM的ICU库可以做到这一点(还有更多)。它具有Python绑定:PyICU

:在ICU之间进行排序的核心区别locale.strcoll在于,ICU使用完整的Unicode排序算法,strcoll使用ISO14651

此处简要总结了这两种算法之间的区别:http ://unicode.org/faq/collat??ion.html#13。这些是非常奇特的特殊情况,在实践中几乎没有关系。

>>> import icu # pip install PyICU
>>> sorted(['a','b','c','ä'])
['a', 'b', 'c', 'ä']
>>> collator = icu.Collator.createInstance(icu.Locale('de_DE.UTF-8'))
>>> sorted(['a','b','c','ä'], key=collator.getSortKey)
['a', 'ä', 'b', 'c']
python 2022/1/1 18:16:23 有458人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶