python设置匹配中文的方法

这篇文章给大家分享的是有关python设置匹配中文的方法的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。

中文字符的编码范围是:

\u4e00-\u9fa5

使用正则匹配中文

# -*- coding:utf-8 -*-

import re

'''
python 3.5版本
正则匹配中文,固定形式:\u4E00-\u9FA5
'''

words = 'study in 广州大学'
regex_str = ".*?([\u4E00-\u9FA5]+大学)"
match_obj = re.match(regex_str, words)
if match_obj:
    print(match_obj.group(1))


结果:广州大学

感谢各位的阅读!关于python设置匹配中文的方法就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到吧!