\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下

复制代码代码如下:

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

或许你也需要匹配双字节字符,中文也是双字节的字符
复制代码代码如下:

匹配双字节字符(包括汉字在内):[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)