问题
因项目需要,需要将项目中所有的中文改为英文版本。故需要搜索项目中所有中文。用到的IDE为vscode
和IntelliJ IDEA
。
解决方法
使用正则表达式进行匹配。
经查询中日韩统一表意文字(CJK Unified Ideographs)unicode范围是4E00
到9FFF
。
另一个常需要进行匹配的是中文的标点符号,经过查询,中文标点符号的范围是FF00
到FFFF
。
故可以使用下述正则表达式:
[\u4E00-\u9FFF]+
:中文文字匹配[\uFF00-\uFFFF]+
:中文标点符号匹配([\u4E00-\u9FFF]|[\uFF00-\uFFFF])+
:匹配中文或标点符号
经测试,在vscode
和IntelliJ IDEA
都可以正常匹配。
注意:上述范围并不包含所有文字,CJK还包含A到H等8个扩展集。
参考资料: