问题:在项目中搜索所有中文

JavaScript/前端
334
0
0
2022-12-15

问题

因项目需要,需要将项目中所有的中文改为英文版本。故需要搜索项目中所有中文。用到的IDE为vscodeIntelliJ IDEA

解决方法

使用正则表达式进行匹配。

经查询中日韩统一表意文字(CJK Unified Ideographs)unicode范围是4E009FFF

另一个常需要进行匹配的是中文的标点符号,经过查询,中文标点符号的范围是FF00FFFF

故可以使用下述正则表达式:

  • [\u4E00-\u9FFF]+:中文文字匹配
  • [\uFF00-\uFFFF]+:中文标点符号匹配
  • ([\u4E00-\u9FFF]|[\uFF00-\uFFFF])+:匹配中文或标点符号

经测试,在vscodeIntelliJ IDEA都可以正常匹配。

注意:上述范围并不包含所有文字,CJK还包含A到H等8个扩展集。

参考资料: