当前位置: 首页 > news >正文

正则的汉字匹配问题

/[U+4E00–U+9FA5]/

这是我们平时最常用的汉字匹配正则表达式,Unicode1.0 收录了 U+4E00–U+9FA5 范围内的文字,共计 20902 个汉字,但问题是这是 1993 年发布的,至今已经过去将近 30 年时间,这中间也已经加入了相当多的汉字。

历史

1993 年,Unicode1.0,/[U+4E00–U+9FA5]/,更新 20902

2000 年,Unicode3.0,扩展 A 区,更新 6592

2001 年,Unicode3.1,扩展 B 区,更新 42717

2003 第一、四、五、六修订,Unicode5.2,扩展 C 区及其他汉字,更新 4149

2010 年,Unicode6.0,扩展 D 区,更新 222

2015 年,Unicode8.0,扩展 E 区,更新 5762

2017 年,Unicode10.0,扩展 F 区,更新 7473

2020 年,Unicode13.0,扩展 G 区,更新 4939

Unified_Ideograph

中日韩统一表意文字。为了统一简体中文,繁体中文,日本,韩文,越南文等文字,在 Unicode 标准中赋予统一编码。

/\p{Unified_Ideograph}/u

\p{}表示根据 Unicode 属性值进行匹配

u 代表任何 Unicode 值都将被转译

参考:

[中日韓統一表意文字 - 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/中日韓統一表意文字)

https://github.com/tc39/proposal-regexp-unicode-property-escapes

http://www.jsqmd.com/news/42921/

相关文章:

  • 2025年北京搬家公司联系电话推荐榜单:速搬国际搬家精选榜单
  • float类型在MySQL中的存储方式
  • 2025年东莞厂房装修公司最新榜单:聚焦仓储物流厂房装修/恒温恒湿厂房装修定制化解决方案
  • Visual Studio 2022(VS2022)激活密钥
  • 贪心:贪心中的偏序关系
  • Flink SQL如何优化查询性能
  • 版本号
  • Flink SQL优化怎样实现高效的数据处理
  • 缓冲区计算问题
  • 13. 安全上下文
  • 12. RBAC
  • JavaScript手写函数
  • 美国本科申请中介怎么选?2025口碑TOP5出炉,藤校资源/申请成功率双保障
  • 2025 最新冷库建造厂家推荐!医药 / 食品 / 物流 / 小型 / 大型 / 自动化冷库建造厂家企业品牌权威排行榜
  • 语句的执行
  • 房产信息管理系统
  • 10. 准入控制器
  • 2025 最新推荐!保定篮球俱乐部培训中心实力榜单:揭秘行业顶尖机构服务与教学优势权威指南
  • work5
  • 2025年南京高功率密度电源公司推荐,高功率密度电源/电源模块/军用电源/全国产化电源/氢能源车载直流转换器生产直销有哪些
  • 2025 年最新推荐冷库安装厂家排行榜,小型冷库 / 医药疫苗冷库 / 智能冷库设备安装实力企业口碑推荐
  • 2025美国研究生申请认准这些机构!藤校offer收割机/背景提升全流程,实力中介测评
  • fdisk linux分区
  • exe文件在linux
  • CAD开发-AutoCAD Code Pack 封装包
  • Wan2.2-I2V-A14B的推理加速库:xFormers与FlashAttention性能测试
  • 常见问题 --- Bad register number passed to arm.get register value
  • 2025 年最新制氮机厂家推荐排行榜:激光切割 / 防爆 / 化工等多场景精选,技术与服务双优指南金属加工制氮机/医药农业制氮机/SMT制氮机公司推荐
  • Wan2.2-Remix - 专注于人物动态、逼真运动和场景一致性图生视频 支持NSFW WebUI+ComfyUI工作流 一键整合包下载
  • eclipse下载 linux