当前位置: 首页 > news >正文

【硬核解析】千问请喝奶茶口令中奇怪但能看懂的字是怎么打出来的

不知道大家有没有发现,这几天千问通义的分享文案悄悄改了,仔细看每个字都多了“一点”,并且这个点并无法单独选中。

注意每个字的上、下方有额外的点

原理探究

把这个字转为Unicode看看,发现这是两个字符,这个点的unicode编码是0308

拿去unicode官网查一下,找到这个字符对应的区域

可以看到0300-036F这个区间,是属于“组合附加符号”,意思就是这些字符可以附加到任何文字上,让他们看起来就是一体的。

并且这是属于可见但不占位的字符,所以无法被选中。

知道了这个,那我们就可以为所欲为的造“异形字”了

千问为什么要这么做?

目的只有一个,那就是尽可能的绕过社交平台的敏感词检测,防止被封杀

扩展:还有哪些被非法使用的字符

康熙部首

这个此前在小红书看到还蛮多人用的,效果如图所示

如果你不换字体就不会发现这些字它不是常用字

小红书上的异形字

短信中经常出现

图里标出来的不是现代汉语,属于康熙部首,这两者在unicode是不同区域,由于康熙部首中有大量和现代汉语相同的字(但编码不同),所以就可以利用这点进行替换文字

是不是有同学抱怨手机短信设置了关键字但还是有没拦住的,现在知道原理了吧。

零宽字符

零宽,就是没有宽度,看不见(代表有200B、200C、200D、FEFF)

为啥特地提这个呢?

因为很多很多的程序过滤使用正则表达式\s+,但是\s+只会过滤空格、水平/垂直制表符、换行、回车和换页符。

所以在正常字符中加入零宽字符,人眼既看不见,又能绕过审核程序

控制符

看过图片木马科普那期的同学应该很熟悉了。顾名思义,控制符可以控制文本的显示方向。而如果程序没处理好,就可以制造出如图不一致的消息

同样,如果审核系统是正则匹配\s+,那一样无法过滤掉该类字符,导致关键词无法命中

同一条消息,苹果显示51,安卓显示15

其他

像全角字母数字、数学字母、同形字母、相似汉字这些我就不举例了,这些应该是大家知道得最多的“骗过程序但是人又看得懂的手段”。

值得一提的是,20年的时候还有使用 rn = m 来伪造微软域名,与汉字中“米果”这种拆分组合可谓异曲同工

真假微软名称

本期解析就到这了,如果有什么想看的可以评论区给我留言

参考资料(#替换为.)

中文字符Unicode编码范围:

lddgo#net/string/cjk-unicode

unicode标准:

unicode#org/charts/

千问用到的组合附加符号:

unicode#org/charts/PDF/U0300.pdf

声明

本文为原创,图片有水印是因为我首发不在CSDN

http://www.jsqmd.com/news/523790/

相关文章:

  • 一文读懂:Git、Github、GitLab、SVN(附:快速上手 Git,用 VSCode 操作 Git )
  • CLIP
  • 【Day30】卡码网:46. 携带研究材料,LeetCode:416. 分割等和子集
  • 力扣刷题——104.二叉树的最大深度
  • VIT
  • 这里藏着电力系统的核心评判指标
  • Gemini 3场景化应用指南:原生多模态与超长上下文能解决哪些实际问题?
  • 倒数第四天
  • InnoDB底层原理之MySQL的日志机制
  • Visual Place Recognition
  • 密码学学习记录
  • Go语言基础之数组
  • 世毫九实验室九大衍生理论课题与技术攻关方向(初审意见)
  • ai---openClaw 配置企业微信
  • CloudFlare域名接入与Nginx真实IP获取实战指南
  • LeetCode 234. 回文链表
  • 永磁同步电机FOC最小损耗算法
  • ESP32开发板国内镜像加速安装指南(附2023最新可用JSON地址)
  • 48个适合人力资源工作和运营的AI提示词
  • 基于MATLAB Simulink的PEM电解槽制氢仿真模型研究
  • 【认知雷达(Cognitive Radar)与深度学习融合架构】第5章 LSTM时序预测与多目标轨迹关联
  • 探索异构混合阶多智能体系统的一致性:UGV 与 UAV 的协同之旅
  • 51单片机初相识
  • 基于多因子定价模型解析:美元强势与利率预期重构驱动的金价8连跌机制
  • Cube MX实战:如何用STM32F系列和ADS1255构建高精度电流源(附完整代码)
  • 分布式驱动电动汽车:最优横摆力矩控制与规则扭矩分配控制的对比研究——基于LQR计算与最小附着利...
  • 聚焦镀锌管/角钢/方管/螺旋管,精选本土标杆企业,助力工程采购决策 - 深度智识库
  • Timer-S1 正式发布:首个十亿级时序基础模型,预测性能达到 SOTA
  • 从这8道Swift题逆袭大厂:2025最新类型系统考点精讲(含泛型实战)
  • 从干系人管理到项目交付:绩效域全流程避坑指南