当前位置: 首页 > news >正文

二十一、【鸿蒙 NEXT】分词和汉字转拼音

【前言】

在某些功能场景,比如实现一个本地搜索功能时,可能需要支持中文搜索,同时支持拼音搜索。这里就会涉及到两个功能点,一个是中文转拼音,一个是将中文进行分词。同时这里有个注意点如果调用系统接口进行批量分词时,使用不当会导致UI卡顿。下面介绍下在鸿蒙next系统中,怎么实现这两个功能,以及怎么避免UI卡顿

1、中文转拼音

在系统接口中有个i18n的工具类,该工具类提供了一个Transliterator工具类,可以实现中文转拼音能力,代码如下

其中res1是包含声调的,res2是不包含声调的

let res1:string = i18n.Transliterator.getInstance('Han-Latin').transform('中国') let res2:string = i18n.Transliterator.getInstance('Latin-ASCII').transform(res1)

2、分词

在做功能搜索功能时,会将功能名称分词出不同的词语,来适配用户的搜索。这里系统提供了一个 分词功能,textProcessing是系统分词的一个工具类,代码如下,代码将“词语搜索”四个字分词层“词语”和“搜索”两个词

textProcessing.getWordSegment('词语搜索').then(wordSegments => { let words = wordSegments.map(wordSegment => wordSegment.word) console.log(`词语搜索 => ${JSON.stringify(words)}`) })

3、分词的注意点

这里要注意一点,如果使用不当,可能会造成UI界面的卡顿。

在调用系统分词接口时,实际是跨进程调用系统能力。如果我们一次性循环调用很多次分词接口,由于系统的分词进程最大开两个线程处理分词。因此我们如果循环大量调用接口,会导致我们app一直处于等待状态,而且会影响UI的正常展示。这种阻塞即使我们在app中启动子线程去调用系统接口,也没法起到效果。因为实际上我们跨进程调用分词接口时,本身会启动一个子线程去调用,真正造成UI卡顿的原因是,我们循环大批量开启跨进程调用,会导致app的线程资源耗尽,导致我们app其他线程无法正常获取线程资源。比如会影响网络请求,我们很多UI的展示依赖网络请求的返回值,由于线程资源耗尽,网络请求只能等待。从而影响UI正常展示。

解决方法就是我们可以分批次调用系统接口,比如每批次调用4次,等到前面的处理完成后,再继续下一批次调用。完整的代码实现如下,这里首先在app子线程去做分词功能,并在子线程中分批次调用。我们最终在app启动时调用SegmentUtil.segment();方法实现批量分词效果

// 分词工具类,开启子线程执行 import { textProcessing } from "@kit.NaturalLanguageKit" import { PromiseBatchUtils } from "./PromiseBatchUtils" import { taskpool } from "@kit.ArkTS" export class SegmentUtil { public static async segment() { let segmentResult = await taskpool.execute(segments) as Promise<string[][]> console.log(`segmentResult is ${JSON.stringify(segmentResult)}`) } } @Concurrent async function segments():Promise<string[][]> { let arr:string[] = ['词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索'] let arrPromise:(()=>Promise<string[]>)[] = arr.map(str => async () => { let wordSegments = await textProcessing.getWordSegment('词语搜索') return wordSegments.map(wordSegment => wordSegment.word) }) let result = await PromiseBatchUtils.runWithBatch(arrPromise, 4) return result } // 分批次调用系统分词 export class PromiseBatchUtils { public static async runWithBatch<T>(tasks:(() => Promise<T>)[], batchNum:number):Promise<T[]> { let results:T[] = [] let execute:Promise<void>[] = [] let index = 0 while (index < tasks.length) { if (execute.length < batchNum) { let taskIndex = index++ console.log(`start index ${taskIndex}`) let executePromise = tasks[taskIndex]() .then(result => { results[taskIndex] = result console.log(`end index ${taskIndex}`) }).finally(() => { let executeIndex = execute.indexOf(executePromise) if (executeIndex > -1) { execute.splice(executeIndex,1) } }) execute.push(executePromise) } else { await Promise.race(execute) } } await Promise.all(execute) return results } }
http://www.jsqmd.com/news/94143/

相关文章:

  • 2025水处理设备行业定制榜:细分领域痛点解决企业推荐 - 极欧测评
  • Qwen3-14B与ollama下载配置兼容性问题解决方案
  • SAP CDS---拼接字段和类型转换和join关联
  • web服务器常见配置搭建详解(超详细)
  • 2025年Q4蒸汽发生器厂家选哪家?基于安全与能效的多维度解析,助力企业科学选型 - AIEO
  • AI如何优化日志监控:tail -f 的智能升级
  • 2025年终傅里叶红外行业领先企业盘点,国内傅里叶/傅立叶红外生产商/国产品牌口碑推荐 - 品牌推荐大师1
  • IT运维转大模型,6个月实现薪资翻倍,零基础也能年薪50万!非常详细收藏这一篇就够了
  • 基于Windows Server 2025快速搭建开发测试环境
  • ERP 与 MES 的集成通过 iPaaS 全部异步化可行吗?_
  • GEO优化数据统计分析系统:DeepAnaX如何以智能数据引擎重塑AI时代的营销竞争力
  • 基于SpringBoot2+Vue2的行业知识答题考试系统
  • Day2 4. A+B问题IV -卡码网C++基础课
  • 2026年成都品牌主,如何选择AI优化搜索(AI GEO)合作伙伴,附压箱底选购技巧 - 奇林智媒GEO
  • LangChain + MCP:AI如何重构智能应用开发流程
  • AI如何帮你轻松搞定正则表达式?
  • 盘点游戏生化危机中人类战力梯队排名
  • 5分钟搭建ORA-01033诊断工具原型
  • SSR 场景下的 Data Hydration(注水):如何减少前后端状态同步时的重复计算开销
  • 2025水处理设备国际服务榜:标准适配与跨境保障企业推荐 - 极欧测评
  • AutoGPT镜像部署最佳实践:提升效率的关键一步
  • 位置式PID调节PWM占空比控制电动机转速的程序方案
  • 如何备份docker images
  • 利用gpt-oss-20b构建企业级智能客服系统的技术路径
  • 传统vsAI:ORA-01033处理效率对比实验
  • SQL Server 2008 R2中NVARCHAR(MAX)与NTEXT区别
  • 2025年电饭煲如何选?十大易清洗型号推荐,从此告别清洁烦恼 - 品牌推荐排行榜
  • LobeChat能否支持GraphQL Mutations?数据写入操作
  • 云网融合助力运营商数字化转型
  • LobeChat历史会话搜索功能怎么开启?提升信息查找效率