当前位置: 首页 > news >正文

基于Embedding模型微调的中文意图识别模型(18种意图)

轻量级意图识别模型,基于BGE-M3 Embedding模型搭建

训练数据 SetFit/amazon_massive_scenario_zh-CN

核心模型结构

import torch from torch import nn from sentence_transformers import SentenceTransformer class EmbeddingBasedIntentModel(torch.nn.Module): def __init__(self, embedding_model, device) -> None: super().__init__() self.n_classes = 18 self.embedding = SentenceTransformer(embedding_model, trust_remote_code=True).to(device) self.fc = nn.Sequential( nn.Linear(1024, 128), nn.ReLU(), nn.Dropout(0.3), nn.Linear(128, self.n_classes), ).to(device) def forward(self, input_ids, attention_mask): x = { "input_ids": input_ids, "attention_mask": attention_mask } x = self.embedding(x)["sentence_embedding"] x = self.fc(x)

调用方式

from inference import EmbeddingBasedIntentModelWrapper device = "cpu" embedding_path = 'YOUR_PATH_TO_BGE_EMBEDDING' model_checkpoint = "YOUR_PATH_TO_THE_MODEL" model = EmbeddingBasedIntentModelWrapper(embedding_path, model_checkpoint, device) while True: input_text = input("Enter input: ") result = model.classify(input_text) print(result) ''' 以下为输出效果 Enter input: 帮我开个灯 iot Enter input: 青花瓷 play Enter input: 外面冷不冷 weather Enter input: 点个汉堡王 takeaway Enter input: 买张去东京的机票 transport Enter input: 英国伦敦现在几点 datetime Enter input: 给谢老板发个邮件 email Enter input: 提醒我下周六和小王出去玩 calendar Enter input: 定个明天早上9点的闹钟 alarm Enter input: 音量调到最小 audio '''

训练脚本,模型 checkpoint请见Github

训练分数

IntentAccuracy
News0.847
Email0.963
IOT0.968
Play0.946
General0.608
Calendar0.925
Weather0.936
QA0.878
Takeway0.895
Lists0.852
Transports0.919
Social0.877
Datetime0.951
Music0.840
Cooking0.847
Alram0.990
Recommendation0.830
Audio0.935
Average0.889
http://www.jsqmd.com/news/511809/

相关文章:

  • java-modbus-读取-modbus4j
  • 用于光镊的Ince高斯光束
  • 聊聊千誉咨询可以信任吗,它在杭州企业中的口碑怎么样 - 工业品牌热点
  • LangChain 快速入门:从基础到生产级 AI 智能体搭建
  • jmeter学习记录
  • 题目2575:蓝桥杯2020年第十一届省赛真题-整除序列
  • 2025年OpenRouter免费模型大盘点:53个零成本AI工具全解析(含Grok-4 Fast/Nemotron Nano 9B V2)
  • 分析电商执照注册公司,杭州靠谱的品牌有哪些? - myqiye
  • 工业软件联动想象:SolidWorks模型命名与春联生成结合创意
  • DEAP数据集预处理避坑指南:从原始.mat文件到GCN-ready的图数据,我踩过的那些坑
  • 【2026最新】Bandizip免费下载:快速压缩解压工具(附安装包+图文步骤) - xiema
  • 破局与重构:大型企业级数字化业务运营平台的深度解构与演进之路(WORD)
  • 猫眼团购 mtgsig1.2算法分析
  • U盘文件或目录损坏且无法读取解决方案
  • 探讨2026年杭州电商执照注册公司,费用多少怎么收费? - mypinpai
  • 算法学习-2.基本数据类型
  • Java方法重载
  • 20TB 零误差迁移,存储成本减半:天合富家的 2.6→3.3 进化记
  • 剖析2026年重庆具备防静电塑料垃圾桶的企业排名,哪家口碑好 - 工业推荐榜
  • Claude coda
  • VS2026安装与项目创建指南
  • 【2026年最新600套毕设项目分享】基于SpringBoot的养老中心管理系统(14201)
  • 别再为模型结果不稳定发愁了!PyTorch中一行代码设置随机种子3407的保姆级教程
  • 大数据技术栈全解析
  • Deepsort跟踪效果不好?可能是你的MOT16评估方法有问题
  • 建筑设计师用飞扬就会 BIM 设计了
  • 北京靠谱的买卖合同纠纷律师团队口碑如何 - 工业品网
  • 深入浅出理解Spring:从核心思想到实际应用,吃透面试高频考点
  • 2026年主流降AI工具大盘点:亲测15款降低ai率工具,不花一分钱把AIGC率降到10%以下
  • Windows用户福音:Spark-TTS零样本语音克隆保姆级教程(含CUDA加速配置)