当前位置: 首页 > news >正文

知识图谱实战(BILSTM+CRF)【第五章】

一、BiLSTM+CRF模型介绍

  • BILSTM是双向的LSTM,本身是做信息捕获的,需要在上面加一层线性层进行输出标签的概率分布
  • 只用BILSTM可以做NER任务,可以用发射分数最高的作为标签,但是效果可能不是最佳的,因为他只考虑词的局部最高概率,不会考虑考虑整个语义.
  • CRF模型负责生成转移分数,我们训练CRF也是为了获取转移分数矩阵
  • Decoding Process 通过相加发射分数和转移分数,获取最佳的路径.
  • CRF输出的是转移分数矩阵

二、线性链条件随机场

线性链:输入序列x和输出标签序列y都是线性序列

条件随机:给定x的条件下,输出y的条件概率分布,需要满足马尔可夫性质

场:用图结构来描述概率依赖关系

马尔科夫性质:生成的标签只和前一个标签和后一个标签有关系,与其他标签或者序列无关。

线性链条件随机场图示:

三、发射分数和转移分数

3.1发射分数

发射分数由BILSTM+线性层产生,主要用于生成标签权重。

执行流程:

用户输入序列进来,首先进行向量化,然后经过BILSTM的隐藏状态处理,因为BILSTM是双向的LSTM,所以得到的维度要乘以2,最后经过一个线性层把维度转换为标签数即可。

3.2转移分数

转移分数越高,转移的概率越大

转移矩阵是线性CRF生成的

转移分数矩阵:

转移矩阵是可以学习的矩阵,可以通过训练得到准确的结果

四、CRF最优序列计算方式

发射分数根据标签的位置选择:

比如B-Person位置是(0,1),那么他的发射分数是E00

转移分数则是根据标签的上下文来选择:

比如B-Person的下一个是I-Person,那么就在第二个矩阵中选择0.93.

五、Viterbi解码

CRF输出的是转移分数矩阵,需要使用viterbi解码的方式获取最终的最优路径

  • 原始结算最短路径的方法:分别计算每条路径的长度,然后比较大小

Viterbi算法解决最短路径的

先计算第一列所有的节点和第二列B1的和,然后得到一个最小的,只保留这一条,然后B3

计算的方法类似

然后计算

最后选出最短的即可

http://www.jsqmd.com/news/550456/

相关文章:

  • python-flask-djangol框架的 综合游戏攻略社区论坛交流系统的设计
  • 3步解决Atlas OS中Xbox登录错误0x89235107的实用方案
  • 当 AI 开始制造 AI:递归自我提升时代的人类工程师生存指南
  • 服务器CPU飙到300%?手把手教你排查并清理Linux kswapd0挖矿病毒(附日志分析技巧)
  • FastReport之实现打印固定行数,不足补打空白行的办法
  • 别再死磕Release了!用Debug模式打包Qt exe,一次搞定所有dll依赖(附GPT脚本生成技巧)
  • 用PyTorch复现掌纹识别顶会论文:从VGG16到ResNet152的模型蒸馏踩坑实录
  • 利用快马平台快速原型:在Ubuntu上验证OpenClaw数据抓取工具
  • 从视频流到网络包:一个IP搞定多路数据缓冲!AXI Virtual FIFO Controller在Zynq上的实战应用
  • 利用快马平台与git快速构建可迭代的web应用原型
  • 3个实用方法让Windows系统性能提升40%:从卡顿到流畅的优化指南
  • 黄仁勋最新演讲:未来你的工资可能是“年薪+Token”,不会用AI的人危险了
  • 宠物围栏与护栏设计是什么?主要包括哪些特色?
  • 为什么你的视觉检测准确率卡在92.7%?(揭秘工业现场3类未标注异常数据导致的模型过拟合代码根源)
  • 协作机器人研究范式革新:OpenArm开源平台的低成本高自由度实践
  • 零代码搞定工业质检:用阿里云百炼+PAI,2天从产线图片到AI模型部署全流程
  • 前端使用AI试水报告
  • 卡沐咨询费用高吗
  • abaqus晶体塑性有限元分析 晶体塑性黄永刚 晶体塑性有限元 粘塑性自洽晶体塑性 梯度 损伤...
  • 计算机毕业设计springboot工学院学生综合测评管理系统 SpringBoot框架下工科院校学生多维能力评价平台 基于Java技术的工程类高校学生综合素质考核系统
  • 不只是 Copilot:一个完整 AI 软件交付团队的实践 - iforgeAI - 用更少的Tokens,办大事
  • 知名企业号码认证服务商:实现全网号码品牌化展示 - 企业服务推荐
  • all-MiniLM-L6-v2多场景应用:知识库检索、FAQ匹配、文档去重等落地案例
  • Nacos服务注册与发现:从零搭建一个高可用的微服务集群
  • BilibiliDown深度指南:从零掌握B站视频下载的7大核心技巧
  • Umi-OCR:免费开源OCR工具的高效解决方案与全方位指南
  • 基于YOLOv5与海康工业相机的高分辨率实时检测系统搭建
  • 告别代码焦虑!用Yi-Coder-1.5B快速生成Java/Python/Go代码实战
  • RRT算法实战:5个技巧让它从‘能用’变‘好用’,解决狭窄通道与路径平滑难题
  • DC仿真