当前位置: 首页 > news >正文

第七节、自然语言处理与bert

(草稿大纲)

一、基础知识:self-attention 自注意力机制

怎么用数据表示文字?

编码为向量:*插入解释 one-hot Encoding

缺点:汉字有大约两万一千个,用来表示每个字,向量太长;体现不出关系

常见的输出:***3种(本篇只包括了前两种)

问题:同一字放在不同语境语义词义不同?但输入一定,模型一定,输出一定。

所以要考虑前后关系*插入课件图片

传输太远(缺点

RNN(循环神经网络)“传家宝”->记忆单元

->长短期记忆(Long short-term memory LSTM)

但是,RNN和LSTM太慢了,只能串行,也就是只能一个字一个字的看

->Self-attention 自注意力机制

如何计算注意力?

1、点乘 (缺点固定

2、qurry-> 经过soft-max公式,注意力和为一

参数:wq\wv\wk

经过self-attention特征维度不变

token:768向量???

bert:一个特征提取器。无监督学习

Bert-Pre-Training

Masked Language Model

使用[mask]遮盖

Next Sentence Prediction:??

Bert:预训练任务

//////Bert结构

//////embedding->bert layers->pooler(池化输出)

Bert输入Embedding

Ea Eb..分辨是哪个句子

Bert输出pooler(4种):

总结:一、字的表示:768/1024..One-Hot

二、为了知道上下文,引入了RNN和LSTM

三、上面的模型不能并行,速度慢,只能单向,引入Self-attention

四、Self-attention

五、Bert

六、Bert架构:三部分

http://www.jsqmd.com/news/461514/

相关文章:

  • bazel version 单独运行报WARNING
  • 如何在汽车产品生命周期的不同阶段开展 HARA
  • “自动驾驶,AutoWareAuto框架全解析:融合感知、定位、决策规划、控制与预测模块的代码...
  • 2026常州ERP企业选择哪家好?关键考量因素解析 - 品牌排行榜
  • 超详细 VS Code 安装教程(Windows/macOS/Linux),附配置优化全流程
  • 传统知识库的终点,只是AI知识中心的起点——构建面向复杂业务推理的知识底座
  • 2026 面试必备:30 道高频算法题精解(含代码 思路)
  • 正点原子IMX6UL icm20608 读数据全0问题
  • 2026年AI+财务应用品牌格局观察:数智化转型新路径
  • 2026年浙江地区商业秘密侵权诉讼律师排名,靠谱推荐看这里 - 工业品网
  • ARP攻击流程演示(断网+流量劫持)
  • 简单的聊天机器人助手
  • 【交换机、路由器与终端设备间信息传递原理及过程总结】
  • 分享GEO源头厂家推荐,几家服务优质的品牌别错过 - 工业品牌热点
  • 企业ICT交换拓扑标准化落地 实现高确定性基础设施管理
  • Python数据分析项目实战(020)——NumPy应用案例1
  • 唐山华冶钢管制造口碑如何,产品在河北好用吗,值得推荐吗 - 工业设备
  • 个人信息保护合规审计人员(中级)理论知识与能力综合测试试卷
  • “买“龙虾第一期:OpenClaw@华为云
  • 三种Repository的写法
  • 总结沧州旭岳管道推荐,其在山东、北京地区有哪些优势项目? - myqiye
  • 第1课:开篇扫盲——OpenClaw是什么?能帮你解决什么问题?(入门必看)
  • 封神!IDEA↔Kiro 双向跳转插件实操指南|一键切换+光标精准同步,开发效率翻倍
  • 探讨广西高压胶管大型厂家怎么选择,诚悦橡塑怎么样? - 工业推荐榜
  • 2026年鲜椒兔公司在行业内的发展究竟处于何种地位?
  • 第2课:环境搭建——15分钟从零安装,快速启动你的第一个AI代理
  • 长春全屋定制天花板|伟伦家居,全国品牌+源头工厂,老百姓货比三家必选靠谱品牌 - 品牌企业推荐师(官方)
  • 原生一体架构与智能双模:企业软件在AI时代的进化之路
  • 靠谱的小龙虾酱料推荐哪家最受欢迎
  • 人心所至,2026十大热词数据报告