当前位置: 首页 > news >正文

大语言模型基本了解

大语言模型有四个基本能力:
1、语言理解能力,能理解人类所描述的问题
2、语言生成能力,能对人类提出的问题提供一个符合人类正常阅读习惯答案
3、多轮对话管理能力,面对正常连续发问的情况下,给出的答案不会前言不搭后语
4、一定的逻辑推理能力,在训练时数据编织了知识,具备了一定的推理能力
大语言模型本质上就是对下一个单词的的预测,既然是预测那就是概率问题,这必然导致一定程度
上的胡说报道,也是我们常说的幻觉问题

基础的数学知识:
矩阵:
m行n列矩阵或者m*n矩阵
矩阵加减法,矩阵乘法,常数与矩阵的乘法,矩阵的转置
向量的加减法,向量的转置,向量的乘法,向量内积运算的含义

随机变量:离散随机变量,连续随机变量

数学期望:随机变量平均值的反应
方差:随机变量与其数学期望之间的偏离程度

http://www.jsqmd.com/news/22663/

相关文章:

  • 标签打印服务系统详细设计与实施文档
  • LLM-提示词
  • Transformer基本结构介绍
  • 图像分类,从网络构建到断点续训,TF2版本实现
  • 20232427 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • (第七次)tensorflow与keras
  • C0427 【20251025】2025 CSP-J 联测5 总结
  • (第六次)聚类和神经网络
  • 2025 年 10 月贵州旅游旅行社最新推荐,聚焦高端定制需求与全案交付能力
  • 2025 年 10 月贵州旅游旅行社最新推荐,精准检测与稳定性能深度解析
  • 2025 年 10 月贵州旅游旅行社最新推荐,实力品牌深度解析采购无忧之选!
  • PyTorch API 详细中文文档,基于PyTorch2.5
  • [java 锁]
  • 20232417 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • OpenLayers地图交互 -- 章节十八:拖拽旋转和缩放交互详解 - 教程
  • 小白 / 学生党必藏!真正有效的最佳安卓数据恢复软件
  • LeetCode边界与内部和相等的稳定子数组
  • 存储系统
  • 部分思维题
  • 1050-10XX显卡 解决CUDA error: no kernel image is available for execution on the device
  • 别再踩坑!真正有效的最佳免费数据恢复软件,亲测能救
  • 壁纸网站
  • rent8_wechat 微信消息提醒设置教程 - 详解
  • Titanic轮船人员生存率预测
  • 单层神经元手写数字识别
  • 自行搭建了几个AIGC小站点,可结合接口平台使用
  • ARC201B Binary Knapsack
  • 单个神经元手写数字识别
  • LDC
  • 多元线性回归