当前位置: 首页 > news >正文

大模型概述1

一个中文字符大约0.6个token,一个英文单词一般0.3个token,不同的大模型有自己不同的tokenize。令牌化的方法。

FLOPs:算力的参数,多少此浮点型运算

大模型分类:

分类方式一:多模态的,多种形态的模型,专门处理文本:语言大模型,多模态理解大模型(图生文,非文本模态转换为文本),多模态生成大模型(文生图,文本模态转换为非文本模态)。

模态:文本语音,图像,视频,巴拉巴拉的。

大模型4要素,大模型权重参数,推理代码,训练代码(不开源),训练数据集(不开源)

大语言模型训练范式:

1.预训练模型 --》学知识 预训练学习下一个Token的概率分布情况。这个环节模型具备的是词语接龙而不是对话的能力。但无法保证回答是否有用,是否符合人类偏好,是否安全,是否合规。大量数据塞入预训练学分布。 高手,但是什么规矩也不懂

2. SFT--》学会按指令回答问题 (Supervised Fine-Tuning)监督微调,让模型学会如何按指令和执行特定任务,这样只能学到类人,但是没有办法真的完全是人。SFT1.标注成本高,难以全面覆盖场合。

微调不用计算机集群去实现微调。但需要大量的高质量数据。

3.RLHF --》学会人类偏好 对最好的回答做奖励。 反套路必备,避免奶奶难题

模型的训练过程与推理过程:

大模型工程实现:

AIGC跟AGI:

AIGC,人工智能生成。

AGI,通用人工智能。

幻觉:1.LLM不是知识库,是生成模型 2.训练数据本身存在噪声,或者冲突 3.RLHF强调有用回答而不是拒答 4.生成任务天然追求完整性,而不是保守。

1.提示词工程 2.rag 3.微调 4.续训 5.智能体开发

1.提示词工程,系统化地去说明任务。表达需求,你想干嘛?

思维需要严密:

模型需要充当的角色,目标明确,背景与上下文,输入格式,输出格式,质量与约束

加上Few-shot的事例。用QA问答的方式也可以

分系统提示词跟用户提示词。

上下文:我们历史的文字传入。 上下文窗口:存在长度限制。

提示词工程的边界:1.参考资料过多,上下文窗口不够用了 2. 操作需要多步完成 3. 指令遵循能力不足。4.缺少某个垂类领域的知识点

开头与结尾的模型记忆比较好。中间可能就忘了

写词的时候,需要给抛出异常的地方,不用让大模型强撑。CoT(chain of thinking), ToT(Tree of thinking)

http://www.jsqmd.com/news/624876/

相关文章:

  • 为什么92%的多模态POC无法上线?——2026奇点大会披露4个被忽略的部署断点:跨模态对齐、缓存污染、动态批处理失效、时序一致性崩塌
  • 42 岁求职,年龄从不是短板:中年职场人的底气、价值与坚守
  • React 状态同步的复杂场景
  • SiameseAOE中文-base镜像免配置部署:Docker一键拉起+GPU算力高效适配方案
  • 济南老兵搬家配送电话多少?本地自营团队,官方热线直达,正规靠谱不跑空 - 宁夏壹山网络
  • Postman接口测试全套流程
  • Graphormer开源模型部署手册:Supervisor开机自启+日志监控全配置
  • 基于单片机智能燃气灶控制系统设计
  • nli-distilroberta-base企业应用:知识图谱三元组有效性自动验证
  • 戴尔笔记本风扇终极控制指南:简单三步实现精准散热管理
  • CCS12.2生成DSP28335的.bin文件,解决‘C:’不是命令的报错(保姆级避坑)
  • 【PCL2】PCL2官网下载:PCL2启动器我的世界模组管理工具使用全攻略 - xiema
  • JetBrains IDE试用期重置终极指南:如何免费延长30天开发工具使用期限
  • 【AI原生UX设计反直觉真相】:为什么“更智能”反而导致用户流失率上升47%?——基于127个A/B测试的归因分析
  • 技术领域驱动设计的建模方法
  • 兰亭妙微移动端设计案例库:Web3、心理健康、B端营销等六大场景的交互逻辑与视觉表达 - ui设计公司兰亭妙微
  • Linux驱动SDIO1
  • 突发!裁撤全部中国区研发团队,涉 500 人
  • GoCodingInMyWay腺
  • 单链表专题(完整代码版)
  • python学习-05列表
  • “键盘鼠标”到“听懂人话”:如何用AI语音重构大屏交互新范式?
  • Bidili Generator开源大模型:基于Stable Diffusion XL 1.0的完全本地化方案
  • 告别音效制作烦恼:HunyuanVideo-Foley私有部署镜像实测,效果惊艳
  • STGCN实战:从骨架数据到动作识别的时空建模
  • 为什么你需要PS3GameUpdateDownloader?3步掌握索尼官方游戏更新下载
  • PKHeX自动合法性插件:轻松创建合规宝可梦的智能助手
  • FX3U_F407_V50 底层源码功能说明文档
  • ReadCat小说阅读器:打造纯净无干扰的完整阅读体验指南
  • 医疗图像降噪实战:用VS2026+QT6.9+OpenCV处理X光RAW图,从对齐到超分全流程避坑