当前位置: 首页 > news >正文

大模型知识点必备

一、RAG 核心必背

  1. RAG:检索增强生成,先检索私有文档,再给大模型参考生成答案。
  2. RAG 流程:文档加载→文本分块→向量化→向量库存储→相似度检索→大模型生成。
  3. RAG 作用:解决知识滞后、私有文档问答、降低幻觉、无需重训模型、成本低。
  4. 向量库:存储文本向量,按相似度快速检索相关片段。
  5. 幻觉成因:大模型仅靠训练知识凭空编造。
  6. 幻觉解决:RAG 给上下文、优化提示词、调分块、调检索阈值、换 Embedding 模型。
  7. 高级 RAG:Self-RAG、Agentic RAG,自主判断是否检索、迭代检索。
  8. RAG 调优:分块大小、检索条数、相似度阈值、Prompt、模型、Embedding 替换。

二、Agent 智能体必背

  1. Agent:基于大模型,具备自主思考、推理、工具调用、记忆、任务拆解的智能体。
  2. 普通大模型 vs Agent:普通仅聊天无思考;Agent 会推理、调工具、记上下文、拆复杂任务。
  3. ReAct 框架流程:思考推理→行动调用→观察结果→整理输出。
  4. ReAct 作用:自主决策、按需调工具、减少幻觉。
  5. Agent 工具:联网搜索、RAG 知识库检索、代码 / 接口执行。
  6. 短时记忆:当前会话有效,关闭即失效。
  7. 长时记忆:存向量库,跨会话跨时间保留用户偏好。
  8. 单 Agent:处理简单独立任务。
  9. 多 Agent:分工协作、任务拆解,适配复杂大型任务。
  10. Agent 完整流程:用户提问→ReAct 思考→判断是否调工具→调用工具→获取结果→结合记忆→输出答案。

三、LangChain 必背

  1. LangChain:大模型应用开发框架,快速搭建 RAG、Agent、业务工作流。
  2. 四大核心模块:Models 模型层、Prompts 提示词层、Chains 链层、Memory 记忆层。
  3. Models:统一对接大模型、对话模型、Embedding 模型,屏蔽厂商差异。
  4. Prompts:提示词模板、变量动态注入、格式化输出。
  5. Chains:串联多个组件,组成自动化业务流水线。
  6. Memory:保存对话历史,维持多轮上下文连贯。
  7. 常用组件:DocumentLoaders 文档加载器、VectorStores 向量库对接、Tools/Agents 工具封装。
  8. LangChain 用途:搭建 RAG、开发 Agent、构建工作流、一键切换大模型。

四、提示词工程必背

  1. 基础要素:角色定位、任务描述、约束条件、输出格式、示例参考。
  2. 少样本 Prompt:给多个示例,让模型按固定格式输出。
  3. 思维链 CoT:引导模型分步推理,提升复杂问题准确率。
  4. Prompt 优化原则:指令明确、约束清晰、格式固定、减少模糊表述。

五、大模型微调基础必背

  1. 微调:在预训练大模型基础上,用自有数据小幅训练,适配专属业务场景。
  2. 适用场景:专属话术、行业术语、固定输出格式、私有知识固化。
  3. SFT:有监督微调,给标准问答对,让模型学习指定输出风格。
  4. LoRA:轻量化微调,仅训练少量参数,显存占用低、成本低、效果好。
  5. 微调数据集:规范问答对、格式统一、去重降噪、样本均衡。
  6. 微调 vs RAG:RAG 适合实时更新知识;微调适合固定风格、固化私有知识。
  7. 微调劣势:成本高、周期长、更新数据需重调;RAG 可实时更新无需重训。

六、LLMOps 工程化必背

  1. LLMOps:大模型应用工程化,含模型管理、部署、监控、评测、成本管控。
  2. 模型管理:版本管理、开源模型下载、微调模型归档。
  3. 部署上线:模型封装接口、服务化部署、前后端联调。
  4. 监控观测:调用量、响应耗时、报错日志、幻觉率、用户提问统计。
  5. 评测调优:批量测试、打分评估、迭代优化模型与 Prompt。
  6. 成本管控:限制 Token 消耗、限流防滥用、统计计费、模型选型控成本。

七、多模态大模型必背

  1. 多模态:融合文本、图片、PDF、表格、图像多种信息输入。
  2. OCR + 大模型:识别图片文字,再做总结、问答、解析。
  3. CLIP:图文对齐模型,把图片和文本映射到同一向量空间。
  4. 多模态 Embedding:图文统一向量化,用于检索匹配。
  5. 多模态 RAG:图文 / PDF / 表格文档分块向量化、检索、多模态问答。
  6. 扫描件 PDF:依赖 OCR 解析,再走标准 RAG 流程。

八、项目面试通用必背

  1. 大模型应用开发:不用训练底层模型,只做框架组装、Prompt 调优、RAG/Agent 落地、部署运维。
  2. 日常工作:模型选型、参数调优(temperature/top_p)、Prompt 优化、RAG 调优、评测打分、接口封装、项目部署。
  3. 行业前景:大模型是十年级基础设施,非短期风口,未来成程序员基础技能。
  4. 难度对比:前端<大模型应用<传统后端,前端转适配度高。
  5. 三个必做项目:RAG 知识库、Agent 办公助手、多模态文档问答。
  6. 部署流程:开发调试→接口封装→服务器部署→日志监控→前后端联调→上线迭代。

九、核心参数必背

  1. temperature:温度,数值越高随机性越强,越低越严谨。
  2. top_p:控制输出多样性,截断概率累积采样。
  3. max_tokens:限制模型最大生成长度。
  4. 重复惩罚:抑制模型重复话术。
http://www.jsqmd.com/news/817931/

相关文章:

  • 小红书视频怎么去水印下载?2026 免费去水印工具推荐与安全对比指南 - 科技热点发布
  • 长期使用Taotoken聚合API对项目运维复杂度的降低感受
  • 常德招聘平台哪个岗位多:秒聘网多岗汇聚 - 17329971652
  • 本地视频怎么去水印?2026去水印方法全对比,四款高效软件推荐 - 科技热点发布
  • CSS如何给边框设置虚线效果_利用border-style-dashed属性
  • 3步修复损坏二维码:QRazyBox实战操作指南
  • Docker容器安装MySQL数据库
  • 每日算法题
  • 2026兴义市黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐及联系方式_转自TXT - 盛世金银回收
  • 免费一键去图片水印的App有哪些?2026年水印去除工具排行与推荐 - 科技热点发布
  • 树莓派相机3D打印支架:低成本打造专业级三脚架与外壳方案
  • RA MCU与Zephyr RTOS:软硬一体构建高效嵌入式物联网开发平台
  • CircuitPython嵌入式开发实战:内存管理、.mpy文件与文件系统故障排查
  • 科研绘图内卷破局:零代码做期刊级图表,虎贲等考 AI 让论文直接加分
  • 2026长沙市黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐及联系方式_转自TXT - 盛世金银回收
  • 图片视频怎样去水印不破坏原图?2026年最全去水印工具推荐与方法指南 - 科技热点发布
  • LangChain 第二课
  • VAD与VAD_SILEROVAD高效初始化:core.utils.modules_initialize深度优化实践
  • CircuitPython文件系统深度解析:安全擦除、空间优化与故障恢复实战
  • 在线视频去水印怎么做?2026免费去除水印网站与工具使用方法推荐 - 科技热点发布
  • 2026年5月河北冲孔板护栏/道路护栏/围墙护栏/光伏围栏/锌钢护栏直销工厂:安平县迪辉金属制品有限公司深度解析 - 2026年企业推荐榜
  • Java 面试中的微服务架构与 Spring Cloud
  • 数据库扛不住高并发?Redis缓存+双写一致性:给你的系统装上“涡轮增压”
  • 噬菌体展示技术体系、随机肽库设计及分子作用机制解析
  • 图片去水印完全指南:2026最新去水印软件推荐和方法对比 - 科技热点发布
  • 2026最权威的五大降重复率神器实际效果
  • 个人冲刺博客一
  • 在线水印怎么去除?4款高效去水印工具推荐+详细操作方法 - 科技热点发布
  • 2026 年抖音视频怎么保存到相册?最新保存方法与工具实测对比 - 科技热点发布
  • 基于Arduino与BLE的智能小车:从硬件组装到手机遥控全流程实战