AI核心概念探索
一.MCP是什么 (Model Context Protocol)
相当于AI领域的接口协议 是一套在规范大模型语言(LLM)与外部工具、数据源、服务之间交互的开放标准。
MCP 采用的是客户端-主机-服务器模式(client-host-server)架构,包含三种核心组件:
Resources(资源):代表模型 一方面包含了数据库存储的无论是图片还是视频还是文字知识库,包括API返回的结果信息。
Tools(工具):发起的动作,比如调用API、发送邮件、运行代码相关
Prompts(提示词):可复用的工作流模版 帮助用户快速触发预设的复杂的任务,可以理解为 统一用户输入入口
二.什么是多模态(Multimodality)
可以理解为 单个智能体与其他智能体的协作分工 比如 假设我写代码写好了让其输出json格式 那么json agent就返回结果,如果我要输出图片或者视频,那么图片或视频的agent就输出结果
也可以理解为 分布式架构中的 Spark 框架的drvier汇总节点最终输出给用户数据结果 (所以疑问 那么Spark智能可以放到driver节点来做?)
三.大模型,AI的核心引擎所做的事?
核心引擎,就好比分布式架构中的计算引擎,所有的多模态的交互结果的互通与理解,都是通过大模型日以继日的认为的输入进行微调,首先是通过知识库的导入,随后通过专家设定规则,这里的规则指的是逻辑推导过程或者说是为其返回结果打分,来实现哪些在这个场景下是准确的答案,让其大模型引擎学会,在不同场景下的推导与预测逻辑
如果加入RAP(检索增强生成Retrieval-Augmented Generation)意味着不光是已有数据库还会再根据最新的数据来整合输出。
整体框架流程就包含 数据预训练(也就是知识库的导入)-> 监督微调(SFT) 和 强化学习(RLHF) ,也就是我说的 “专家设定逻辑推导过程”和“为返回结果打分 -> RAG(检索增强生成)
四.所谓幻觉 也是因为没有最新的参照 在已有知识库下的自转 对于幻觉主要有三个核心根源:
1.概率预测的本质 一方面是在AI底层层面是为了让文本的流程与贯通,并不是追求绝对的事实准确 也是预测你下来的问题是否能够自洽的回答。
2.缺乏对真实世界的感知 导致只有逻辑推理 却少了现实中人的情绪 表达欲 状态等 需要对方怎么做 怎么回更适合。
3.知识库的最新版本需要RAP 检索增强生成去进行最新信息的获取 以及结合 监督微调和强化学习再去保证输出的合理性。
