当前位置: 首页 > news >正文

1.4 Agent的眼睛耳朵 语言与多模态怎么喂信息

1.4 Agent 的「眼睛耳朵」:语言 + 多模态怎么喂信息

本节学习目标

  • 理解 Agent 如何通过「感知」获取环境信息,并区分不同感知渠道。
  • 掌握文本、语音、图像等多模态输入在 Agent 中的角色与常见用法。
  • 能设计「把环境信息整理成模型可用的输入」的简单方案。

一、感知在 Agent 中的位置

Agent 的闭环是「目标 → 感知 → 决策 → 行动 → 环境变化 → 再感知」。感知负责把「当前环境」变成大脑(LLM)能用的输入,包括:用户说了什么、历史对话、工具返回结果、当前时间、位置、以及图片/语音等。感知质量直接决定决策质量:信息不全或噪声大,模型容易误判或重复无效动作。

大脑 LLM

http://www.jsqmd.com/news/366432/

相关文章:

  • Java毕设项目:基于springboot的零食售货机管理系统的设计与实现(源码+文档,讲解、调试运行,定制等)
  • 上海智元机器人AgiBot Night 2026:全球首个机器人主导盛典,破解类人机器人泡沫争议
  • 1.3 Agent的大脑 大模型凭什么能推理和决策
  • 2g2h服务器部署modsecurity、CrowdSec+Nginx bouncer(文章顺序)
  • 冰点渗透压测定仪在跨学科研究与产业应用中的核心价值与技术解析
  • 2026医院标识/发光字/沙盘模型设计哪家好?金苹果广告成政企优选 - 深度智识库
  • MIMO控制策略优化CDU泵速与阀门
  • Java 知识点
  • Reflex Robotics墨西哥工厂:拉丁美洲首个类人机器人工厂,轮式路线能否颠覆行业?
  • 软文营销平台权威评测:三大主流平台深度解析,你的品牌谁更适合? - 资讯焦点
  • 全网优质 SEO 推广公司推荐,五大服务商各有专精适配不同行业 - 品牌推荐大师1
  • JAVA并发 - 线程池
  • Windows-Auto-Night-Mode主题切换修复指南:从根源解决8大典型故障
  • Java计算机毕设之基于springboot的智慧医疗平台管理系统基于SpringBoot的数字化医院信息管理(完整前后端代码+说明文档+LW,调试定制等)
  • 信创合规下的元数据平台选型:从自动化盘点、算子级血缘到 DataOps 的完整指南
  • 端侧AI如何重构语音交互范式?本地语音处理技术的突破与实践
  • 【0 元免费学】AgentScope Java 极客时间公开课上线!
  • Java计算机毕设之基于Java的零食售货机管理系统基于springboot的零食售货机管理系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • HumanX框架深度解析:让Unitree G1人形机器人变身篮球高手,颠覆机器人技能学习范式
  • From Correspondence to Actions Human-Like Multi-Image Spatial Reasoning in Multi-modal Large Languag
  • 2026年数据资产管理厂商推荐,数据资源管理系统平台优选 - 品牌2025
  • 2026国内最新珠宝3D建模培训机构top5推荐!广东广州等地优质培训学校权威榜单发布,专业赋能珠宝行业人才成长 - 品牌推荐2026
  • SDRPlusPlus:让移动设备实现专业无线电接收的跨平台解决方案
  • 国际机票预订平台价格透明度深度测评:同程、携程、航司官网与比价工具横向对比 - 资讯焦点
  • 小程序计算机毕设之基于springboot的优购在线社区便利店系统小程序基于SpringBoot的社区便利店购物平台系统(完整前后端代码+说明文档+LW,调试定制等)
  • 真心不骗你!自考必备的AI论文平台 —— 千笔AI
  • OpenCloudOS9部署 CrowdSec 全流程(由z.ai提供)
  • Java计算机毕设之基于springboot的学生档案管理系统基于SpringBoot + Vue的学生档案管理系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • 2026年大型集团资产管理系统有哪些?哪家资产管理系统平台软件好? - 品牌2025
  • dash