当前位置: 首页 > news >正文

MCP协议,让大模型自己调用工具

在AI应用开发中,我们经常需要让大模型与外部工具和数据源交互。过去,每个开发者都在用自己的方式解决这个问题,导致代码难以复用、维护成本高昂。MCP(Model Context Protocol,模型上下文协议)的出现,正是为了统一这种交互方式。

MCP是一个开源协议,它标准化了大语言模型与外部工具、数据源之间的通信方式。简单来说,它就像是大模型世界的“USB接口”——不管你要连接什么工具,只要遵循这个协议,就能即插即用。

从架构上看,MCP采用了经典的客户端-服务器模式,底层基于JSON-RPC 2.0协议进行通信。目前它支持两种主流传输方式:Stdio适合本地进程间的通信,而Streamable HTTP则更适合远程网络场景。值得一提的是,MCP曾经支持过SSE(Server-Sent Events)传输方式,但由于其双端点架构过于复杂,且与云原生无服务器环境兼容性不佳,官方已经将其弃用。

动画视频在《29. MCP协议,让大模型自己调用工具》。

那么,MCP的实际工作流程是怎样的呢?

举个例子,当你问“北京天气怎么样”时,大模型会先分析你的意图,然后决定调用get_weather这个工具。但这里有个关键点:大模型本身并不能直接调用工具。实际的过程是,AI应用会拦截这个调用请求,通过MCP客户端将它转发给对应的服务器端。服务器端执行真正的天气查询操作,把结果返回给客户端,客户端再将结果注入回对话中。最后,大模型基于这些真实数据,生成一段自然语言回答给你。整个过程对用户来说是透明的,你感受到的只是一个流畅的问答体验。

理解了原理,接下来我们动手实现一个完整的MCP应用。

首先,我们需要安装两个关键包: fastmcp 和 langchain-mcp-adapters 。FastMCP 是一个用于快速构建 MCP 服务器的框架,而 langchain-mcp-adapters 则让 LangChain 能够连接和使用 MCP 工具。

pip install fastmcp langchain-mcp-adapters

首先,我们需要安装两个关键包:fastmcp和langchain-mcp-adapters。前者是一个用于快速构建MCP服务器的框架,后者则让LangChain能够连接和使用MCP工具。

服务器端的代码相对简单。我们创建了一个FastMCP实例,命名为“天气服务”。通过@mcp.tool()装饰器,将get_weather函数注册为一个MCP工具。这个工具接收城市名称作为参数,返回对应的天气信息。最后,我们使用streamable-http传输协议启动服务,监听本地的8000端口。当然,如果你的场景是本地进程间通信,也可以切换到stdio模式。

"""FastMCP 天气服务""" from fastmcp import FastMCP mcp = FastMCP("天气服务") @mcp.tool() def get_weather(city: str) -> str: """获取指定城市的天气信息 Args: city: 城市名称,如 "北京"、"上海"、"广州" """ # 模拟天气数据 weather_data = { "北京": "晴天,气温 25°C,湿度 40%", "上海": "多云,气温 28°C,湿度 65%", "广州": "小雨,气温 30°C,湿度 80%", "深圳": "阴天,气温 29°C,湿度 75%", } if city in weather_data: return f"{city}天气:{weather_data[city]}" else: return f"{city}天气:晴,气温 22°C,湿度 50%" mcp.run(transport="streamable-http", host="127.0.0.1", port=8000) # mcp.run(transport="stdio")

接下来是客户端部分,这也是整个实现的重点。

我们导入MultiServerMCPClient,这是langchain-mcp-adapters提供的核心类,专门用于连接MCP服务器。在main函数中,我们创建客户端实例,配置一个名为“weather”的服务器,指定它的URL和传输协议。如果你使用的是stdio模式,则需要指定启动命令和参数。

关键的一步在于调用await client.get_tools()。这个方法会自动发现服务器上所有可用的MCP工具,并将它们转换为LangChain可以识别和使用的工具格式。这一步省去了手动定义工具schema的麻烦,大大简化了开发流程。

随后,我们将这些MCP工具和其他自定义工具一起传递给create_agent。这样一来,Agent就具备了调用MCP工具的能力。当我们再次询问“北京天气怎么样”时,Agent会自动识别需要使用MCP工具,向服务器发送请求,获取天气数据,并生成最终回答。

最后,通过asyncio.run(main())启动整个异步流程,一个完整的MCP应用就跑起来了。

回过头来看,MCP的价值不仅在于技术层面的标准化,更在于它降低了AI应用与外部世界交互的门槛。过去需要大量胶水代码才能实现的功能,现在只需要遵循协议、注册工具,就能轻松搞定。随着生态的不断完善,MCP有望成为AI应用开发的基础设施之一。

"""LangChain MCP 客户端 - 连接 FastMCP 天气服务""" import os import asyncio from dotenv import load_dotenv from langchain.agents import create_agent from langchain.chat_models import init_chat_model from langchain_core.tools import tool, BaseTool from langchain_community.tools import WriteFileTool, ReadFileTool, ListDirectoryTool from langchain_mcp_adapters.client import MultiServerMCPClient load_dotenv() prefix = "QWEN" model = init_chat_model( model_provider="openai", configurable_fields=["model", "api_key", "base_url"], config_prefix=prefix ).with_config({ "configurable": { f"{prefix}_model": os.getenv(f"{prefix}_MODEL"), f"{prefix}_api_key": os.getenv(f"{prefix}_API_KEY"), f"{prefix}_base_url": os.getenv(f"{prefix}_BASE_URL") } }) class CalculateTool(BaseTool): name: str = "calculate" description: str = "计算数学表达式的值" def _run(self, expression: str) -> str: try: return f"计算结果: {eval(expression)}" except Exception as e: return f"计算错误: {str(e)}" async def _arun(self, expression: str) -> str: return self._run(expression) async def main(): client = MultiServerMCPClient( {"weather": {"url": "http://127.0.0.1:8000/mcp", "transport": "streamable_http"}} # stdio 模式: # {"weather": {"command": "python", "args": ["mcp_weather_stdio.py"]}} ) mcp_tools = await client.get_tools() # ========== 初始化工具 ========== calculate = CalculateTool() write_file = WriteFileTool() read_file = ReadFileTool() list_dir = ListDirectoryTool() agent = create_agent( model=model, tools=[calculate, write_file, read_file, list_dir] + mcp_tools, system_prompt="你是一个助手,会用工具计算、读写文件、列出目录、查询天气。", debug=True ) queries = [ "北京天气怎么样?", "计算 2024*12+500,然后把结果保存到 result.txt", "读取 result.txt 的内容", ] for q in queries: print(f"\n问:{q}") result = await agent.ainvoke({"messages": [{"role": "user", "content": q}]}) print(f"答:{result['messages'][-1].content}")
http://www.jsqmd.com/news/1091252/

相关文章:

  • FD.io VPP核心机制解析:向量包处理如何重塑高性能网络栈
  • 编程语言对比:从底层汇编到高效PHP
  • 终极指南:Unitree RL GYM机器人强化学习框架的完整实践手册
  • 浏览器缓存之【结构化数据库与缓存】: IndexedDB、Cache storage 和 Storage buckets
  • CRMEB电商系统安全审计实战:公开接口漏洞分析与加固方案
  • 3步打造你的专属无线蓝牙控制设备:MicroPython BLE HID终极指南
  • MSP430FR系统控制模块深度解析:JTAG配置、内存保护与安全机制实战
  • 合集 - AI(11)1.本地部署 DeepSeek:小白也能轻松搞定!2025-02-132.如何给本地部署的DeepSeek投喂数据,让他更懂你2025-02-143.本地部署De
  • 禁令两周后,美国政府放宽限制,允许Anthropic向超百家机构提供Mythos 5模型
  • Datasheet 生成 KiCad Symbol
  • 网易云音乐自动打卡神器:每天300首轻松升级LV10的完整实用指南
  • TSW1100高速ADC数据采集卡实战指南:从硬件连接到性能评估
  • 车载系统(IVI)开发入门
  • Jetpack Compose 入门指南
  • Flink 实时数仓开发实战:Catalog 快照,让 DDL 只写一次
  • MSPM0定时器实战:QEI编码器解码与PWM电机控制全解析
  • 吸氢机流量会虚标吗?3个家用检测方法,轻松识破行业猫腻
  • OpenCode 个人习惯设置大全
  • OBS-ASIO插件终极指南:实现专业音频设备的低延迟录制与直播
  • 宏与函数的本质区别(理解场景的前提)
  • 深入解析EASY-HWID-SPOOFER:内核级硬件信息修改技术实现
  • CompressO:免费开源跨平台媒体压缩工具终极指南
  • GD32F303串口驱动开发:从寄存器到中断与环形缓冲区的实战解析
  • 如何3分钟快速安装TrollStore:TrollInstallerX全面指南
  • 创维E900V22C电视盒子刷机指南:三步变身专业4K媒体播放器
  • 客户细分化技术中的聚类分析分类模型与细分策略
  • 3分钟快速上手:用Barrier实现一套键鼠控制多台电脑的终极方案
  • 2026博尔塔拉黄金回收白银回收铂金回收旧料回收怎么选?五家高实价铂金白银线下门店测评清单 + 联系方式
  • Redis 内存分配器调优方案
  • PySpark实战:从数据清洗到模型部署的泰坦尼克号幸存者预测完整流程