当前位置：首页 > news >正文

大模型Function Calling工程实战：从协议到生产的完整指南

news 2026/7/24 4:28:28

Function Calling（函数调用）是让LLM从"会聊天"进化为"能干活"的关键能力。通过Function Calling，模型可以决定何时调用外部工具、传递什么参数，从而查询实时数据、执行代码、操作文件……几乎任何你能写成函数的能力，都可以被LLM"驱动"。本文从协议原理到生产实践，系统讲解Function Calling工程中的核心知识点与踩坑经验。

Function Calling的工作原理理解原理是写好代码的基础。Function Calling的完整流程：1.工具注册：将函数的名称、描述和参数Schema告知模型2.模型决策：模型根据用户请求决定是否调用工具，以及调用哪个工具、传入什么参数3.工具执行：应用代码实际执行被选中的函数4.结果回传：将函数执行结果回传给模型5.最终生成：模型根据函数结果生成最终回复这个流程中，模型只做决策，不执行代码。代码的实际执行权始终在你的应用手中，这是一个重要的安全边界。python# 一个完整的Function Calling示例from openai import OpenAIimport jsonclient = OpenAI()# 工具定义（JSON Schema格式）tools = [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的当前天气信息", "parameters": { "type": "object", "properties": { "city": { "type": "string", "description": "城市名称，如'北京'、'上海'" }, "unit": { "type": "string", "enum": ["celsius", "fahrenheit"], "description": "温度单位，默认celsius" } }, "required": ["city"] } } }]# 实际的工具实现def get_weather(city: str, unit: str = "celsius") -> dict: # 实际中调用天气API return { "city": city, "temperature": 25, "unit": unit, "condition": "晴天", "humidity": "60%" }def run_conversation(user_message: str): messages = [{"role": "user", "content": user_message}] # 第一次调用：模型决策是否使用工具 response = client.chat.completions.create( model="gpt-4o", messages=messages, tools=tools, tool_choice="auto" # 让模型自主决定 ) response_message = response.choices[0].message # 检查模型是否决定调用工具 if response_message.tool_calls: messages.append(response_message) # 执行所有工具调用（可能多个） for tool_call in response_message.tool_calls: function_name = tool_call.function.name function_args = json.loads(tool_call.function.arguments) # 路由到实际函数 if function_name == "get_weather": result = get_weather(function_args) else: result = {"error": f"未知工具: {function_name}"} # 将结果回传 messages.append({ "role": "tool", "tool_call_id": tool_call.id, "content": json.dumps(result, ensure_ascii=False) }) # 第二次调用：基于工具结果生成最终回复 final_response = client.chat.completions.create( model="gpt-4o", messages=messages ) return final_response.choices[0].message.content return response_message.contentresult = run_conversation("上海今天天气怎么样？")print(result)## 工具Schema设计的核心原则工具的Schema设计直接影响模型调用的准确率。这里有五个关键原则：### 1. 描述要精准，不要模糊`python# ❌ 模糊的描述{ "name": "search", "description": "搜索相关信息"}# ✅ 精准的描述{ "name": "search_knowledge_base", "description": "在公司内部知识库中搜索技术文档。仅用于查询公司产品、API文档和内部指南。不要用于查询实时行情、新闻等外部信息。"}`### 2. 参数类型和约束要明确python{ "name": "create_task", "description": "在项目管理系统中创建任务", "parameters": { "type": "object", "properties": { "title": { "type": "string", "description": "任务标题，50字以内", "maxLength": 50 }, "priority": { "type": "string", "enum": ["low", "medium", "high", "urgent"], "description": "优先级：low(低)、medium(中)、high(高)、urgent(紧急)" }, "due_date": { "type": "string", "pattern": "^\\d{4}-\\d{2}-\\d{2}$", "description": "截止日期，格式YYYY-MM-DD，如2026-05-31" }, "assignee_id": { "type": "string", "description": "负责人的用户ID（不是用户名），可以通过get_user_id工具获取" } }, "required": ["title", "priority"] }}### 3. 多工具时要消除歧义当有多个功能相似的工具时，需要在描述中明确区分使用场景：`pythontools = [ { "function": { "name": "search_web", "description": "搜索互联网上的公开信息，适合：最新新闻、实时行情、公开资料查询。不适合：内部文档、公司数据。" } }, { "function": { "name": "search_internal_docs", "description": "搜索公司内部知识库，适合：API文档、技术规范、内部流程。不适合：外部信息、实时数据。" } }]`### 4. 设计原子性工具，而非复合工具python# ❌ 复合工具（功能太多，参数复杂）{ "name": "manage_calendar", "description": "管理日历：可以查看、创建、删除、修改事件"}# ✅ 原子性工具（每个工具做一件事）tools = [ {"name": "get_calendar_events", "description": "查询指定日期范围内的日历事件"}, {"name": "create_calendar_event", "description": "创建新的日历事件"}, {"name": "update_calendar_event", "description": "修改已有日历事件"}, {"name": "delete_calendar_event", "description": "删除日历事件"},]## 并行函数调用现代LLM支持在一次响应中同时调用多个工具，利用好这个特性可以显著减少延迟：pythonimport asyncioasync def handle_parallel_tool_calls(tool_calls: list) -> list: """并行执行多个工具调用""" async def execute_single(tool_call): function_name = tool_call.function.name args = json.loads(tool_call.function.arguments) try: if function_name == "get_stock_price": result = await get_stock_price(args) elif function_name == "get_company_info": result = await get_company_info(args) elif function_name == "get_news": result = await get_news(args) else: result = {"error": f"未知工具: {function_name}"} except Exception as e: result = {"error": str(e)} return { "role": "tool", "tool_call_id": tool_call.id, "content": json.dumps(result, ensure_ascii=False) } # 并行执行所有工具调用 results = await asyncio.gather(*[execute_single(tc) for tc in tool_calls]) return list(results)# 使用示例：GPT-4o会自动识别可以并行的工具调用response = client.chat.completions.create( model="gpt-4o", messages=[{ "role": "user", "content": "帮我查一下腾讯和阿里的当前股价，以及它们最近的新闻" }], tools=tools)# 模型可能同时调用 get_stock_price("腾讯")、get_stock_price("阿里")、get_news("腾讯")、get_news("阿里")if response.choices[0].message.tool_calls: tool_results = await handle_parallel_tool_calls(response.choices[0].message.tool_calls)## 工具调用安全性Function Calling最大的风险是：LLM决策 + 自动执行 = 潜在的高风险操作。特别是涉及数据写入、外部API调用、代码执行的工具，需要严格的安全设计。### 分级权限控制pythonfrom enum import Enumclass ToolRiskLevel(Enum): READ_ONLY = "read_only" # 只读操作，无需确认 LOW_RISK = "low_risk" # 低风险写入，自动执行但记录日志 MEDIUM_RISK = "medium_risk" # 中等风险，需要用户确认 HIGH_RISK = "high_risk" # 高风险操作，需要显式授权TOOL_RISK_MAP = { "search_web": ToolRiskLevel.READ_ONLY, "get_weather": ToolRiskLevel.READ_ONLY, "create_task": ToolRiskLevel.LOW_RISK, "send_email": ToolRiskLevel.MEDIUM_RISK, "delete_records": ToolRiskLevel.HIGH_RISK, "execute_code": ToolRiskLevel.HIGH_RISK,}class SafeToolExecutor: def init(self, user_approval_callback): self.approval_callback = user_approval_callback async def execute(self, tool_name: str, args: dict) -> dict: risk_level = TOOL_RISK_MAP.get(tool_name, ToolRiskLevel.MEDIUM_RISK) if risk_level == ToolRiskLevel.READ_ONLY: return await self._execute_directly(tool_name, args) elif risk_level == ToolRiskLevel.LOW_RISK: result = await self._execute_directly(tool_name, args) await self._audit_log(tool_name, args, result) return result elif risk_level in (ToolRiskLevel.MEDIUM_RISK, ToolRiskLevel.HIGH_RISK): # 暂停，等待用户确认 approved = await self.approval_callback({ "tool": tool_name, "args": args, "risk_level": risk_level.value, "message": f"AI助手请求执行 [{tool_name}]，参数：{json.dumps(args, ensure_ascii=False)}" }) if not approved: return {"error": "用户拒绝了此操作"} return await self._execute_directly(tool_name, args) async def _execute_directly(self, tool_name: str, args: dict) -> dict: # 实际工具执行逻辑 tool_func = TOOL_REGISTRY[tool_name] return await tool_func(**args) async def _audit_log(self, tool_name: str, args: dict, result: dict): # 记录审计日志 pass### 参数验证与沙箱pythondef validate_tool_args(tool_name: str, args: dict) -> tuple[bool, str]: """在执行工具前验证参数""" if tool_name == "execute_code": code = args.get("code", "") # 检查危险操作 dangerous_patterns = ["os.system", "subprocess", "eval(", "exec(", "import"] for pattern in dangerous_patterns: if pattern in code: return False, f"代码包含不允许的操作: {pattern}" if tool_name == "delete_records": # 确保有明确的ID而非通配符删除 if "*" in str(args) or "all" in str(args).lower(): return False, "删除操作不允许使用通配符，必须指定具体ID" return True, "OK"## 流式Function Calling对于需要实时展示进度的场景，可以使用流式API：pythonasync def stream_with_tools(user_message: str): """流式Function Calling，支持实时展示工具调用过程""" stream = client.chat.completions.create( model="gpt-4o", messages=[{"role": "user", "content": user_message}], tools=tools, stream=True ) current_tool_calls = {} async for chunk in stream: delta = chunk.choices[0].delta # 处理工具调用块 if delta.tool_calls: for tc_chunk in delta.tool_calls: idx = tc_chunk.index if idx not in current_tool_calls: current_tool_calls[idx] = { "id": tc_chunk.id, "name": tc_chunk.function.name or "", "arguments": "" } if tc_chunk.function.arguments: current_tool_calls[idx]["arguments"] += tc_chunk.function.arguments # 处理完成信号 if chunk.choices[0].finish_reason == "tool_calls": print(f"\n[工具调用] 模型决定调用 {len(current_tool_calls)} 个工具") # 执行工具并继续对话...## 常见问题与解决方案| 问题 | 原因 | 解决方案 ||------|------|---------|| 模型总是调用工具，即使不需要 | 工具描述过于宽泛 | 明确指定使用场景和不适用场景 || 参数格式经常不对 | Schema描述不够清晰 | 添加格式说明和示例值 || 模型选错工具 | 多个工具功能有重叠 | 重写描述，强调使用边界 || 工具调用失败后模型卡住 | 没有处理错误返回 | 在工具结果中包含error字段，模型会据此调整策略 || 多轮对话中重复调用工具 | 历史结果没有正确回传 | 确保tool角色消息正确插入到历史中 |## 总结Function Calling是构建实用AI Agent的基础能力。关键工程原则：精心设计工具Schema（描述要精准、参数要明确）、合理处理并行调用（减少延迟）、严格控制执行安全（分级权限+参数验证），以及完善的错误处理（工具失败不应导致整个对话中断）。掌握这些，你的AI助手就能从"聊天机器人"进化为真正能做事的智能体。

http://www.jsqmd.com/news/880724/

相关文章：

成都型钢今日报价实时行情走势现货价格查询首选盛世钢联 - 四川盛世钢联营销中心

2026年5月新消息：果筐机厂家综合实力盘点，宁波华维机械为何值得关注？ - 2026年企业推荐榜

2026提升营销业务能力的关键方法：从“流量操盘手”进阶为“数据增长官”

别再乱改时间了！Linux服务器时间同步保姆级指南：hwclock、NTP与cron实战

2026四分类垃圾亭技术全解析：公交站亭/公交站台厂家/公交站台生产厂家/四分类垃圾亭厂家/四分类垃圾箱/垃圾分类亭厂家/选择指南 - 优质品牌商家

你的 Java 程序为什么总是先流畅后卡成狗？——JVM 内存、垃圾回收与调优求生指南

FSR框架：自动化CUDA内核优化的技术突破

2026优质光敏三极管厂家推荐榜单：红外线接收头/红外线发射管/光敏三极管/贴片式红外线接收器/红外线接收器/选择指南 - 优质品牌商家

凯撒旅业在全球 / 国内有多少家分子公司、门店？ - 品牌2025

Linux系统启动卡住了？手把手教你用systemd-analyze和dmesg诊断UEFI启动各阶段耗时

神经网络量化技术：TruncQuant在边缘计算中的高效实现

三年老员工，老板突然说要裁我，我笑着问了一个问题，他愣住了

别再只会用lscpu和free了！dmidecode命令帮你挖出Linux硬件的‘身份证’（BIOS序列号、主板型号全知道）

Arm DS自定义组件XML配置与调试技巧

保姆级教程：在Deepin V23 Beta3上彻底禁用Nouveau并安装指定版本NVIDIA驱动（附卸载残留清理指南）

Burp Suite安装配置全指南：Java环境、HTTPS解密与代理故障排查

成都热轧H型钢今日报价实时钢材行情走势现货价格查询首选盛世钢联 - 四川盛世钢联营销中心

特种润滑油脂优质推荐：东莞轴承润滑脂/东莞通用润滑脂/东莞重负荷齿轮油/东莞阀门润滑脂/东莞食品级润滑油/东莞高压抗磨液压油/选择指南 - 优质品牌商家

从Science顶刊到实战：手把手教你用10X单细胞数据做eQTL分析（附代码避坑）

逆向分析第一步：手把手教你搭建WinDbg+VMware双机调试环境（含问题排查）

Rydberg原子接收器：量子传感技术的突破与应用

安全测试新手避坑指南：Windows下用X-ray进行被动扫描时，为什么我扫不到漏洞？

边缘计算深度学习模型优化：MARCO框架技术解析

2026钦州必吃海鲜指南：本地人推荐/钦州便宜吃海鲜推荐/钦州出名饭店/钦州去哪吃海鲜便宜/钦州去哪吃海鲜好吃/选择指南 - 优质品牌商家

2026年至今，谁在引领PET瓶胚专用机的技术革新？ - 2026年企业推荐榜

CNSH 语义接入规范 v2.0·功能语义技术用词对照表 + 协作宣言｜中英对照·行话翻译·DNA锚链

ARM SME指令集：非临时加载与查找表优化详解

从临床医疗说起：当一种科学理论走到边界的时候

2026最新个人AI编程软件实测盘点：独立开发者做副业高效开发必备

AgentScope Java 入门：Tool 工具系统——让 Agent 真正“动手做事“