当前位置: 首页 > news >正文

SEATA分布式事务——AT模式铝

简介

AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。

AI Agent

功能

根据查阅的资料,agent的功能点如下:

Agent = LLM + 规划 + 记忆 + 工具使用

LLM: 用于回答,推理的AI模型

记忆: 短期记忆(对话历史),长期记忆(RAG知识库)

规划: 任务的执行流

工具: Agent可以调用的外部函数

一个简单的Agent

案例

案例描述:agent可以使用两个工具:1. 记录公司数据的RAG知识库 2. python精确计算器

import os

from langchain_community.chat_models.tongyi import ChatTongyi

from langchain_community.embeddings import DashScopeEmbeddings

from langchain_community.vectorstores import FAISS

from langchain_core.messages import ToolMessage

from langchain_core.tools import tool

from langchain_core.messages import HumanMessage, ToolMessage

from langchain_core.documents import Document

from langchain_text_splitters import RecursiveCharacterTextSplitter

os.environ["DASHSCOPE_API_KEY"] = "api_key"

@tool

def calculator(expression: str) -> str:

"""

计算数学表达式。需要精确计算时使用。

参数:

expression: 数学算式,如 "2 + 2" 或 "500 * 0.8"。

返回:

str: 计算结果,如 "4.0" 或 "400.0"。

"""

print(f" [??? 工具调用] 计算器正在计算: {expression}")

try:

return str(eval(expression))

except Exception as e:

return f"计算错误: {e}"

@tool

def rag_search(query: str) -> str:

"""

从数据库中搜索与查询公司内部相关的文档,包括公司计划名,代号,截止日期等详细信息。

参数:

query (str): 要搜索的查询字符串。

返回:

str: 与查询相关的文档内容。

"""

# 从RAG数据库中检索文档

raw_text = """

【公司内部机密:代号“深蓝计划”】

1. 项目目标:开发一款能听懂猫语的翻译器。

2. 核心技术:基于Transformer的“喵声波”分析算法。

3. 团队暗号:如果有人问“今天天气怎么样?”,必须回答“我想吃鱼”。

4. 截止日期:2026年12月31日。

5. 经费预算:仅剩50元人民币,主要用于购买猫条。

"""

RAG_PATH = "faiss_index"

docs = [Document(page_content=raw_text)]

text_splitter = RecursiveCharacterTextSplitter(chunk_size=25, chunk_overlap=5)

split_docs = text_splitter.split_documents(docs)

embeddings = DashScopeEmbeddings(model="text-embedding-v1")

if os.path.exists(RAG_PATH):

print("公司内部数据库已存在")

ragdb = FAISS.load_local(RAG_PATH, embeddings, allow_dangerous_deserialization=True)

else:

print("创建公司内部数据库")

ragdb = FAISS.from_documents(split_docs, embeddings)

ragdb.save_local(RAG_PATH)

return "\n\n".join(doc.page_content for doc in ragdb.similarity_search(query, k=2))

def run_agent(query:str):

#初始化模型

tool_maps={

"rag_search": rag_search,

"calculator": calculator

}

llm = ChatTongyi(model_name="qwen-plus")

tool_llm = llm.bind_tools(tools=list(tool_maps.values()))

message = [HumanMessage(content=query)]

for i in range(5):

print("="*20+"\n第"+str(i+1)+"轮\n"+query+"\n"+"="*20)

response = tool_llm.invoke(message)

message.append(response)

print(f"需要调用{len(response.tool_calls)}个方法")

if not response.tool_calls:

print("最终结果:" + response.content)

return

for tool_call in response.tool_calls:

call_id = tool_call["id"]

func_name = tool_call["name"]

func_args = tool_call["args"]

# 安全检查:确保模型调用的工具真的存在

if func_name in tool_maps:

# 运行 Python 函数

tool_func = tool_maps[func_name]

tool_output = tool_func.invoke(func_args)

print("工具调用:" + func_name + ",参数:" + str(func_args) + ",结果:" + tool_output)

else:

tool_output = f"错误: 工具 {func_name} 不存在。"

message.append(

ToolMessage(

content=tool_output,

tool_call_id=call_id,

name=func_name,

)

)

if __name__ == "__main__":

run_agent("公司计划是什么")

run_agent("公司的经费预算是多少,如果预算预算提高46%后多少")

run_agent("今天天气真好")

代码解析

要实现复杂的工具调用,必须实现AI的多轮对话,在langchain框架中,提供了大量的prompt模板,让开发者不需要过度想一些基础的prompt实现。

上面代码的执行流程如下:

初始化2个工具函数->绑定LLM与工具->通过循环进行多轮对话

初始化2个工具函数

这里的rag_search上一篇文章讲了具体实现,这里就不废话了。

@tool

def calculator(expression: str) -> str:

"""

计算数学表达式。需要精确计算时使用。

参数:

expression: 数学算式,如 "2 + 2" 或 "500 * 0.8"。

返回:

str: 计算结果,如 "4.0" 或 "400.0"。

"""

print(f" [??? 工具调用] 计算器正在计算: {expression}")

try:

return str(eval(expression))

except Exception as e:

return f"计算错误: {e}"

@tool

def rag_search(query: str) -> str:

......

工具函数的格式,主要有3个方面:

工具修饰: 利用@tool修饰器修饰

函数的描述: 这里放函数的描述,大模型通过这个描述定位工具,因此这部分必须详细,可以参考上面:

函数的描述

函数的参数+例子

函数的返回+例子

工具的实现: 返回值要是字符串

如下:

@tool

def func_name(arg) -> str:

"""

描述

"""

......

绑定LLM与工具

工具的绑定非常的简单,只需要简单的bind_tools类方法就行

tool_maps={

"rag_search": rag_search,

"calculator": calculator

}

llm = ChatTongyi(model_name="qwen-plus")

tool_llm = llm.bind_tools(tools=list(tool_maps.values()))

通过循环进行多轮对话(重点)

工具的调用流程:

提示词->LLM->要调用的工具->LLM->结果

message = [HumanMessage(content=query)]

for i in range(5):

print("="*20+"\n第"+str(i+1)+"轮\n"+query+"\n"+"="*20)

response = tool_llm.invoke(message)

message.append(response)

print(f"需要调用{len(response.tool_calls)}个方法")

if not response.tool_calls:

print("最终结果:" + response.content)

return

for tool_call in response.tool_calls:

call_id = tool_call["id"]

func_name = tool_call["name"]

func_args = tool_call["args"]

# 安全检查:确保模型调用的工具真的存在

if func_name in tool_maps:

# 运行 Python 函数

tool_func = tool_maps[func_name]

tool_output = tool_func.invoke(func_args)

print("工具调用:" + func_name + ",参数:" + str(func_args) + ",结果:" + tool_output)

else:

tool_output = f"错误: 工具 {func_name} 不存在。"

message.append(

ToolMessage(

content=tool_output,

tool_call_id=call_id,

name=func_name,

)

)

在调用bind_tools方法后,大模型的返回对象会多出tool_calls字段的数组数据,用于存放需要调用工具的参数,函数名,在调用函数后,将调用函数的结果封装成ToolMessage传入,再继续调用大模型。

注意:在调用LLM时可能LLM会不断要求Tool,由此可能发生死循环,因此要限制循环次数。

安全与审思

风险评估

近些年,ai提示词注入频频发生,根据上面的案例:

@tool

def calculator(expression: str) -> str:

"""

计算数学表达式。需要精确计算时使用。

参数:

expression: 数学算式,如 "2 + 2" 或 "500 * 0.8"。

返回:

str: 计算结果,如 "4.0" 或 "400.0"。

"""

print(f" [??? 工具调用] 计算器正在计算: {expression}")

try:

return str(eval(expression))

except Exception as e:

return f"计算错误: {e}"

LLM在调用这个工具时使用了eval,这就造成了风险注入点,不法分子可能利用这个漏洞,获取电脑权限。

修复思路

修复上面漏洞,可以参考以下几个思路:

通过指令提示词,让LLM忽略,并终止危险代码调用该函数

在函数中用正则匹配危险代码,或设置白名单

替换eval函数,将其换为更加安全的方法,如手动写死运算牟叶腥掣

http://www.jsqmd.com/news/616769/

相关文章:

  • PHP Swoole配置全栈实战(生产环境零故障配置手册)
  • 2026年评价高的瓷砖圆弧切割机/瓷砖切割机/数控三刀瓷砖切割机/佛山岩板切割机源头厂家推荐 - 品牌宣传支持者
  • 3步打造专业演示:面向创作者的开源解决方案
  • AIGlasses_for_navigation 与操作系统原理结合:实现高并发推理服务
  • 自动驾驶核心概念解析与分级体系(自动驾驶、无人驾驶、智能驾驶三者的区别)(下)
  • 【多模态大模型——跨越感知与认知的鸿沟】第6章 工具增强与视觉Agent系统
  • Qwen3-14B嵌入式开发:STM32项目代码生成与调试辅助
  • 实时口罩检测-通用部署案例:边缘设备Jetson Nano上运行该模型可行性验证
  • 2026年Q2合肥宠物店技术标准解析与选店指南:贵阳市大型犬舍、贵阳市大型猫舍、贵阳市宠物基地、贵阳市宠物市场选择指南 - 优质品牌商家
  • 十分钟上手:Qwen1.5-1.8B GPTQ镜像在CSDN星图平台的一键部署演示
  • 革命性知识图谱项目Knowledge-Graph:一站式掌握深度学习与NLP核心技术
  • qwen3.5关闭思考模式 千问3.5关闭思考模式 LM Studio 关闭 Qwen3.5 思考模式教程
  • 你的终端神器之Oh My Zsh地
  • Entware终极指南:嵌入式设备的完整软件包管理解决方案
  • Phi-4-mini-reasoning解析LSTM:时序数据预测任务的模型选择与调优推理
  • 2026年国内硝酸钠厂家盘点:粒硝、钠硝石、土硝、工业级硝酸钾、火硝、盐硝、硝酸钠、粉硝、钾硝、农业级硝酸钾、硝石选择指南 - 优质品牌商家
  • 忍者像素绘卷多模态延伸:文字描述→像素绘卷→微信小程序动效导出
  • formsy-react跨字段验证:实现复杂业务逻辑的终极方法
  • Plsql定时任务执行存储过程
  • 如何快速从Google Drive下载共享文件:Python开发者的完整指南
  • 【51单片机单按键切换广告屏】2023-5-17
  • Digital-Infrastructure二次开发指南:基于统一框架的定制化业务开发
  • 【PyTorch】论文级可复现性学习笔记
  • MogFace人脸检测模型效果展示:多场景高精度识别案例集
  • Ubuntu Server 20.04 系统安装(六):Linux搭建frp服务,实现内网穿透服务,实现外网到内网的在线访问
  • 【多模态大模型——跨越感知与认知的鸿沟】第7章 视觉指令微调与数据工程 7.1 视觉指令数据的构建方法论
  • Qwen3-ASR在医疗转录中的应用:专业术语识别准确率提升方案
  • 2026年4月亚克力制品厂商推荐,亚克力定制/亚克力手套箱/亚克力制品/亚克力装置/亚克力真空箱,亚克力制品供应商哪家好 - 品牌推荐师
  • 构建企业级知识库:结合Phi-3-vision与数据库实现图文混合检索
  • nli-distilroberta-base在舆情分析中的实战:识别报道与评论间的观点倾向性