当前位置: 首页 > news >正文

使用LlamaIndex与OpenAI构建具备自我评估能力的智能体AI系统

如何使用LlamaIndex和OpenAI构建具备自我评估能力的智能体AI系统

在本教程中,将构建一个使用LlamaIndex和OpenAI模型的高级智能体AI工作流。重点关注设计一个可靠的检索增强生成(RAG)智能体,使其能够基于证据进行推理、审慎使用工具,并评估自身输出的质量。通过围绕检索、答案合成和自我评估来构建系统,展示智能体模式如何超越简单的聊天机器人,朝着更值得信赖、可控的AI系统迈进,适用于研究和分析用例。

!pip-q install-U llama-index llama-index-llms-openai llama-index-embeddings-openai nest_asyncio
importosimportasyncioimportnest_asyncio nest_asyncio.apply()fromgetpassimportgetpassifnotos.environ.get("OPENAI_API_KEY"):os.environ["OPENAI_API_KEY"]=getpass("Enter OPENAI_API_KEY: ")

设置环境并安装运行智能体AI工作流所需的所有依赖项。在运行时安全地加载某中心的API密钥,确保凭证不会被硬编码。同时,准备笔记本以平滑处理异步执行。

fromllama_index.coreimportDocument,VectorStoreIndex,Settingsfromllama_index.llms.openaiimportOpenAIfromllama_index.embeddings.openaiimportOpenAIEmbedding Settings.llm=OpenAI(model="gpt-4o-mini",temperature=0.2)Settings.embed_model=OpenAIEmbedding(model="text-embedding-3-small")texts=["可靠的RAG系统将检索、合成和验证分开。常见的失败包括幻觉和浅层检索。","RAG评估侧重于忠实性、答案相关性和检索质量。","使用工具的智能体需要受约束的工具、验证和自我审查循环。","一个稳健的工作流遵循检索、回答、评估和修订的步骤。"]docs=[Document(text=t)fortintexts]index=VectorStoreIndex.from_documents(docs)query_engine=index.as_query_engine(similarity_top_k=4)

配置某中心语言模型和嵌入模型,并为智能体构建一个紧凑的知识库。将原始文本转换为索引文档,以便智能体在推理过程中可以检索相关证据。

fromllama_index.core.evaluationimportFaithfulnessEvaluator,RelevancyEvaluator faith_eval=FaithfulnessEvaluator(llm=Settings.llm)rel_eval=RelevancyEvaluator(llm=Settings.llm)defretrieve_evidence(q:str)->str:r=query_engine.query(q)out=[]fori,ninenumerate(r.source_nodesor[]):out.append(f"[{i+1}]{n.node.get_content()[:300]}")return"\n".join(out)defscore_answer(q:str,a:str)->str:r=query_engine.query(q)ctx=[n.node.get_content()forninr.source_nodesor[]]f=faith_eval.evaluate(query=q,response=a,contexts=ctx)r=rel_eval.evaluate(query=q,response=a,contexts=ctx)returnf"Faithfulness:{f.score}\nRelevancy:{r.score}"

定义智能体使用的核心工具:证据检索和答案评估。实现忠实性和相关性的自动评分,使智能体能够判断自身响应的质量。

fromllama_index.core.agent.workflowimportReActAgentfromllama_index.core.workflowimportContext agent=ReActAgent(tools=[retrieve_evidence,score_answer],llm=Settings.llm,system_prompt=""" 始终首先检索证据。 生成结构化的答案。 评估答案,如果分数低则修改一次。 """,verbose=True)ctx=Context(agent)

创建基于ReAct的智能体,并定义其系统行为,指导其如何检索证据、生成答案和修订结果。同时初始化执行上下文,该上下文在交互过程中维护智能体的状态。这一步将工具和推理整合到一个单一的智能体工作流中。

asyncdefrun_brief(topic:str):q=f"设计一个可靠的RAG + 工具使用智能体工作流以及如何评估它。主题:{topic}"handler=agent.run(q,ctx=ctx)asyncforevinhandler.stream_events():print(getattr(ev,"delta",""),end="")res=awaithandlerreturnstr(res)topic="RAG agent reliability and evaluation"loop=asyncio.get_event_loop()result=loop.run_until_complete(run_brief(topic))print("\n\nFINAL OUTPUT\n")print(result)

通过将一个主题传递到系统中并流式传输智能体的推理和输出来执行完整的智能体循环。允许智能体异步完成其检索、生成和评估周期。

总结而言,展示了智能体如何在最终确定答案之前检索支持性证据、生成结构化响应并评估其自身的忠实性和相关性。设计保持了模块化和透明性,使得可以轻松地使用额外的工具、评估器或特定领域知识源来扩展工作流。这种方法说明了如何将智能体AI与LlamaIndex和某中心模型结合使用,以构建功能更强大、在推理和响应方面也更可靠和更具自我意识的系统。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/321358/

相关文章:

  • 2026年市面上可靠的投影机出租源头厂家推荐榜,W40投影机出租/12000流明投影机,投影机出租供应商电话
  • 央企应用里,asp.net如何支持文件夹的上传和下载?
  • 聊聊靠谱的尾气压缩机、逆放气压缩机、不凝气压缩机公司推荐
  • 2026美赛MCM/ICM A题:智能手机电池的连续时间数学模型附Matlab参考代码
  • 金融行业通过帝国CMS导入Word风控报告时,如何保留修订痕迹?
  • 计算机毕业设计springboot大学生毕业设计管理系统 基于SpringBoot的高校毕业设计全流程数字化管理平台设计与实现 Java Web技术驱动的高校毕业生课题与答辩综合监管系统开发
  • 2026年江西省靠谱的中医师承学习班排名,江西中医药大学中医师承学习班上榜
  • 鼻出血药物,南1,26.1.30
  • 国防单位使用帝国CMS导入机密文档,有哪些安全增强方案?
  • 南昌医保,2026.1.30,省医保,门诊超过300元有统筹,人工权限大,至少可以走共济
  • c#上位机,C# CSharp Modbus Rtu协议上位机源码,包括存储,数据到SQL S...
  • 单一/混合蛋白质分离纯化方法与质谱鉴定详解
  • 2026优质拖车公司救援服务推荐
  • 类 UNIX 系统的学习路线图
  • 2026年1月地铺石品牌推荐,这几家市场有名值得关注!石材/冰裂纹/地铺石/贴墙石/文化石/蘑菇石,地铺石厂家排行榜单
  • 创业公司必看:5招搞定批量软著申请,成本降低90%
  • 2026年四川山东地区快客之家服务项目推荐与性价比分析
  • 基于Python的京东手机销售数据分析系统
  • DeepSeek写的论文AI率太高?4步降到15%以下的完整攻略
  • 【微服务知识】SpringCloudGateway结合Sentinel实现服务的限流,熔断与降级 - 教程
  • 2025年当下靠谱的玻璃隔断定制排行,办公室隔断/雾化玻璃隔断/办公室隔断墙/电控玻璃隔断/感应门,玻璃隔断安装怎么选择
  • 基于python的交通信号灯检测识别系统
  • 快客之家产品好用吗,分析快客之家亮点有哪些
  • 多功能腻子喷涂机怎么选,普田喷涂机值得入手吗
  • 《透视 ImGui:从底层原理到面试通关》 第六讲:树形结构与弹出层 —— 复杂信息的组织
  • 浙江喷涂机制造商怎么选,普田喷涂机好用吗?
  • python基于协同过滤算法个性化动漫推荐系统hx3637
  • ABC432G Sum of Binom(A, B) 题解 / NTT
  • 2026年深圳靠谱的湿巾类包装企业排名,值得选的厂家汇总
  • 2026年口碑好的石墨烯发热片源头厂家推荐,专业制作企业全解析