当前位置：首页 > news >正文

基于LangChain与Azure OpenAI构建智能问答云函数实战指南

news 2026/4/27 1:59:05

1. 项目概述：构建一个基于LangChain与Azure OpenAI的智能问答函数

最近在折腾一个有意思的东西：如何把一个简单的用户提问，通过云函数快速变成一个结构化的、有上下文的智能对话。这听起来像是需要一整套复杂的后端服务，但实际上，借助Azure Functions、LangChain和Azure OpenAI，我们可以用不到一百行Python代码就搭出一个原型。这个项目就是一个绝佳的起点，它展示了一个HTTP触发的Python函数，如何接收一个自然语言提示（Prompt），利用LangChain的模板能力对其进行增强，再调用Azure OpenAI的GPT模型生成高质量的回复。

这个方案特别适合那些想快速验证AI应用场景，或者希望将AI能力无缝集成到现有API架构里的开发者。你不需要管理服务器，也不用担心复杂的并发问题，只需要关注核心的业务逻辑——如何设计提示词和调用链。无论是想做一个内部知识问答机器人、一个客服助手原型，还是一个创意内容生成器，这个模板都能帮你省下大量搭建基础设施的时间。

2. 核心架构与工具选型解析

2.1 为什么选择Azure Functions + Python v2编程模型？

选择Azure Functions作为承载平台，核心考量是“无服务器”（Serverless）带来的敏捷性。对于AI应用，尤其是前期验证和中小流量场景，其流量可能呈现突发性和不可预测性。传统的虚拟机或容器服务需要你预先配置并支付固定资源费用，而Functions采用按执行次数和资源消耗量计费，在空闲时段成本几乎为零。这对于频繁迭代、调整提示词和链结构的开发阶段来说，经济成本极低。

Python v2编程模型是另一个关键选择。相较于v1模型，v2提供了更简洁、直观的基于装饰器的函数定义方式，与FastAPI等现代Python Web框架的体验类似。它对异步（async/await）的原生支持更好，这在调用外部AI服务（网络I/O密集型操作）时，能更有效地利用资源，提升吞吐量。从项目代码中可以看到，函数定义清晰，绑定声明（如@app.route）与业务逻辑分离，代码可读性和可维护性大大增强。

2.2 LangChain在项目中扮演的角色：不仅仅是调用API

很多人初看可能会觉得，直接调用Azure OpenAI的SDK也能完成聊天，为何要引入LangChain？这里的核心价值在于“链”（Chain）和“模板”（Template）。LangChain将AI交互抽象为可组合的“链式”操作。

在这个示例中，它主要做了两件事：

提示词模板化：原始的用户提问（如“Azure Functions有什么优点？”）是孤立且信息量有限的。通过PromptTemplate，我们为其包裹了一个标准的对话上下文（“以下是与AI助手的对话，助手乐于助人…”）。这相当于为模型设定了一个清晰的“角色”和“对话历史”，能显著提升回复的相关性和友好度，避免模型给出过于生硬或偏离语境的答案。
流程标准化：llm_prompt.format(...)和llm.invoke(...)的调用，封装了从模板填充到模型调用的完整流程。虽然当前示例链很简单，但这种模式为未来扩展留下了巨大空间。例如，你可以轻松插入一个“检索”环节，先从向量数据库查找相关文档，再将结果和用户问题一起填入模板；或者加入一个“后处理”环节，对模型输出进行格式化或过滤。

简言之，LangChain提供了一个面向AI应用的“中间件”框架，让开发者能像组装流水线一样构建复杂的AI交互逻辑，而不是写一堆胶水代码。

2.3 Azure OpenAI服务：企业级AI能力的基石

选择Azure OpenAI服务，而非直接使用OpenAI的公开API，主要出于安全性、合规性和集成便利性的考虑。

数据安全与隐私：你的所有数据（提示词、生成的回复）都在微软的Azure全球合规性框架内处理，并受其企业级数据保护协议约束。这对于处理敏感或专有信息的应用至关重要。
网络稳定性与低延迟：服务部署在Azure全球数据中心，如果你的其他应用服务也在Azure上，它们之间的通信处于骨干网内，延迟更低、更稳定。
身份集成：项目默认使用Entra ID（原Azure Active Directory）进行身份验证，实现了“无密钥”（Secretless）访问。这意味着函数可以通过托管身份（Managed Identity）安全地访问OpenAI资源，完全避免了在代码或配置文件中硬编码API密钥的风险，这是生产环境安全的最佳实践。
模型管理：你可以在Azure门户中轻松管理模型的部署（Deployment），独立于代码进行版本切换、容量缩放和监控。

3. 本地开发环境搭建与深度配置

3.1 前置依赖安装与避坑指南

按照官方文档安装工具链是第一步，但有几个细节容易踩坑：

Python版本管理：强烈建议使用pyenv（Mac/Linux）或pyenv-win（Windows）来管理Python版本。确保安装并激活的是Python 3.8, 3.9, 3.10或3.11。Azure Functions Python v2模型对3.12及更高版本的支持可能仍在完善中，为避免兼容性问题，建议使用3.10或3.11这两个长期支持版本。
```
# 使用pyenv示例 pyenv install 3.10.13 pyenv local 3.10.13
```
Azure Functions Core Tools：这是本地运行和调试函数的必备工具。安装后，务必通过func --version验证。有时全局安装可能会遇到权限问题，在虚拟环境（venv）中安装通常更干净。
```
python -m venv .venv source .venv/bin/activate # Linux/macOS # .\.venv\Scripts\activate # Windows pip install azure-functions-core-tools
```
Azure Developer CLI (azd)：这是项目一键式部署的关键。安装后，运行azd login完成登录。一个常见的误区是认为azd provision只创建AI资源，实际上它会根据./infra目录下的Bicep模板，部署整个应用所需的所有资源，包括函数应用本身、Application Insights等，形成一个完整的环境。

3.2 环境变量与`local.settings.json`的奥秘

local.settings.json文件是本地开发的“配置中心”。项目提供的模板已经很好，但我们需要深入理解每个字段：

{ "IsEncrypted": false, "Values": { "FUNCTIONS_WORKER_RUNTIME": "python", "AzureWebJobsFeatureFlags": "EnableWorkerIndexing", "AzureWebJobsStorage": "UseDevelopmentStorage=true", "AZURE_OPENAI_ENDPOINT": "https://<your-deployment>.openai.azure.com/", "AZURE_OPENAI_CHATGPT_DEPLOYMENT": "chat", "OPENAI_API_VERSION": "2023-05-15" } }

AzureWebJobsFeatureFlags: EnableWorkerIndexing：这是Python v2编程模型必须开启的标志，用于支持新的函数索引和加载方式。
AzureWebJobsStorage：本地开发时使用模拟存储（Azurite）。重要提示：即使你的函数逻辑不显式使用存储，Azure Functions运行时本身也需要一个存储账户来管理触发器和状态。本地开发可以用模拟器，但部署到Azure时，必须提供一个真实的存储账户连接字符串。
AZURE_OPENAI_CHATGPT_DEPLOYMENT：这里的“chat”指的是你在Azure OpenAI Studio中创建的部署名称，而不是模型名称。例如，你可以用gpt-35-turbo模型创建一个名为“my-chat-gpt”的部署，那么这里就应该填“my-chat-gpt”。这是最容易混淆的点之一。
OPENAI_API_VERSION：指定使用的API版本。建议保持与示例一致，除非你明确需要使用新API特性。

注意：local.settings.json默认在.gitignore中，这很好。但务必确保不会意外将其提交到代码仓库。一个检查方法是运行git status，确认该文件未被跟踪。

3.3 身份验证：从本地密钥到托管身份的平滑过渡

示例中本地开发使用了环境变量配置终结点，但未提及密钥。这是因为在调用azd provision后，你的本地Azure CLI身份（az login）已被用于认证。函数代码中使用的AzureChatOpenAI初始化，如果未显式提供API密钥，SDK会尝试使用DefaultAzureCredential链来获取令牌。

DefaultAzureCredential会按顺序尝试多种认证方式，在本地开发时，它会成功使用你通过az login获得的用户凭证。这实现了本地与云上认证方式的无缝衔接。

生产环境最佳实践：部署到Azure后，你应该为函数应用分配一个系统分配的托管身份（Managed Identity），并在Azure OpenAI服务中为该身份授予“认知服务 OpenAI 用户”角色。这样，代码完全无需处理任何密钥，安全又省心。azd up命令在部署时通常会帮你配置好这部分。

4. 核心代码逐行解读与扩展实践

4.1 函数入口与路由解析

让我们深入function_app.py的核心部分：

import azure.functions as func import logging from langchain_openai import AzureChatOpenAI from langchain_core.prompts import PromptTemplate app = func.FunctionApp(http_auth_level=func.AuthLevel.ANONYMOUS) @app.route(route="ask", methods=[HttpMethod.POST]) def ask(req: func.HttpRequest) -> func.HttpResponse: # ... 函数主体

app = func.FunctionApp(...)：这是Python v2模型的应用实例化。http_auth_level=func.AuthLevel.ANONYMOUS意味着该HTTP端点无需认证即可访问，这仅适用于本地开发和公开API场景，生产环境务必设置为FUNCTION或ADMIN，并通过API管理、前端代理等方式实施安全控制。
@app.route(...)：装饰器定义了HTTP触发器的路由（/api/ask）和允许的方法（POST）。清晰的路由定义是构建RESTful API的基础。

4.2 LangChain与Azure OpenAI集成细节

函数主体内的关键代码块：

def ask(req: func.HttpRequest) -> func.HttpResponse: # 1. 解析请求 try: req_body = req.get_json() prompt = req_body.get('prompt') except ValueError: return func.HttpResponse("Invalid JSON", status_code=400) if not prompt: return func.HttpResponse("Please pass a prompt in the JSON body.", status_code=400) # 2. 初始化LLM和提示模板 llm = AzureChatOpenAI( azure_endpoint=os.environ["AZURE_OPENAI_ENDPOINT"], azure_deployment=os.environ["AZURE_OPENAI_CHATGPT_DEPLOYMENT"], api_version=os.environ["OPENAI_API_VERSION"], temperature=0.3 ) llm_prompt = PromptTemplate.from_template( "The following is a conversation with an AI assistant. " "The assistant is helpful, creative, clever, and very friendly.\n\n" "Human: {human_prompt}\n" "AI:" ) # 3. 格式化提示并调用模型 formatted_prompt = llm_prompt.format(human_prompt=prompt) response = llm.invoke(formatted_prompt) # 4. 处理并返回响应 return func.HttpResponse(response.content, mimetype="text/plain")

关键参数解析：

temperature=0.3：这个参数控制生成文本的随机性。值越低（接近0），输出越确定、保守，倾向于选择最可能的词；值越高（接近1或2），输出越随机、有创意。对于问答类、需要事实准确性的场景，建议设置在0.1到0.3之间。对于创意写作，可以提高到0.7以上。这里设为0.3，是在一致性和一点灵活性之间取得平衡。
提示模板设计：示例模板是一个简单的对话开场。{human_prompt}是占位符。更复杂的模板可以包含多条历史对话、系统指令（如“你是一个专业的Azure架构师”）、或从上下文检索到的信息。这是影响模型表现最直接的因素。

4.3 从简单问答到复杂链的升级路径

当前示例是一个最简单的LLMChain。LangChain的强大之处在于链的组装。假设你想构建一个能基于特定文档回答问题的助手，可以升级为RetrievalQA链：

文档加载与向量化：使用LangChain的文档加载器（如AzureAIDocumentIntelligenceLoader）和嵌入模型（AzureOpenAIEmbeddings），将你的知识库文档转换为向量，存入如AzureCosmosDBVectorSearch的向量数据库。

构建检索链：

from langchain.chains import RetrievalQA from langchain.vectorstores import AzureCosmosDBVectorSearch # 假设已有vector_store实例 qa_chain = RetrievalQA.from_chain_type( llm=llm, chain_type="stuff", # 将检索到的文档“塞”进提示词 retriever=vector_store.as_retriever(), chain_type_kwargs={"prompt": QA_PROMPT} # 自定义的QA提示模板 )

修改函数逻辑：在HTTP函数中，不再直接调用llm.invoke，而是调用qa_chain.invoke({"query": prompt})。

这样，你的函数就从一个简单的聊天接口，升级为了一个基于私有知识库的智能问答系统。

5. 调试、测试与部署实战

5.1 本地调试与高效测试方法

使用VS Code进行调试是最佳体验。安装“Azure Functions”扩展后，打开项目文件夹，VS Code通常能自动识别并提示你创建调试配置。

除了使用test.http或curl，更高效的测试方法是编写单元测试。创建一个tests目录，使用pytest：

# test_function_app.py import sys sys.path.insert(0, '.') from function_app import app import azure.functions as func import json def test_ask_function(): # 构建模拟请求 req_body = json.dumps({"prompt": "What is serverless?"}).encode('utf-8') req = func.HttpRequest( method='POST', url='/api/ask', body=req_body ) # 调用函数 resp = app.ask(req) # 断言 assert resp.status_code == 200 assert len(resp.get_body()) > 0 assert b'serverless' in resp.get_body().lower() or True # 实际测试中可能需要更灵活的断言

运行pytest可以快速验证函数逻辑，尤其是在修改提示模板或链结构后，能确保核心功能不被破坏。

5.2 使用azd进行一站式部署

azd up命令是魔法发生的地方。它背后执行了两个主要动作：

azd provision：根据infra/下的Bicep模板预配所有Azure资源。Bicep是一种声明式基础设施即代码语言，它定义了需要创建的资源（函数应用、OpenAI资源、存储账户等）及其属性和依赖关系。
azd deploy：将你的应用程序代码（包括function_app.py,requirements.txt等）打包并部署到刚刚创建的函数应用上。

部署前检查清单：

确保requirements.txt中的依赖版本是固定的（例如langchain-openai==0.0.5），避免因依赖项自动升级导致部署失败。
检查host.json和function.json（如果有）中的配置，例如函数超时时间（functionTimeout）。AI模型调用可能较慢，建议将超时时间设置为至少30秒（“functionTimeout”: “00:30:00”）。
在Azure门户中，确认函数应用的“配置”部分，AZURE_OPENAI_ENDPOINT等应用设置已正确从部署管道中注入。

5.3 监控与日志排查

部署后，如何知道它是否正常运行？

Application Insights：azd模板通常会自动关联Application Insights。在Azure门户中打开你的函数应用，进入“监视”->“Application Insights”，你可以查看实时指标、失败请求、性能跟踪和日志。
流式日志：在VS Code的Azure扩展中，你可以直接连接到生产环境函数的日志流，实时查看输出，这对调试生产问题至关重要。
```
# 或者使用Azure CLI az webapp log tail --name <your-function-app-name> --resource-group <your-resource-group>
```
LangChain调试输出：在开发阶段，你可以通过设置环境变量LANGCHAIN_VERBOSE=true来让LangChain打印出链的每一步执行细节，包括发送给模型的最终提示词，这对于优化提示工程无比重要。

6. 常见问题、性能优化与安全加固

6.1 典型错误与解决方案速查表

问题现象	可能原因	解决方案
本地运行`func start`失败，提示无法导入模块	Python路径或虚拟环境问题	1. 确认在项目根目录激活了虚拟环境（`.venv`）。 2. 运行`pip install -r requirements.txt`确保所有依赖已安装。 3. 检查VS Code是否选择了正确的Python解释器（右下角选择`.venv`下的python）。
调用函数返回“404 Not Found”	路由不匹配或函数未正确加载	1. 检查`@app.route`装饰器中的路由是否与访问的URL匹配（默认会加上`/api`前缀）。 2. 查看`func start`启动日志，确认你的函数（如`ask`）已被成功发现和加载。
调用Azure OpenAI时超时或认证失败	环境变量错误或网络问题/身份无权限	1. 仔细核对`local.settings.json`或应用设置中的`AZURE_OPENAI_ENDPOINT`和`AZURE_OPENAI_CHATGPT_DEPLOYMENT`值。 2. 本地运行`az account show`确认登录了正确的订阅。 3. 在Azure门户中，检查OpenAI资源是否已为你的用户或函数托管身份授予了访问权限。
部署后函数执行报错，提示模块不存在	依赖未成功安装或平台不兼容	1. 检查函数应用的“部署中心”日志，看`pip install`阶段是否有错误。 2. 确保`requirements.txt`中的包支持Linux（Azure Functions运行时环境）。某些纯Windows的包可能需要替代方案。 3. 尝试在`requirements.txt`中指定Linux兼容的轮子（wheel）或更通用的版本。
模型响应速度慢	函数超时设置过短/模型部署层级较低	1. 在`host.json`中增加`functionTimeout`。 2. 考虑使用Azure OpenAI的GPT-4 Turbo等响应更快的模型。 3. 检查是否为模型部署选择了合适的层级（如Standard S0），过低层级可能限制吞吐量。

6.2 性能优化要点

冷启动优化：无服务器函数的冷启动是常见问题。对于AI函数，由于需要加载LangChain和模型客户端，冷启动时间可能更长。 mitigation措施包括：1) 设置最小的常驻实例（Premium计划支持）；2) 定期发送“保温”请求（对于关键业务）；3) 精简依赖，移除不必要的库。
异步处理：如果函数逻辑复杂（如包含文档检索），考虑使用异步函数（async def）和异步的LangChain组件，以便在等待I/O（数据库、API调用）时释放工作线程，提高并发能力。
提示词缓存：如果某些提示词模板被频繁使用且计算结果固定，可以考虑使用内存缓存（如functools.lru_cache）缓存格式化后的提示词字符串，减少重复计算。

6.3 安全加固建议

认证与授权：将http_auth_level从ANONYMOUS改为FUNCTION。这意味着调用需要提供函数密钥。你可以在Azure门户中管理这些密钥。更佳实践是使用Azure API管理（APIM）前置，在APIM层面实施JWT验证、速率限制等策略。
输入验证与清理：当前代码只检查了prompt字段是否存在。生产环境中，必须对输入进行严格的验证和清理，防止提示词注入攻击。例如，检查输入长度，过滤敏感词汇等。
输出过滤：对模型生成的内容进行审查或过滤，避免产生不当或有害内容。Azure OpenAI服务本身有内容过滤机制，但你也可以在应用层增加额外的逻辑。
密钥管理：始终坚持使用托管身份或Azure Key Vault来管理敏感信息，绝不要将任何密钥硬编码在代码中或直接放在应用设置里。azd的Bicep模板可以很好地集成Key Vault。

这个项目模板就像一颗种子，它展示了将前沿的AI能力以最简单、最云原生方式交付成API的完整路径。从本地开发的一键调试，到通过基础设施即代码（Bicep）的一键部署，再到生产环境的监控和安全考量，它覆盖了一个AI应用从零到一的核心闭环。我最深的体会是，成功的AI应用集成，技术选型只占一半，另一半在于对开发运维流程的打磨——如何安全、高效、可观测地将想法持续交付到云端。接下来，你可以尝试修改提示模板，让它扮演不同的角色；或者集成一个向量数据库，打造一个真正“有记忆”的专属知识助手。

查看全文

http://www.jsqmd.com/news/706176/