当前位置：首页 > news >正文

FRCRN部署教程：在阿里云PAI-EAS平台一键部署为RESTful API服务

news 2026/5/12 1:14:57

FRCRN部署教程：在阿里云PAI-EAS平台一键部署为RESTful API服务

你是不是也遇到过这样的烦恼？录制的语音里混杂着键盘声、空调声、窗外的车流声，听起来特别不清晰。或者，你正在开发一个语音应用，但用户上传的音频质量参差不齐，背景噪音严重影响了后续的识别或处理。

今天，我就带你解决这个问题。我们将把一个强大的语音降噪模型——阿里巴巴达摩院开源的FRCRN，从本地脚本变成一个随时可用的在线服务。你只需要跟着步骤操作，就能在阿里云PAI-EAS平台上，一键把它部署成一个标准的RESTful API。以后，无论是你的应用还是同事，都可以通过一个简单的HTTP请求，轻松获得清晰、纯净的人声音频。

1. 项目与平台简介：为什么选择这个组合？

在开始动手之前，我们先花两分钟了解一下我们要用到的“武器”和“战场”。

FRCRN模型，全称是Frequency-Recurrent Convolutional Recurrent Network。这个名字听起来很复杂，但它的工作很简单：专门给单声道音频“洗澡”，洗掉背景噪音，留下干净的人声。它在处理那些复杂的、非平稳的噪声（比如人声嘈杂、键盘敲击）时特别拿手，效果比很多传统方法要好。它原本是ModelScope（魔搭社区）上的一个开源模型。

那么，阿里云PAI-EAS（Elastic Algorithm Service）又是做什么的呢？你可以把它想象成一个“模型托管服务器”。它的核心价值在于，能把我们训练好的、或者找到的AI模型，快速包装成一个可以通过网络调用的API服务。你不需要自己操心服务器运维、负载均衡、弹性伸缩这些麻烦事，EAS都帮你搞定了。我们这次就是要利用EAS，把FRCRN这个本地运行的Python脚本，变成一个24小时在线的语音降噪服务。

这个组合的最终效果就是：开发效率高，运维成本低，服务随时可用。

2. 前期准备：兵马未动，粮草先行

部署之前，我们需要准备好三样东西：模型代码、一个可以运行的Docker镜像，以及你的阿里云账户。

2.1 获取与理解模型代码

首先，你需要拿到FRCRN模型的推理代码。通常，这类开源模型的代码结构都比较清晰。一个典型的可部署结构可能包含以下文件：

app.py: 这是核心，我们会把它改造成一个基于Web框架（如Flask或FastAPI）的API服务主程序。
requirements.txt: 列出了运行所需的所有Python库，比如modelscope,torch,librosa,numpy等。
Dockerfile: 这是构建Docker镜像的“食谱”，告诉EAS如何创建运行环境。
（其他模型文件、工具脚本等）

关键改造点：原始的模型脚本（比如test.py）通常是直接处理本地文件。我们需要在app.py里做两件事：

创建一个HTTP端点（例如/predict），用来接收上传的音频文件。
在这个端点函数内部，调用FRCRN模型进行降噪处理，并将处理后的音频文件返回。

下面是一个基于Flask框架的app.py极度简化的示例逻辑：

from flask import Flask, request, send_file import modelscope from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks import tempfile import os app = Flask(__name__) # 初始化模型管道（全局加载一次，避免每次请求重复加载） print("正在加载FRCRN模型，首次加载较慢...") ans_pipeline = pipeline( task=Tasks.acoustic_noise_suppression, model='damo/speech_frcrn_ans_cirm_16k', device='cuda' # 如果环境支持GPU，会自动使用 ) print("模型加载完毕！") @app.route('/predict', methods=['POST']) def predict(): # 1. 接收客户端上传的音频文件 audio_file = request.files['audio'] # 2. 保存到临时文件 temp_input_path = tempfile.mktemp(suffix='.wav') audio_file.save(temp_input_path) # 3. 调用FRCRN模型进行降噪 # 注意：模型期望16kHz单声道wav，这里假设客户端已预处理 result = ans_pipeline(temp_input_path, output_path='./') # 4. 假设处理后的文件在当前目录，命名为‘output.wav’ output_path = './output.wav' # 5. 将降噪后的音频文件发送回客户端 return send_file(output_path, as_attachment=True, download_name='denoised_audio.wav') # 6. (可选)清理临时文件 os.remove(temp_input_path) if __name__ == '__main__': app.run(host='0.0.0.0', port=8000)

2.2 准备Docker镜像

PAI-EAS通过Docker镜像来运行你的代码。你需要编写一个Dockerfile来定义环境。

# 使用一个轻量级的Python基础镜像 FROM python:3.8-slim # 设置工作目录 WORKDIR /app # 安装系统依赖，例如ffmpeg用于音频处理 RUN apt-get update && apt-get install -y ffmpeg && rm -rf /var/lib/apt/lists/* # 将代码和依赖文件复制到镜像中 COPY requirements.txt . COPY app.py . # 复制其他必要的模型文件或脚本 # 安装Python依赖，使用清华镜像源加速 RUN pip install --no-cache-dir -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt # 暴露端口（与app.py中一致） EXPOSE 8000 # 启动命令 CMD ["python", "app.py"]

然后，在本地或使用云服务构建并推送这个Docker镜像到你的镜像仓库（如阿里云容器镜像服务ACR）。这是EAS能拉取到你代码的前提。

# 假设你已登录ACR docker build -t your-registry.cn-hangzhou.cr.aliyuncs.com/your-namespace/frcrn-api:latest . docker push your-registry.cn-hangzhou.cr.aliyuncs.com/your-namespace/frcrn-api:latest

2.3 阿里云资源准备

确保你拥有一个阿里云账号，并开通了PAI（机器学习平台）和容器镜像服务（ACR）。在PAI-EAS控制台，你需要配置好付费方式。同时，记下你刚刚推送镜像的ACR地址。

3. 在PAI-EAS平台部署服务

现在进入最核心的一步——在EAS控制台创建服务。

登录与进入：登录阿里云控制台，找到“人工智能平台PAI”，进入“模型在线服务（EAS）”页面。
创建服务：点击“创建服务”。
服务配置：
- 服务名称：起个易懂的名字，如frcrn-speech-denoise。
- 部署方式：选择“镜像部署”。
- 镜像地址：粘贴你推送到ACR的镜像地址，例如your-registry.cn-hangzhou.cr.aliyuncs.com/your-namespace/frcrn-api:latest。
- 处理器和显卡：根据需求选择。FRCRN模型推理在CPU上可以运行，但如果追求速度，建议选择带GPU的规格（如ecs.gn6i-c4g1.xlarge）。
- 资源组：选择你已配置好的资源组。
- 端口设置：设置“服务端口”为8000，与Dockerfile和app.py中暴露的端口一致。
- 运行命令：通常留空，因为Dockerfile中已有CMD指令。如果需要覆盖，可以填写python app.py。
高级配置（可选但重要）：
- 健康检查：建议配置HTTP健康检查，路径可以是/（如果根路径有响应）或一个特定的/health端点，确保服务启动正常。
- 环境变量：可以在这里设置一些参数，比如CUDA_VISIBLE_DEVICES来指定GPU。
部署：检查配置无误后，点击“部署”。EAS会开始拉取镜像、创建实例。等待几分钟，当服务状态变为“运行中”时，就大功告成了！

4. 测试与调用你的降噪API

服务运行起来后，我们怎么用呢？EAS会为你的服务分配一个公网访问地址（Endpoint）。

4.1 获取API地址

在EAS服务列表页，找到你刚创建的服务，点击“查看调用信息”，你就能看到类似https://12345678.cn-beijing.pai-eas.aliyuncs.com/api/predict/frcrn-speech-denoise的地址。这就是你的API入口。

4.2 使用工具进行测试

最简单的方法是用curl命令或者Python的requests库来测试。

使用curl测试：

curl -X POST \ '你的EAS-API-Endpoint/predict' \ -H 'Content-Type: multipart/form-data' \ -F 'audio=@你的带噪音音频文件.wav'

如果成功，它会返回降噪后的音频文件流。你可以用-o参数保存到本地：

curl ... -o denoised.wav

使用Python脚本测试：

import requests api_url = "你的EAS-API-Endpoint/predict" audio_file_path = "你的带噪音音频文件.wav" with open(audio_file_path, 'rb') as f: files = {'audio': f} response = requests.post(api_url, files=files) if response.status_code == 200: with open('降噪结果.wav', 'wb') as out_f: out_f.write(response.content) print("降噪成功，文件已保存！") else: print(f"请求失败，状态码：{response.status_code}") print(response.text)