当前位置：首页 > news >正文

54_Spring AI 干货笔记之 Azure OpenAI 语音转录

news 2026/5/12 19:11:39

一、Azure OpenAI 语音转录

Spring AI 支持 Azure Whisper 模型。

二、前置条件

从 Azure 门户的 Azure OpenAI 服务部分获取您的 Azure OpenAI 端点和 API 密钥。Spring AI 定义了一个名为 spring.ai.azure.openai.api-key 的配置属性，您应将其设置为从 Azure 获取的 API 密钥值。同时还有一个名为 spring.ai.azure.openai.endpoint 的配置属性，应设置为在 Azure 中部署模型时获取的端点 URL。

三、自动配置

Spring AI 的自动配置及其 Starter 模块的构件名称发生了显著变化。更多信息请参阅升级说明。

Spring AI 为 Azure OpenAI 语音转录生成客户端提供了 Spring Boot 自动配置。要启用它，请将以下依赖项添加到项目的 Maven pom.xml 文件中：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-azure-openai'}

请参考“依赖管理”部分，将 Spring AI BOM 添加到您的构建文件中。

转录属性

现在通过顶级属性 spring.ai.model.audio.transcription 来启用或禁用音频转录的自动配置。
要启用：spring.ai.model.audio.transcription=azure-openai (默认已启用)
要禁用：spring.ai.model.audio.transcription=none (或任何非 azure-openai 的值)
此项变更是为了支持配置多个模型。

前缀 spring.ai.openai.audio.transcription 用作属性前缀，用于配置 OpenAI 图像模型的重试机制。

四、运行时选项

AzureOpenAiAudioTranscriptionOptions 类提供了进行转录时使用的选项。在启动时，会使用 spring.ai.azure.openai.audio.transcription 指定的选项，但您可以在运行时覆盖这些选项。

例如：

AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormatresponseFormat=AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormat.VTT;AzureOpenAiAudioTranscriptionOptionstranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().language("en").prompt("Ask not this, but ask that").temperature(0f).responseFormat(this.responseFormat).build();AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=azureOpenAiTranscriptionModel.call(this.transcriptionRequest);

五、手动配置

将 spring-ai-openai 依赖项添加到项目的 Maven pom.xml 文件中：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-azure-openai'}

请参考“依赖管理”部分，将 Spring AI BOM 添加到您的构建文件中。

接下来，创建一个 AzureOpenAiAudioTranscriptionModel

varopenAIClient=newOpenAIClientBuilder().credential(newAzureKeyCredential(System.getenv("AZURE_OPENAI_API_KEY"))).endpoint(System.getenv("AZURE_OPENAI_ENDPOINT")).buildClient();varazureOpenAiAudioTranscriptionModel=newAzureOpenAiAudioTranscriptionModel(this.openAIClient,null);vartranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().responseFormat(TranscriptResponseFormat.TEXT).temperature(0f).build();varaudioFile=newFileSystemResource("/path/to/your/resource/speech/jfk.flac");AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(this.audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=this.azureOpenAiAudioTranscriptionModel.call(this.transcriptionRequest);