当前位置: 首页 > news >正文

【大家的项目】active-call: 纯Rust写的超高性能VoiceAgent框架

https://github.com/restsend/active-call 欢迎Star

先给大家看看效果:

这次最重要的改进,就是不再依赖onnxruntime处理Silero VAD.

重新手写了Silero VAD的推理(纯Rust实现),性能有了非常高的提升 (大概2.5x提升),并且内存占用非常的低:

VAD Engine

Implementation

Time (60s)

RTF (Ratio)

Note

TinySilero

Rust (Optimized)

~60.0 ms

0.0010

>2.5x faster than ONNX

ONNX Silero

ONNX Runtime

~158.3 ms

0.0026

Standard baseline

WebRTC VAD

C/C++ (Bind)

~3.1 ms

0.00005

Legacy, less accurate

这次还开始引入一个全新的playbook,过去的websocket api过于原始,大家想体验一个voice agent的流程会比较麻烦,干脆给大家提供一个参考方案,可以基于markdown进行扩展:

--- asr: provider: "aliyun" llm: provider: "aliyun" model: "qwen-turbo" tts: provider: "aliyun" vad: provider: "silero" denoise: true greeting: "您好,我是您的AI助理,请问有什么可以帮您?" interruption: "both" recorder: recorderFile: "hello_{id}.wav" --- # Role and Purpose You are an intelligent, polite AI assistant. Your goal is to help users with their inquiries efficiently. # Tool Usage - When the user expresses a desire to end the conversation (e.g., "goodbye", "hang up", "I'm done"), you MUST provide a polite closing statement AND call the `hangup` tool. - Always include your response text in the `text` field and any tool calls in the `tools` array. # Example Response for Hanging Up: json { "text": "很高兴能为您服务,如果您还有其他问题,欢迎随时联系。再见!", "tools": [{"name": "hangup"}] } ---

并且保留了我们最大的技术特色: 唯一一个内置SIP支持的Voice-Agent SDK, 可以直接对接sip 网关,实现Ai与电话的对接。

并且把LLM的流式输出也实现了,可以边思考边讲话

相比Pipecat/Livekit这些Framework, active-call更加专注于语音通话,最核心的就是性能很好, 2C4G很轻松支持200路并发,持续稳定运行个把月没问题

当然还是保留了最基础的Websocket API,允许通过Websocket来控制一个通话,这个当然是比较底层的实现,也是开发者最喜欢的方案。

从通话性能数据来看,现在已经能很便捷的和Ai聊天了 (延迟基本上在800ms以内)

http://www.jsqmd.com/news/241365/

相关文章:

  • DLSS Swapper:游戏性能优化终极指南
  • 网易云音乐智能听歌升级系统:5分钟极速配置,轻松突破LV10等级壁垒
  • DLSS Swapper深度解析:解锁游戏性能优化的无限可能
  • 阿里云流存储 Fluss 版开启免费公测,评测有礼
  • 3步彻底解决机械键盘连击问题:Keyboard Chatter Blocker终极指南
  • DLSS Swapper完全指南:轻松掌握游戏性能优化技巧
  • DLSS Swapper终极指南:游戏画质性能自由掌控
  • 如何在3分钟内实现WPS与Zotero的无缝集成:文献管理新革命
  • 网易云音乐自动打卡终极指南:3步配置实现每日300首听歌升级
  • 强烈建议尽快搞个软考证!(政策红利)
  • DLSS Swapper:游戏画质优化的智能管家
  • WaveTools鸣潮工具箱:从新手到高手的智能游戏伴侣
  • WPS-Zotero插件:5分钟实现文献管理的完整解决方案
  • GARbro终极指南:视觉小说资源浏览的完整解决方案
  • DLSS Swapper深度解析:革命性游戏性能优化方案实战指南
  • 字节跳动员工吐槽:好多人以为自己年薪60万,平均每个月五万块工资......实际上根本不是这么回事儿
  • Proteus示波器使用方法图解:信号测量核心要点
  • Arduino IDE中文设置完整示例演示
  • SpringBoot应用部署神器:可视化服务管理脚本让运维更轻松
  • 如何快速掌握GARbro:视觉小说资源管理终极指南
  • 智能体正在悄悄改变孩子们的游戏世界
  • 如何通过AI提升电商广告投放效果
  • JLink驱动开发入门必看:官方下载资源详解
  • MCP应用:cursor+hexstrike-ai的安全实战
  • 51单片机(2)
  • 3分钟完美解决键盘连击:智能防抖配置全攻略
  • ARM 的 A35 引领了近十年
  • WaveTools鸣潮工具箱:从游戏小白到高手的3个关键转折点
  • WaveTools鸣潮工具箱终极指南:从基础配置到深度优化
  • 抹掉了精益敏捷devops的痕迹