当前位置: 首页 > news >正文

Python 包定义中的聚合导出;FunASR使用同时运用vad(语音活动检测)+punc(标点恢复)+spk(说话人分割)模型

Python 包定义中的聚合导出;

之前一直不知道包下的__init__.py的真正作用,今天问了ai了解了以下

init.py 文件能够定义这个目录作为一个“包”的对外接口(API),控制“别人 import 这个包时能看到什么、怎么用”。

  1. 标记这是一个 Python 包
    虽然python3.3后就能隐式命名空间包,但是项目稍微复杂一点后,就需要尽量使用init配合导入,后面导入多了会乱。

  2. 统一“对外暴露”的入口(最重要)
    👉非聚合导入:
    from app.domain.asr import AsrResponse
    from app.domain.funasr_infer import infer_from_file_item
    from app.domain.funasr_loader import load_models
    👉聚合导入:
    from app.domain import AsrResponse, infer_from_file_item, load_models

  3. 配合__all__,控制 * 导入内容
    属性__all__ 只对 from xxx import * 生效
    文件__init__.py中的可以限制 * 导入内容,也就是即使使用from xxx import * 也不会导入所有的方法函数,只会导入__init__.py中规定的__all__


FunASR使用同时运用vad(语音活动检测)+punc(标点恢复)+spk(说话人分割)模型

按照FunASR官方文档,加入了punc和spk这两个模型,出现了一个问题

按照FunASR官方文档,只需要在高层封装入口AutoModel处,加上punc_model和spk_model参数,指定对应模型所在文件夹即可。

vad_model和model等这些参数如果不是给的是字符串而不是文件地址,这个函数会自动去网上下载,尽量先下载下来放到对应位置。

model = AutoModel(model="paraformer-zh",  vad_model="fsmn-vad", vad_kwargs={"max_single_segment_time": 60000},punc_model="ct-punc", spk_model="cam++")

出现assert问题

然后就报了一个实际产生的语音分段(segments)数量 ≠ 说话人标签(labels)数量。
简而言之就是VAD 分出 N 段,说话人分割模型却只给了 M 个 labelN ≠ M → 直接 assert 炸掉

解决方案

  • 查看github问题社区发现是在生成时少了batch_size_s(动态batch)。
  • 顺便也可以加上batch_size_threshold_s(切割后音频片段时长超过这个阈值,batch_size=1)
http://www.jsqmd.com/news/414916/

相关文章:

  • 【FAQ】HarmonyOS SDK 闭源开放能力 — Ads Kit
  • 2026年2月电加热蒸汽发生器厂家推荐,精准控温与持续稳定输出测评 - 品牌鉴赏师
  • 【FAQ】HarmonyOS SDK 闭源开放能力 — Core File Kit
  • 2026年污水处理臭氧发生器厂家最新推荐:自来水臭氧发生器、食品厂臭氧发生器、食品厂臭氧机、养殖场臭氧发生器选择指南 - 优质品牌商家
  • 【笔记】集合幂级数 3:逐点牛顿迭代法
  • 2026年工业废水臭氧发生器公司权威推荐:冻库臭氧机/实验室臭氧发生器/工业废水臭氧机/水果臭氧发生器/选择指南 - 优质品牌商家
  • 2026年老榆木护墙板地板厂家实力推荐:郓城县匠造木作老榆木家具厂,全系老榆木板材/风化板/柱子/大梁定制供应 - 品牌推荐官
  • 闲置京东e卡别浪费!三种实用京东e卡回收方法,轻松变现不踩坑 - 京回收小程序
  • 十大开料机品牌怎么选?全屋定制开料机品牌干货指南 - 星辉数控
  • 珠三角GEO优化服务商哪家最专业 - 品牌推荐大师1
  • 2026年全站仪综合服务推荐:南京环球测绘仪器,租赁/检定/维修/回收一站式解决方案 - 品牌推荐官
  • 基于springboot 实验室设备管理系统(源码+数据库+文档)
  • 2026年2月流体粘滞阻尼器厂家推荐,源头直供性价比之选 - 品牌鉴赏师
  • 施耐德平台商品详情API接口技术指南
  • 牛客链接
  • 腾讯云代理商:腾讯云国际站 搭建网站的明智之选还是隐藏陷阱?
  • 基于BFS的2525迷宫最短路径MATLAB实现
  • 点量云流管理平台使用教程——服务器管理用户管理
  • Nordic nRF54L15 蓝牙 6.0 BLE 赋能全场景 IoT 连接
  • 2026年军用无人机集群软硬一体化供应商推荐,猎翼无人机引领实战化变革 - 品牌2025
  • 揭秘LLM千亿级推理:分布式架构与核心优化机制全解析
  • 如何通俗地理解RAG?RAG大模型必备:如何让你的AI产品更懂你?揭秘RAG原理与实战技巧!
  • 利用施耐德平台API获取设备列表数据
  • 施耐德(Schneider)搜索列表数据接口深度实战:专有协议+证书校验+工业级高可用方案
  • 县域红色经典旅游景区DID数据2002-2025
  • Wi-Fi 6 模块技术解析与多场景应用介绍
  • M3KG-RAG:多跳多模态知识图谱如何让AI视听问答更可信?爆肝揭秘!
  • 2026年板材货架企业口碑排名,谁才是行业翘楚?半开重型模具货架/流利货架定制/重型伸缩悬臂货架,板材货架厂商怎么选 - 品牌推荐师
  • 蓝天智能节气装置
  • 小白也能懂的 ELK 实战:手把手教你搭建一套会自动报警的日志系统