当前位置：首页 > news >正文

Fun-ASR识别历史管理：如何搜索、导出和清理记录

news 2026/3/26 21:02:29

Fun-ASR识别历史管理：如何搜索、导出和清理记录

在语音技术日益普及的今天，越来越多的用户依赖自动语音识别（ASR）系统完成会议纪要整理、教学内容转写或创作素材提取。每一次点击“开始识别”，背后都是一次数据生成的过程——而当这些记录不断累积，问题也随之而来：昨天那条关键对话到底存在哪条记录里？硬盘空间怎么突然告急？有没有可能不小心留下了敏感信息？

这些问题看似琐碎，却直接影响着工具能否长期可用。Fun-ASR 作为钉钉与通义联合推出、由开发者“科哥”主导维护的本地化部署语音识别系统，其 WebUI 版本不仅具备强大的大模型识别能力，更在用户体验细节上做了扎实设计。其中，“识别历史管理”模块正是解决上述痛点的核心机制。

它不参与语音解码计算，也不影响转写准确率，但正是这个“幕后角色”，让整个系统从一个临时工具进化为可持续使用的专业平台。

数据去哪儿了？揭秘识别记录的存储逻辑

每次你上传一段音频并完成识别，系统并不会在展示结果后就“忘记一切”。相反，所有相关信息都会被悄悄存入本地数据库中，形成一条结构化的识别历史。

这些信息包括：
- 任务时间戳
- 原始文件名
- 使用的语言设置
- 是否启用ITN（文本规整）
- 是否应用热词
- 原始识别文本
- 规整后的输出文本

它们统一写入位于webui/data/history.db的 SQLite 数据库文件中。选择 SQLite 并非偶然——这是一种轻量级、零配置、无需独立服务即可运行的关系型数据库，特别适合桌面级或个人使用的离线工具。

这意味着什么？
你的数据不会上传到云端，不需要网络连接也能访问过往记录，也没有账户体系带来的隐私顾虑。整个过程完全发生在本地，真正实现了“我的数据我做主”。

每条记录都有唯一 ID，便于后续精准定位。默认情况下，系统仅在界面上显示最近 100 条记录，避免列表过长导致页面卡顿。但这并不意味着老数据被丢弃——只要数据库还在，它们依然可以通过搜索或直接查询找回。

小贴士：如果你打算迁移配置或备份重要识别成果，只需复制history.db文件即可实现完整同步。升级前建议手动备份，防止意外覆盖。

找不到了怎么办？高效检索是如何实现的

想象一下这样的场景：你在三天前处理了一份长达一小时的访谈录音，现在需要从中找出某位嘉宾提到“用户增长策略”的片段。如果没有索引和搜索功能，就得靠记忆翻找文件名，再逐个点开查看内容——效率极低。

Fun-ASR 的搜索功能正是为此而生。它采用前后端协同的实时模糊匹配机制：

前端监听输入框变化，一旦用户键入字符，立即向后端发起请求；后端接收到关键词后，执行如下 SQL 查询：

SELECT id, timestamp, filename, result_text, lang FROM recognition_history WHERE filename LIKE ? OR result_text LIKE ? ORDER BY timestamp DESC LIMIT 100

注意这里的关键点：
-双字段匹配：同时支持按“文件名”和“识别结果”查找，覆盖最常用的两种检索路径。
-模糊匹配：使用LIKE '%keyword%'实现部分匹配，即使记不清完整句子也能搜到。
-参数化查询：通过占位符传参，有效防御 SQL 注入攻击。
-性能控制：限制返回最多 100 条结果，防止全表扫描拖慢响应速度。

@app.route('/api/history/search') def search_history(): keyword = request.args.get('q', '').strip() if not keyword: return jsonify(get_latest_records(limit=100)) query = f"%{keyword}%" conn = sqlite3.connect('webui/data/history.db') cursor = conn.cursor() cursor.execute(""" SELECT id, timestamp, filename, result_text, lang FROM recognition_history WHERE filename LIKE ? OR result_text LIKE ? ORDER BY timestamp DESC LIMIT 100 """, (query, query)) results = cursor.fetchall() conn.close() return jsonify([{ 'id': r[0], 'time': r[1], 'file': r[2], 'text': r[3], 'lang': r[4] } for r in results])

这段代码虽短，却体现了典型的小型 Web 服务最佳实践：简洁、安全、响应迅速。

不过也要提醒一点：SQLite 在没有建立索引的情况下进行全文模糊查询，随着记录增多可能会出现延迟。虽然目前百条级别表现良好，但如果未来用户希望长期保存上千条记录，建议对filename和result_text字段添加全文索引（FTS5），以维持搜索性能稳定。

不只是看结果，还能查上下文：详情查看的价值

很多人以为“查看详情”只是把文本再展示一遍，其实不然。在 Fun-ASR 中，点击某个记录的 ID 或通过专用接口/api/history/detail获取详情时，返回的是完整的元数据集合：

{ "id": 45, "timestamp": "2025-04-05T10:23:15", "filename": "meeting_01.mp3", "language": "zh", "use_itn": true, "hotwords": ["项目进度", "上线时间"], "raw_text": "本周项目进度正常，预计二零二五年三月上线", "normalized_text": "本周项目进度正常，预计2025年3月上线" }

这些附加信息有什么用？

举个例子：你发现某段话里的“二零二五年”没有被转换成“2025年”，第一反应可能是“模型出错了”。但通过查看详情你会发现，use_itn字段为false——原来是你这次忘了开启文本规整功能。

又或者，你想确认自定义热词是否生效，也可以在这里核对当时是否正确传入。这种调试级别的透明度，对于高级用户来说非常宝贵。

更重要的是，这种设计使得系统具备了自我审计的能力。无论是个人复盘还是团队协作，都可以基于具体参数追溯每一次识别的行为依据，而不是仅仅看到一个孤立的结果。

清理不是删除那么简单：理解删除与清空的操作边界

随着时间推移，识别记录越积越多，两个现实问题浮现出来：
1. 磁盘空间占用增加
2. 敏感信息留存风险

Fun-ASR 提供了两种应对方式：单条删除和全局清空。

单条删除：精确控制每一项记录

你可以输入特定 ID，发起删除请求。后端接收 JSON 格式的 ID 列表，动态构建 SQL 语句执行批量清除：

@app.route('/api/history/delete', methods=['POST']) def delete_history(): data = request.json ids_to_delete = data.get('ids', []) if not ids_to_delete: return jsonify({'error': '未指定删除ID'}), 400 conn = sqlite3.connect('webui/data/history.db') cursor = conn.cursor() placeholders = ','.join('?' * len(ids_to_delete)) cursor.execute(f"DELETE FROM recognition_history WHERE id IN ({placeholders})", ids_to_delete) affected = cursor.rowcount conn.commit() conn.close() return jsonify({'deleted': affected})

这里的技巧在于使用','.join('?' * n)动态生成占位符，既保证安全性，又支持灵活数量的删除操作。

需要注意的是：删除仅作用于数据库中的记录条目，并不会自动移除原始音频文件。也就是说，如果你上传的是临时文件且已关闭引用，音频本身可能仍存在于磁盘上。若涉及高度敏感内容，建议手动清理相关文件。

此外，当前版本采用的是物理删除，即数据一旦移除便无法恢复。虽然界面上已有明确警告提示，但从工程角度看，未来引入软删除机制（如增加is_deleted标记字段）会是更稳妥的选择，尤其适用于多人共用环境。

全局清空：一键释放资源

当你想彻底重置系统状态时，可以选择“清空全部记录”。该操作将清空整张表，并通常伴随自增 ID 的重置（取决于具体实现）。

适合场景包括：
- 更换使用设备前的数据清理
- 测试完成后还原初始状态
- 防止旧数据干扰新项目判断

但务必记住：此操作不可逆。生产环境中应谨慎使用，必要时可结合定时归档策略，将重要记录先导出再清空。

它在整个系统中扮演什么角色？

如果我们把 Fun-ASR WebUI 拆解来看，识别历史管理模块实际上处于“数据管理层”的中枢位置：

[前端交互层] ←→ [API服务层] ←→ [本地数据库] ↑ ↑ ↑ 用户操作 业务逻辑 history.db

它的上游来自语音识别引擎——每当一次识别完成，无论单条还是批量，都会触发一条新记录写入；它的下游则服务于用户的长期使用需求——查找、复用、分析、清理。

不仅如此，它还与其他功能紧密联动：
- VAD（语音活动检测）若生成文本片段，也会被计入历史；
- 批量处理任务结束后，系统会批量插入多条记录；
- 语言切换、热词更新等设置变更，都会反映在后续记录的元数据中。

可以说，它是连接“瞬时识别行为”与“持续数据资产”的桥梁。

这些小功能，解决了哪些真实痛点？

用户困扰	Fun-ASR 的解决方案
“上次识别的内容找不到了”	支持关键词模糊搜索，支持按文件名或内容查找
“重复识别太多，分不清哪个是新的”	按时间倒序排列 + 显示时间戳，清晰区分先后
“用了几个月，C盘空间越来越紧张”	提供删除和清空功能，主动释放存储
“录了内部会议，怕别人看到”	可针对性删除敏感记录，本地存储无云端泄露风险
“为什么这次识别结果和上次不一样？”	查看详情对比参数配置，排查 ITN/热词差异

这些都不是惊天动地的功能革新，但却实实在在提升了工具的可用性和可信度。