当前位置：首页 > news >正文

语音录入工作灵感，自动按项目/创意/待办分类，生成灵感清单，支持关键词检索，避免灵感遗忘。

news 2026/3/29 5:39:28

1. 实际应用场景描述

你经常在通勤、散步或会议间隙产生灵感（比如新项目想法、技术优化点、待办任务）。传统做法是记在手机备忘录或纸质本上，但容易遗漏、分类混乱、检索困难。

痛点：

- 手动输入效率低

- 分类依赖人工判断

- 检索不方便

- 容易忘记灵感

解决方案：

开发一个语音灵感管理工具，通过语音识别将灵感转为文本，利用关键词自动分类，并支持快速检索，所有灵感存储在本地数据库，随时可查。

2. 核心逻辑讲解

1. 语音采集 → 使用

"speech_recognition" 库调用麦克风录音并转成文本。

2. 文本预处理 → 去除多余空格、标点，统一小写。

3. 分类规则 → 预设关键词映射：

- 包含 "项目"、"开发"、"上线" → 项目

- 包含 "创意"、"想法"、"点子" → 创意

- 包含 "待办"、"任务"、"记得" → 待办

4. 存储 → 使用 SQLite 存储灵感内容、分类、时间戳。

5. 检索 → 支持按关键词搜索标题和内容。

6. CLI 交互 → 命令行界面方便快速操作。

3. 代码模块化实现

目录结构

inspiration_manager/

├── main.py

├── speech_input.py

├── classifier.py

├── storage.py

├── search.py

└── README.md

"storage.py" - 数据库操作

import sqlite3

from datetime import datetime

DB_NAME = "inspirations.db"

def init_db():

conn = sqlite3.connect(DB_NAME)

c = conn.cursor()

c.execute('''CREATE TABLE IF NOT EXISTS inspirations

(id INTEGER PRIMARY KEY AUTOINCREMENT,

content TEXT,

category TEXT,

timestamp TEXT)''')

conn.commit()

conn.close()

def save_inspiration(content, category):

conn = sqlite3.connect(DB_NAME)

c = conn.cursor()

c.execute("INSERT INTO inspirations (content, category, timestamp) VALUES (?, ?, ?)",

(content, category, datetime.now().strftime("%Y-%m-%d %H:%M:%S")))

conn.commit()

conn.close()

def search_inspirations(keyword):

conn = sqlite3.connect(DB_NAME)

c = conn.cursor()

c.execute("SELECT * FROM inspirations WHERE content LIKE ? OR category LIKE ?",

(f"%{keyword}%", f"%{keyword}%"))

results = c.fetchall()

conn.close()

return results

"speech_input.py" - 语音识别

import speech_recognition as sr

def record_and_transcribe():

recognizer = sr.Recognizer()

with sr.Microphone() as source:

print("请说出你的灵感...")

audio = recognizer.listen(source)

try:

text = recognizer.recognize_google(audio, language="zh-CN")

print(f"识别结果: {text}")

return text

except sr.UnknownValueError:

print("无法识别语音")

return ""

except sr.RequestError:

print("语音服务不可用")

return ""

"classifier.py" - 分类器

def classify_inspiration(text):

text_lower = text.lower()

if any(kw in text_lower for kw in ["项目", "开发", "上线"]):

return "项目"

elif any(kw in text_lower for kw in ["创意", "想法", "点子"]):

return "创意"

elif any(kw in text_lower for kw in ["待办", "任务", "记得"]):

return "待办"

else:

return "未分类"

"search.py" - 搜索功能

from storage import search_inspirations

def display_results(results):

if not results:

print("未找到相关灵感")

return

for row in results:

print(f"[{row[2]}] {row[1]} (时间: {row[3]})")

"main.py" - 主程序

from speech_input import record_and_transcribe

from classifier import classify_inspiration

from storage import save_inspiration, init_db

from search import display_results

def main():

init_db()

while True:

print("\n1. 录入灵感\n2. 搜索灵感\n3. 退出")

choice = input("选择操作: ")

if choice == "1":

text = record_and_transcribe()

if text:

category = classify_inspiration(text)

save_inspiration(text, category)

print(f"已保存为【{category}】类灵感")

elif choice == "2":

keyword = input("输入搜索关键词: ")

results = search_inspirations(keyword)

display_results(results)

elif choice == "3":

break

else:

print("无效选择")

if __name__ == "__main__":

main()

4. README.md

# 灵感管理器 Inspiration Manager

一个基于 Python 的语音灵感管理工具，支持语音录入、自动分类、关键词检索。

## 功能

- 语音录入灵感

- 自动分类（项目/创意/待办）

- 关键词搜索

- SQLite 本地存储

## 安装依赖

bash

pip install SpeechRecognition pyaudio

## 使用

bash

python main.py

## 目录结构

见上方代码目录说明。

5. 使用说明

1. 安装依赖：

"SpeechRecognition" 和

"pyaudio"（Windows 可能需要安装 Visual Studio Build Tools）。

2. 运行

"main.py"。

3. 选择

"1" 录入灵感，对着麦克风说话。

4. 选择

"2" 搜索灵感，输入关键词即可。

5. 数据保存在

"inspirations.db" 中，可随时查看。

6. 核心知识点卡片

知识点说明

"speech_recognition" Google 语音识别 API 封装，支持多语言

SQLite 轻量级嵌入式数据库，适合本地存储

字符串处理

"lower()"、

"in" 用于分类匹配

模块化设计将功能拆分为独立模块，便于维护

CLI 交互

"input()" 和

"print()" 实现简单命令行界面

7. 总结

本项目结合了语音识别、自然语言处理（简单规则）、数据库存储和 CLI 交互，解决灵感记录与管理的痛点。

后续可扩展方向：

- 接入 NLP 模型做更智能的分类

- 增加 Web 界面（Flask/Django）

- 支持导出 Markdown/PDF

- 云同步（如 Firebase）

如果你需要，还可以生成一个可执行的可视化桌面版（PyQt/Tkinter），让语音录入更直观。

利用AI高效解决实际问题，如果你觉得这个工具好用，欢迎关注我！

查看全文

http://www.jsqmd.com/news/277820/

verl与传统RL框架对比：数据流灵活性与部署效率评测

Docker容器清理陷阱避坑指南（批量操作命令实测推荐）

Cursor Free VIP终极破解指南：快速解锁完整AI编程助手功能

Cursor AI编程助手功能解锁与配置优化指南

Axure RP中文界面快速配置指南：告别英文困扰，享受中文操作

青龙自动化脚本库：5大实用功能助你轻松实现日常任务自动化

Cursor AI专业版功能解锁全攻略：从基础配置到高级权限获取

Cursor Free VIP终极指南：完全免费解锁AI编程助手高级功能

Gopher360：用手柄玩转电脑的5个超实用技巧

免疫球蛋白Lambda轻链的检测在浆细胞疾病诊断与鉴别中有何临床价值？

精准分选，驱动探索：揭秘小鼠肿瘤CD8⁺ T细胞磁珠分选

MGeo镜像部署后无法运行？常见报错排查与修复步骤详解

Policy Plus：Windows全版本组策略管理完全解决方案

高效UEFI启动管理完全指南：从新手到专家的终极解决方案

CD3ε抗体如何成为解析T细胞激活与调控的核心工具？

科哥版Z-Image-Turbo WebUI，比官方API好用太多

基于PHP、asp.net、java、Springboot、SSM、vue3的垃圾分类管理系统的设计与实现

Qwen3-Embedding-0.6B GPU利用率低？算力优化完整解决方案

Parquet Viewer：浏览器中的列式数据探索利器

基于PHP、asp.net、java、Springboot、SSM、vue3的基于Android的仓库管理APP的设计与实现

揭秘Docker镜像导出导入全过程：5个你必须避开的坑

3步解锁惠普游戏本隐藏性能：开源控制工具完全指南

【DevOps工程师必备技能】：快速批量停止并删除Docker容器的黄金命令

ViPER4Windows音频增强在Win10/11的完美解决方案

开发者必看：Live Avatar CLI模式参数自定义配置指南

Docker常用命令一网打尽：高效运维必备清单（含可复制PDF下载）

全面掌握WebDAV客户端工具：从入门到精通实战指南

充电桩安全新突破：B型漏电检测技术如何守护电动汽车充电安全？

小白也能懂的YOLOv12：官方镜像快速上手指南

YOLOv12官版镜像训练600轮后效果怎么样？实测报告

相关文章：