当前位置: 首页 > news >正文

魔改豆包输入法变电脑版,立即拥有千元AI语音输入法typeless平替

哈喽大家好,我是阿星👋

最近在用一款语音输入工具Typeless,体验确实不错——按住一个键说话,松开后自动插入,完全不打断思路。但有个问题:每个月要 84 块钱……

所以……我自己用豆包客户端的AI语音输入功能魔改了个平替,效果看大屏幕👇:

因为用了一段豆包手机输入法我就爱上了,苦于电脑不能用啊,我就在想:

1、虽然它手机版app不能电脑上用,但是豆包pc客户端有个语音输入功能啊~

2、虽然它pc端用起来中断感比较明显,每次说完话都要按enter,搞得没有用typeless时那种指挥飞机塔台的感觉。

3、虽然总是说完话覆盖我的剪贴板,这个我真的好想打人

但是我有AI啊!于是我花了2小时,用豆包做了平替——和typeless一样,按住就说,松开就写入输入框,且不会冲掉原先剪贴板内容。

核心原理(100字看懂,看不懂也无所谓)

豆包自带的语音输入需要Ctrl+D 唤醒 → 说话 → 手动按 Enter 插入。我的工具通过 Python 监听你的右侧 Command 键,当你按住时自动触发豆包的 Ctrl+D,松开时自动隐形地按 Enter 完成插入。同时在触发前保存你的剪贴板,插入后立即恢复,避免豆包的识别结果覆盖你复制的内容。

本质是把豆包的三步操作,变成按住说话一步完成。


成本对比:一年省1000

其实阿星也想过自己写个AI输入法,但豆包已经免费提供了语音识别能力。

那我只需要写个插件,让它更好用就差不多了。我自己感觉没必要重头再来。


如何使用?(3分钟上手)

第1步:配置豆包(一劳永逸)

  1. 1. 打开豆包电脑版应用,别找错了,是豆包电脑客户端app。就你平常用的豆包网页版的左下角。

  2. 然后→ 设置 → 快捷键

2. 将"语音输入"设为Control + D

(为了避免自定义快捷键冲突先固定了)

3.建议关闭语音悬浮球(虽然不是必须的,但是容易误触,无伤大雅)确认改好了,保存

第2步:下载并打开应用(1分钟)

1. 下载阿星AI输入-v2.0-macOS-final.zip(20 MB)

2.解压得到:阿星AI输入.app,就第二个icon

3.首次打开:右键点击 → 打开(macOS 安全限制)

4.授予权限(必须!):系统会要求授予「辅助功能」权限

- 打开系统设置 → 隐私与安全性 → 辅助功能

  • • 点击 ➕ 添加「阿星AI输入.app」

  • • 确保勾选已启用

5.浏览器自动打开,显示控制界面(http://localhost:8899)

  • • 启动时间:首次 5-10 秒,后续 3-5 秒

首次启动可能比较慢

第3步:启动语音输入(1分钟)

在浏览器中:点击🚀 启动语音输入,看到日志显示「✓ 语音输入已启动!」后,就可以使用了

第4步:开始使用

  1. 1. 在任何输入框里(浏览器、编辑器、微信...)

  2. 2. 按住 右侧 Command 键说话

就这么简单!


核心功能详解

功能1:自动插入(对标 Type Less)

豆包原生流程稍微顿感了

Ctrl+D → 说话 → 看预览框 → 手动按 Enter → 插入

我的工具给它修补下体感

按住 Command → 说话 → 松开 → 自动 Enter → 插入

这就是 Typeless值 80 元/月的丝滑输入体验啊。现在免费用了。

功能2:剪贴板保护

问题场景

1. 你复制了一段代码 2. 用语音输入了一句话 3. 豆包把识别结果复制到剪贴板 4. 你去粘贴 → 粘贴出来的是语音文字,不是代码 5. 代码没了

我的解决方案

按下 Command → 保存你的剪贴板 → 触发豆包语音 → 豆包识别并复制 → 松开 Command → 自动插入 → 0.2秒内恢复你的剪贴板

你去粘贴,粘贴出来的还是你复制的。完美!

功能3:Web GUI 界面)

在 Web 控制界面(http://localhost:8899):

主界面功能

- 🚀启动/停止:一键控制语音输入

- 📋实时日志:查看运行状态和诊断信息

- ⚙️打开配置:点击按钮进入配置页面

配置界面:滑块调整冷启动/正常延迟时间

不用改代码,不用命令行,和 Type Less 一样小白友好。


三大核心技术原理

1. 全局键盘监听(pynput + macOS CGEventTap)

为什么没用 Electron?

虽然 Electron 稳定,但它太“重”了——哪怕一个简单的功能也要背着几百 MB 的浏览器内核。先选了 macOS 原生打包。

  1. 1.选择 Onedir:告别“发呆”启动

  • Onefile (弃用):本质是压缩包,每次启动需 10 秒解压,慢得像死机。

  • Onedir (选用):直接加载已解压库,实现.app 秒开

  1. 2.通过AppDelegate架构实现了与系统的“握手”。在系统反馈“已就绪” (DidFinishLaunching) 的瞬间挂载 RunLoop。

Onedir (秒开) + AppDelegate (官方权限挂载),绕开了 Electron 的臃肿,解决了原生打包的权限魔咒。

2. 剪贴板保护(pbpaste/pbcopy)

豆包自己的的语音识别会把结果复制到剪贴板,然后用系统快捷键(Cmd+V)自动粘贴。这会覆盖用户原有的剪贴板内容。

所以我通过脚本改成了预存的方式

  1. 1. 按下 Command 键 → 用pbpaste保存当前剪贴板

  2. 2. 触发豆包语音识别(Ctrl+D)

  3. 3. 等待识别完成(冷启动 3.5 秒,热启动 1.5 秒)

  4. 4. 松开 Command 键 → 按 Enter 插入文字

  5. 5. 等待0.2 秒(让豆包完成自动复制)

  6. 6. 用pbcopy恢复用户原剪贴板

豆包的自动复制在 Enter 后立即发生,但我们在 0.2 秒后强制恢复,这个时间差足够让插入完成,又不会让用户察觉到剪贴板被篡改过。

3. 智能延迟(冷启动 vs 热启动)

如果你说完了结果工具的等待时间不够,按 Enter 时豆包还没识别完,结果就是空白或不完整。

改进 :豆包第一次启动语音识别需要初始化 AI 模型,耗时较长(约 3.5 秒)。后续识别时模型已在内存中,速度更快(约 1.5 秒)。用户可在 Web 界面通过滑块自定义这些延迟时间

    ok。我已经打包成 .app 文件,放到星球上了,双击即用

    我是阿星

    更多AI应用

    我们下期再见!

    http://www.jsqmd.com/news/235923/

    相关文章:

  • 单精度浮点数转换小白指南:轻松上手第一步
  • 医药电商数字化转型:以合规与效率筑牢发展根基
  • I2C时序初学者指南:认识标准模式下的通信节奏
  • 系统学习framebuffer设备在控制台切换中的作用机制
  • 不同比例画面适配LED显示屏尺寸大小调整技巧
  • Packet Tracer使用教程:新手避坑常见操作误区
  • CC2530射频调试工具使用:频谱仪与网络分析仪操作指南
  • 基于Java+SpringBoot+SSM宠物领养一站式服务系统(源码+LW+调试文档+讲解等)/宠物领养平台/宠物领养服务/一站式宠物服务/宠物领养系统/宠物服务平台/领养宠物一站式服务
  • vivado2018.3安装步骤通俗解释:新手快速上手教程
  • ModbusRTU功能码解析:常用0x03与0x10指令实战案例
  • elasticsearch官网API详解:企业集成开发实战案例
  • 基于Java+SpringBoot+SSM就业推荐系统(源码+LW+调试文档+讲解等)/就业推荐平台/职业推荐系统/招聘推荐系统/就业匹配系统/求职推荐系统/就业指导系统/人才推荐系统
  • 基于Java+SpringBoot+SSM忘忧传媒直播管理系统(源码+LW+调试文档+讲解等)/忘忧传媒直播管理平台/忘忧传媒直播系统/传媒直播管理系统/忘忧传媒直播解决方案/忘忧传媒直播工具
  • ES集群容量规划方法论:新手教程(零基础入门)
  • 手把手教你使用Proteus 8.9继电器元件对照表进行仿真
  • 上传图片数量限制
  • mysql数据快速导入doris
  • Multisim示波器使用:提升教学直观性的实践方法
  • 利用Multisim验证克拉泼振荡电路起振条件的详细过程
  • 快速理解AUTOSAR中BSW与SWC的关系
  • 【零基础学java】(等待唤醒机制,线程池补充)
  • 自动资源调度AI工具:架构师降低云成本的8个使用技巧
  • AI应用架构师如何解决社会学研究模型训练问题?这6款工具帮你
  • L298N电机驱动原理图常见问题排查:智能小车专用解析
  • 【零基础学java】(网络编程)
  • 被生活投喂的小确幸,藏不住啦~​
  • 大数据领域 Hadoop 安全机制深度剖析
  • 【2025最新】基于SpringBoot+Vue的智能物流管理系统管理系统源码+MyBatis+MySQL
  • 豪威集团港股上市:募资48亿港元 市值1529亿港元 虞仁荣再敲钟 身价超400亿
  • Keil5显示中文异常?快速理解文件编码匹配原理