当前位置：首页 > news >正文

OpenClaw学习助手搭建：Qwen3.5-9B自动整理课程截图笔记

news 2026/6/11 6:23:49

OpenClaw学习助手搭建：Qwen3.5-9B自动整理课程截图笔记

1. 为什么需要自动化笔记整理

作为一名经常需要在线学习的开发者，我长期被一个问题困扰：课程视频中的关键知识点截图，总是散落在桌面或下载文件夹里。手动整理这些截图需要耗费大量时间——重命名、分类、添加文字说明，最后还要制作成Anki卡片辅助记忆。整个过程枯燥重复，但又是学习闭环中不可或缺的环节。

直到发现OpenClaw可以搭配Qwen3.5-9B这类多模态模型，我才意识到这个痛点完全可以用自动化方案解决。通过配置一个监听文件夹，让AI自动分析截图内容、提取关键信息、生成结构化笔记，甚至直接输出Anki可导入的格式。这不仅能节省每天30分钟的手动操作时间，更重要的是避免了"存了截图却再也没看过"的知识浪费。

2. 技术方案选型与准备

2.1 为什么选择OpenClaw+Qwen3.5组合

在测试了多种方案后，我最终锁定OpenClaw框架有三个决定性原因：

本地化处理：所有截图和课程内容都留在本机，避免敏感学习资料上传第三方服务的隐私风险
多模态支持：Qwen3.5-9B是目前少数能较好理解中文图片内容的开源模型，且4bit量化版本在消费级显卡上即可运行
灵活的技能扩展：通过OpenClaw的Skill机制，可以自由组合截图监听、文本生成、格式转换等模块

硬件配置方面，我的MacBook Pro（M1 Pro芯片/16GB内存）完全能满足需求。如果使用Windows设备，建议至少配备NVIDIA 3060及以上显卡。

2.2 基础环境搭建

首先通过Docker快速部署Qwen3.5-9B-AWQ-4bit镜像：

docker pull registry.cn-hangzhou.aliyuncs.com/qingchen/qwen:3.5-9b-awq-4bit docker run -d -p 8000:8000 --gpus all registry.cn-hangzhou.aliyuncs.com/qingchen/qwen:3.5-9b-awq-4bit

接着安装OpenClaw核心框架（macOS示例）：

curl -fsSL https://openclaw.ai/install.sh | bash openclaw onboard --install-daemon

在配置向导中选择：

Mode: Advanced
Provider: Custom
Model URL: http://localhost:8000/v1
启用File Watcher和OCR插件

3. 核心功能实现细节

3.1 建立自动化监听管道

在~/.openclaw/config/skills目录下新建note_helper文件夹，创建配置文件config.json：

{ "watch_folders": [ { "path": "~/Downloads/lecture_screenshots", "actions": [ { "trigger": "*.png", "handler": "qwen_analyze", "params": { "prompt": "这是课程视频截图，请提取：1.核心概念名词 2.关键公式/代码 3.讲师强调要点。用Markdown格式输出，包含###标题和分类标签" } } ] } ] }

这个配置实现了：

监控~/Downloads/lecture_screenshots目录
当发现PNG文件时，自动调用Qwen3.5进行内容分析
使用定制化的提示词引导模型输出结构化内容

3.2 解决图文混排的格式难题

初期测试发现，直接让模型输出的Markdown在Anki中经常出现排版错乱。通过分析发现两个关键问题：

模型生成的图片描述文本过长，超出Anki卡片合理范围
代码块和公式的转换存在兼容性问题

解决方案是在Skill中添加后处理脚本post_process.py：

def process_markdown(content): # 拆分过长的段落 content = re.sub(r'(.{50,}?)([，。；]|$)', r'\1\n\2', content) # 转换代码块为Anki兼容格式 content = content.replace('```python', '<pre><code class="language-python">') content = content.replace('```', '</code></pre>') # 简化图片描述 content = re.sub(r'(!\[.*?\])\(.*?\)', r'[图片]', content) return content

3.3 生成Anki可导入文件

最终输出阶段，我们通过OpenClaw的插件系统将Markdown转换为Anki包：

openclaw plugins install @m1heng-clawd/anki-generator

然后在技能配置中添加输出处理器：

{ "output_handlers": [ { "type": "anki", "template": "basic_backfront", "output_path": "~/anki_import/{{timestamp}}.apkg" } ] }

4. 实际效果与优化经验

4.1 典型工作流示例

当我观看机器学习课程时，操作流程简化为：

按Cmd+Shift+4截取重要知识点画面
将截图拖入指定监控文件夹
2-3分钟后，在Anki中即可看到生成的记忆卡片

一张实际生成的卡片内容示例：

Front: 什么是梯度消失问题？ Back: - 现象：深层网络中梯度逐层减小直至消失 - 原因：激活函数导数<1时的连乘效应 - 解决方案：ReLU激活函数、残差连接、批归一化 [相关图片已嵌入]

4.2 过程中遇到的三个关键问题

模型响应不稳定：
- 现象：相同截图有时输出详细分析，有时只有简单描述
- 解决：在提示词中明确要求"必须包含以下3个要素"，并设置temperature=0.3
文件冲突问题：
- 现象：快速连续放入多张截图时会发生处理遗漏
- 解决：在Skill中添加文件锁机制，确保每个文件完整处理
中文OCR准确率：
- 现象：截图中的手写公式识别错误率高
- 解决：组合使用Qwen3.5的视觉理解+本地PaddleOCR专项处理文字区域