当前位置：首页 > news >正文

AI赋能Anki：基于LLM与Prompt工程的智能制卡技能全解析

news 2026/5/16 20:28:52

1. 项目概述：当Anki遇上AI，一个卡片技能的革命

如果你和我一样，是个重度Anki用户，那你一定经历过这样的时刻：面对一本厚厚的教科书，或者一篇几十页的论文，想要把里面的核心知识点做成记忆卡片，光是复制、粘贴、整理、编辑，就要耗费大半天的时间。Anki的核心是“间隔重复”，它让我们记忆更高效，但制作卡片的过程本身，却常常是低效且痛苦的。这就是我最初发现“gong1414/anki-card-skill”这个项目时，感到眼前一亮的原因。它不是一个简单的插件，而是一个旨在用AI技术彻底革新Anki卡片制作流程的“技能”集合。

简单来说，这个项目通过集成大型语言模型（LLM），将我们从繁琐的手工制卡中解放出来。你只需要提供一段文本——可以是一段笔记、一篇文章的摘要，甚至是一个网页链接——它就能自动为你生成结构清晰、内容准确的Anki卡片。这不仅仅是“自动化”，更是“智能化”。它理解文本的上下文，能识别关键概念、定义、因果关系，并按照Anki卡片的最佳实践（如一问一答、填空、选择题）来组织内容。对于学生、研究者、终身学习者，尤其是需要处理大量外语或专业文献的人来说，这无疑是一个生产力倍增器。

这个项目的核心价值在于，它精准地击中了Anki生态中的一个长期痛点：输入瓶颈。我们花在“记忆”上的时间，远少于花在“准备记忆材料”上的时间。而“anki-card-skill”试图翻转这个比例，让我们能更专注于学习本身，而非学习前的准备工作。接下来，我将深入拆解这个项目的设计思路、技术实现、实操方法以及我踩过的一些坑，希望能为你高效利用这个工具提供一份详尽的指南。

2. 核心架构与设计思路拆解

2.1 从“工具”到“技能”的范式转变

传统的Anki插件，无论是用于批量导入、调整样式还是管理卡片，大多是在Anki的既有框架内做功能增强。它们处理的是结构化的数据或执行预设的规则。而“anki-card-skill”的不同之处在于，它引入了一个非确定性的、基于理解的核心——大型语言模型。这使其从一个“工具”演变为一个“技能”。

技能（Skill）在这里的定义是：一种能够理解用户意图、处理非结构化输入（自然语言文本），并生成符合特定领域（Anki卡片）规范的结构化输出的能力。项目的设计思路正是围绕这一核心展开：

输入抽象层：项目需要处理多样化的输入源。可能是你复制的一段纯文本，可能是一个包含复杂格式的网页，也可能是一个PDF文件。设计的第一步就是将这些异构输入归一化为LLM能够处理的干净文本。这通常涉及到HTML标签清理、无关导航栏和页脚的剔除、编码转换等预处理步骤。
LLM任务编排层：这是项目的大脑。收到净化后的文本后，它并非简单地将全文塞给LLM并说“生成卡片”。一个优秀的技能需要执行一系列精细的子任务：
- 文本分割与上下文管理：长文本需要被智能地分割成适合LLM处理的片段（通常受限于模型的上下文窗口，如4096或8192个token），同时要保证分割点不会切断一个完整的语义单元（如一个定义、一个论点）。
- 信息提取与结构化：指令（Prompt）被精心设计，引导LLM从文本中识别出“事实”、“概念”、“过程”、“对比”等不同类型的知识单元。
- 卡片模板适配：项目需要决定生成的卡片采用何种形式。是基本的问答卡（正面问题，背面答案）？还是填空卡（Cloze Deletion）？或是包含选项的选择题？不同的知识类型适配不同的卡片模板，这需要逻辑判断。
Anki集成输出层：将LLM生成的结构化数据（卡片正面、背面内容，可能还有标签、卡片类型等元数据）通过Anki Connect（一个允许外部程序与Anki通信的API）或直接操作.apkg文件的方式，批量创建到用户的Anki牌组中。

这个架构的关键在于Prompt工程的质量。Prompt是引导LLM行为的“咒语”。一个糟糕的Prompt可能让LLM生成冗长、包含无关信息甚至错误的卡片。而一个优秀的Prompt，就像一位经验丰富的助教，知道如何从材料中提炼考点，并以最适合记忆的形式呈现出来。

2.2 技术栈选型与权衡

项目作者“gong1414”选择的技术栈，反映了其对效率、可控性和用户体验的考量。

后端/处理核心：项目很可能基于Python构建。Python在自然语言处理（NLP）生态中拥有绝对优势，丰富的库（如requests用于网络请求，beautifulsoup4或lxml用于HTML解析，pypdf2或pdfplumber用于PDF解析）能轻松处理输入抽象层的各种脏活累活。
LLM接入：这是核心中的核心。选项无非是使用云端API（如OpenAI的GPT系列、Anthropic的Claude）或本地部署的开源模型（如Llama 3、Qwen、DeepSeek）。
- 云端API（如OpenAI）：优势是开箱即用，模型能力强（特别是推理和遵循复杂指令方面），响应速度快，无需担心硬件。劣势是持续产生费用，且有数据隐私考量（虽然主流API提供商有不将数据用于训练的政策），对网络有依赖。
- 本地模型：优势是数据完全私有，一次部署后无持续成本，可离线使用。劣势是对硬件（尤其是GPU显存）要求高，模型性能（特别是较小参数量的模型）在复杂任务上可能不及顶级云端模型，需要一定的运维知识。项目的具体选择，会直接影响用户的部署复杂度和使用成本。一个成熟的技能项目可能会提供配置选项，让用户自行选择后端。
与Anki的通信：Anki Connect几乎是唯一优雅的选择。它是一个Anki插件，在Anki内部启动一个HTTP服务器。外部程序（如我们的Python脚本）可以通过发送JSON-RPC请求来执行几乎所有操作：获取牌组列表、查找笔记、添加笔记、更改卡片调度等。这种方式干净、可靠，且与平台（Windows/macOS/Linux）无关。另一种直接写.apkg（Anki包文件）的方式更底层，但复杂且易出错，通常只用于大规模初始导入。
用户界面（UI）：作为一个“技能”，其UI可能相对轻量。可能是：
- 浏览器插件：最无缝的体验。选中网页文本，右键点击“生成Anki卡片”，卡片就直接飞入指定牌组。
- 桌面小工具：一个常驻系统托盘的小程序，可以粘贴文本、拖入文件来生成卡片。
- 命令行工具：对于开发者或喜欢自动化工作流的用户，CLI工具最为灵活，可以轻松集成到其他脚本中。项目的形态决定了其易用性。一个优秀的技能应该追求“最小化用户操作”，让制卡动作融入现有的阅读和工作流，而非打开另一个复杂的软件。

3. 核心细节解析与实操要点

3.1 Prompt工程：教会AI如何当好“出题老师”

这是整个项目技术含量最高，也最值得细说的部分。LLM很强大，但若指令不清，它可能会把一整段原文当作答案，或者生成一些似是而非的“概括”。我们的目标是让它成为一个严谨的“出题老师”。

一个有效的制卡Prompt通常包含以下几个部分：

角色设定：“你是一位专业的课程设计专家，擅长从学术材料中提取关键知识点，并将其转化为有效的记忆卡片。”
任务定义：“请仔细阅读以下文本，识别其中最重要的概念、事实、术语定义、因果关系和过程步骤。”

输出格式规范（这是关键）：必须给出清晰、结构化、甚至带示例的格式要求。

请为每个识别的知识点生成一张卡片，以JSON格式输出一个列表。每张卡片包含以下字段： { “front”: “卡片正面问题。问题应具体、清晰，最好能触发主动回忆。例如：‘光合作用的光反应阶段发生在叶绿体的什么部位？’ 避免使用‘什么是...’这种过于宽泛的开头，除非是针对核心定义。”, “back”: “卡片背面答案。答案应准确、简洁，直接回应正面问题。可以包含关键要点，但不宜过长。”, “tags”: [“与知识点相关的标签，如‘生物学’，‘细胞呼吸’”， “最多3个”], “card_type”: “卡片类型，可选 ‘basic’ (问答卡) 或 ‘cloze’ (填空卡)。对于需要记忆精确术语或步骤顺序的，建议用填空卡。” }

质量要求与禁忌：
- “不要生成文本中不存在的信息。”
- “避免将多个无关知识点合并到一张卡片中（即‘一问多答’）。”
- “对于复杂过程，考虑将其分解为2-3张顺序卡片。”
- “优先为专业术语、数字、日期、因果关系、差异对比创建卡片。”

在实际操作中，你可能需要针对不同类型的阅读材料（如教科书、研究论文、新闻文章）微调Prompt。例如，论文的Prompt可能更强调“研究问题”、“方法论”、“核心结论”和“局限性”；而语言学习材料的Prompt则可能侧重于“短语搭配”、“例句”和“语法点”。

实操心得：不要指望一个万能Prompt。最好的方法是准备几个“模板Prompt”，针对材料类型进行切换。初期可以生成少量卡片进行质量抽查，根据LLM的“犯错”模式（比如总是生成过于宽泛的问题）来迭代优化你的Prompt。把Prompt本身也当作一个需要调试的“程序”。

3.2 文本预处理：给AI喂“干净”的食粮

“垃圾进，垃圾出。” 如果扔给LLM的是布满广告、导航栏、脚本代码的混乱HTML，它的性能会大打折扣，甚至可能被无关信息干扰。

预处理流水线通常包括：

HTML净化：使用BeautifulSoup库，只保留主要的文章内容标签（如<article>,<p>,<h1>-<h6>），剔除<script>,<style>,<nav>,<footer>,<aside>以及所有内联样式和事件属性。目标是提取出纯语义内容。
格式标准化：将多个连续的空格、换行符压缩为合理的格式。确保标点符号使用一致。
智能分段：根据句子边界、标题层级或固定的token长度（如每800个token一段）进行分段。更高级的方法可以使用语义分割模型，确保段落意思完整。分段时最好保留少量重叠（如50个token），防止知识点被割裂。
元数据提取：尝试从<title>,<meta>标签或特定CSS类中提取文章标题、作者等信息，这些可以作为默认的牌组名或卡片标签。

对于PDF文件，挑战更大。除了提取文本，还要处理分栏、页眉页脚、图表（通常文本提取会丢失）。pdfplumber库在保留文本位置信息方面做得较好，有助于进行简单的版面分析。

注意事项：预处理不是越彻底越好。有些格式信息（如加粗、斜体）可能本身就有强调意义，可以考虑将其转换为Markdown语法（**加粗**、*斜体*）保留在文本中，为LLM提供额外线索。关键是找到平衡点。

3.3 与Anki Connect的集成：稳定交付的最后一公里

生成了一堆完美的卡片JSON数据后，如何稳妥地送进Anki？Anki Connect是这个桥梁。

基本工作流程如下：

确保Anki Connect运行：在Anki中安装好Anki Connect插件，并保持Anki程序处于打开状态。Anki Connect默认在http://localhost:8765提供服务。
构建请求：你需要按照Anki Connect的API格式发送HTTP POST请求。核心操作是addNotes（添加笔记）。
构造笔记数据：Anki中的一条“笔记”可以对应多张“卡片”（比如一张正向卡，一张反向卡）。你需要指定：
- deckName：牌组名称。如果不存在，Anki会自动创建。
- modelName：笔记类型，如“Basic”、“Cloze”、“Basic (and reversed card)”。这必须与你Anki里已有的类型名称完全一致。
- fields：一个字典，对应笔记类型定义的各个字段。例如，Basic类型通常有Front和Back字段。
- tags：卡片标签列表。
错误处理与去重：网络请求可能失败，Anki可能未启动。代码中必须有重试机制和友好的错误提示。更重要的是去重：在添加前，可以先调用findNotesAPI，根据卡片正面内容查询是否已存在相同卡片，避免重复添加。

# 一个简化的Python示例 import requests import json def add_card_to_anki(front, back, deck="Default", tags=None): if tags is None: tags = [] # 构造Anki Connect请求 payload = { "action": "addNote", "version": 6, "params": { "note": { "deckName": deck, "modelName": "Basic", "fields": { "Front": front, "Back": back }, "tags": tags } } } try: response = requests.post('http://localhost:8765', json=payload) result = response.json() if result.get('error'): print(f"添加卡片失败: {result['error']}") return False else: print(f"卡片添加成功，ID: {result['result']}") return True except requests.exceptions.ConnectionError: print("错误：无法连接到Anki Connect。请确保Anki已启动且Anki Connect插件已安装。") return False

踩坑记录：最大的坑是字段名不匹配。如果你在Anki里自定义了笔记类型，字段名（如Front、Back）必须完全一致，包括大小写。另一个常见问题是并发请求过快，导致Anki卡顿或丢失请求。建议在批量添加时，在请求间加入少量延迟（如0.1秒）。

4. 实操过程与核心环节实现

假设我们现在要基于一个Python脚本的雏形，实现一个最简单的命令行版“anki-card-skill”。我们将使用OpenAI API作为LLM后端。

4.1 环境准备与依赖安装

首先，创建一个新的项目目录并设置虚拟环境是良好的实践。

mkdir anki-card-skill-cli && cd anki-card-skill-cli python -m venv venv # Windows: venv\Scripts\activate # macOS/Linux: source venv/bin/activate

安装核心依赖：

pip install openai requests beautifulsoup4

openai: OpenAI官方库，用于调用GPT API。
requests: 用于发送HTTP请求（与Anki Connect通信）。
beautifulsoup4: 用于HTML解析和清理。

你还需要一个OpenAI API密钥。请妥善保管，不要将其硬编码在脚本中或上传到公开仓库。

4.2 构建核心脚本框架

我们创建一个名为ankicard.py的主脚本。其逻辑流程如下：

读取输入（文件路径或直接文本）。
预处理输入（如果是URL则抓取并清理，如果是文件则读取）。
将处理后的文本分割成合适大小的块。
为每个文本块调用LLM，生成卡片JSON。
解析LLM返回的JSON，并通过Anki Connect添加到Anki。

以下是核心代码结构的示意：

import sys import json import openai from bs4 import BeautifulSoup import requests from typing import List, Dict import time # 配置 OPENAI_API_KEY = "你的API密钥" # 强烈建议从环境变量读取 OPENAI_MODEL = "gpt-3.5-turbo" # 或 "gpt-4" ANKI_CONNECT_URL = "http://localhost:8765" client = openai.OpenAI(api_key=OPENAI_API_KEY) def clean_html(html_content: str) -> str: """从HTML中提取纯净文本""" soup = BeautifulSoup(html_content, 'html.parser') # 移除脚本、样式等标签 for element in soup(["script", "style", "nav", "footer", "aside"]): element.decompose() # 获取文本并简单清理 text = soup.get_text(separator='\n') lines = (line.strip() for line in text.splitlines()) chunks = (phrase.strip() for line in lines for phrase in line.split(" ")) return '\n'.join(chunk for chunk in chunks if chunk) def split_text(text: str, max_tokens=2000) -> List[str]: """将长文本分割成适合LLM处理的块。这里按简单换行分段，实际可更复杂。""" paragraphs = text.split('\n') chunks = [] current_chunk = [] current_length = 0 for para in paragraphs: para_length = len(para) // 4 # 粗略估算token数 if current_length + para_length > max_tokens and current_chunk: chunks.append('\n'.join(current_chunk)) current_chunk = [para] current_length = para_length else: current_chunk.append(para) current_length += para_length if current_chunk: chunks.append('\n'.join(current_chunk)) return chunks def generate_cards_with_llm(text_chunk: str) -> List[Dict]: """调用LLM API生成卡片数据""" prompt = f""" 你是一个专业的助教，请将以下学习材料转化为高效、准确的Anki记忆卡片。 材料： {text_chunk} 请遵循以下规则生成卡片： 1. 只基于提供的材料，不添加外部知识。 2. 聚焦于核心概念、术语定义、关键事实、数字、因果关系、过程步骤和重要对比。 3. 每张卡片必须对应一个独立、明确的知识点。 4. 卡片正面（问题）应具体，能触发主动回忆。例如：“二战转折点战役是哪场？”而不是“关于二战”。 5. 卡片背面（答案）应简洁、准确。 6. 为每张卡片添加1-3个相关标签。 7. 输出格式必须是严格的JSON列表，每个元素是一个卡片对象，包含字段：`front`（字符串），`back`（字符串），`tags`（字符串列表）。 现在，请输出JSON： """ try: response = client.chat.completions.create( model=OPENAI_MODEL, messages=[{"role": "user", "content": prompt}], temperature=0.3, # 较低的温度使输出更确定、更专注 ) # 尝试从响应中解析JSON content = response.choices[0].message.content.strip() # 有时LLM会在JSON外包裹markdown代码块，需要处理 if content.startswith('```json'): content = content[7:] if content.endswith('```'): content = content[:-3] cards_data = json.loads(content) return cards_data except json.JSONDecodeError as e: print(f"LLM返回了非JSON内容，解析失败: {e}") print(f"返回内容:\n{content}") return [] except Exception as e: print(f"调用LLM API时发生错误: {e}") return [] def add_cards_to_anki(cards: List[Dict], deck_name: str = "AI-Generated"): """通过Anki Connect添加卡片""" for card in cards: note = { "deckName": deck_name, "modelName": "Basic", "fields": { "Front": card.get("front", ""), "Back": card.get("back", "") }, "tags": card.get("tags", []) } payload = { "action": "addNote", "version": 6, "params": {"note": note} } try: resp = requests.post(ANKI_CONNECT_URL, json=payload, timeout=10) result = resp.json() if result.get('error'): print(f"添加卡片失败 (Front: {note['fields']['Front'][:50]}...): {result['error']}") else: print(f"✓ 卡片已添加: {note['fields']['Front'][:50]}...") except requests.exceptions.ConnectionError: print("错误：无法连接到Anki Connect。请启动Anki并确保Anki Connect插件已启用。") sys.exit(1) except Exception as e: print(f"网络请求异常: {e}") time.sleep(0.1) # 避免请求过快 def main(): # 这里可以扩展为从命令行参数、文件或剪贴板读取输入 input_text = """ 光合作用是植物、藻类和某些细菌利用光能将二氧化碳和水转化为有机物（如葡萄糖）并释放氧气的过程。 它分为光反应和暗反应两个阶段。光反应发生在叶绿体的类囊体薄膜上，需要光，其产物是ATP和NADPH。暗反应（卡尔文循环）发生在叶绿体基质中，利用光反应产生的ATP和NADPH将二氧化碳固定为有机物。 """ print("开始处理文本并生成卡片...") # 1. 文本分割 (本例文本短，无需分割) chunks = split_text(input_text) all_cards = [] for i, chunk in enumerate(chunks): print(f"正在处理第 {i+1}/{len(chunks)} 个文本块...") cards = generate_cards_with_llm(chunk) all_cards.extend(cards) print(f"共生成 {len(all_cards)} 张卡片。") if all_cards: deck = input("请输入要添加到的牌组名称 (回车使用默认'AIGenerated'): ").strip() or "AIGenerated" add_cards_to_anki(all_cards, deck) print("处理完成！请打开Anki查看。") else: print("未生成任何卡片。") if __name__ == "__main__": main()

这个脚本提供了一个最基础的骨架。你可以通过命令行参数让它接受文件路径或URL，并增加更健壮的文本分割、错误处理和日志功能。

4.3 从脚本到“技能”：构建用户友好的接口

要让这个工具从开发者脚本变成大众可用的“技能”，下一步是封装用户界面。

方案一：浏览器插件（最实用）这是最无缝的体验。以Chrome扩展为例，其核心是一个content script，它可以访问当前页面的DOM。用户选中文本后，右键菜单触发插件，插件将选中的文本（或整个页面净化后的文本）发送到你的后端服务（可以是本地运行的Python服务，也可以是配置了API密钥的云函数），后端调用LLM并返回卡片数据，再通过注入页面的JavaScript调用Anki Connect（需要Anki Connect允许来自浏览器扩展的跨域请求，这需要额外配置），完成添加。

方案二：本地桌面小工具（最私有）使用PyQt、Tkinter或Electron构建一个简单的桌面应用。提供一个文本框用于粘贴文本，一个文件选择器，以及几个配置选项（如牌组名、模型选择、API密钥设置）。所有处理都在本地完成，数据不出电脑，隐私性最强。

方案三：命令行工具增强版对于程序员群体，一个功能强大的CLI工具可能就够了。使用像argparse或click这样的库，提供丰富的子命令和选项：

ankicard url https://en.wikipedia.org/wiki/Photosynthesis --deck Biology --model Cloze ankicard file chapter1.pdf --deck "Physics 101" ankicard text "康德三大批判是..." --deck Philosophy

同时，CLI工具可以支持配置文件来存储默认的API密钥、首选牌组等设置。

5. 常见问题与排查技巧实录

在实际使用和开发这类工具的过程中，你会遇到各种各样的问题。以下是我总结的一些典型场景和解决方案。

5.1 卡片质量问题：LLM的“发挥失常”

问题1：卡片内容过于笼统或空洞。

现象：生成了大量像“什么是XX？”、“请描述YY”这样的宽泛问题，答案也是一大段原文复述。
根因：Prompt指令不够具体，没有强制LLM进行“知识点拆解”和“具体提问”。
解决：强化Prompt中的输出规范。提供反面例子和正面例子。例如：“避免生成像‘什么是光合作用？’这样的问题，因为它太宽泛。应该生成如‘光合作用的光反应阶段发生在细胞器的什么部位？’或‘光合作用中，水分子被分解后直接产生了什么产物？’这样的具体问题。”

问题2：LLM“捏造”了材料中没有的信息。

现象：卡片答案包含了原文未提及的细节或推论。
根因：LLM的“幻觉”特性。温度参数过高也可能导致创造性过强。
解决：
1. 在Prompt中反复强调“只基于提供的材料”、“不要添加任何外部知识”。
2. 降低API调用时的temperature参数（如设为0.1-0.3），让输出更确定性。
3. 在输出格式中要求LLM引用原文片段。例如，要求卡片对象增加一个source_excerpt字段，填写答案所依据的原文句子。这不仅能验证准确性，后期复习时也能快速定位原文。

问题3：一张卡片包含多个知识点。

现象：正面问题如“请简述光反应和暗反应的区别”，背面列出了五六条。
根因：LLM倾向于总结和归纳，而记忆卡片要求“一个卡片，一个知识点”。
解决：在Prompt中明确要求“每张卡片必须只对应一个独立、原子化的知识点”。并举例说明复杂概念应如何拆分：“对于‘光反应与暗反应的区别’，应拆分为多张卡片，例如：‘光反应的场所是？’、‘暗反应的场所是？’、‘光反应的直接能量产物是什么？’、‘暗反应的能量来源是什么？’。”

5.2 技术集成问题：管道不通

问题4：Anki Connect连接失败。

现象：脚本报错ConnectionError。
排查：
1. Anki是否打开？Anki Connect只在Anki运行时才生效。
2. 插件是否安装并启用？在Anki中，点击“工具”->“插件”->“浏览并安装”，输入代码2055492159安装Anki Connect。安装后重启Anki。
3. 防火墙或安全软件是否拦截？确保本地回环地址127.0.0.1:8765没有被阻止。
4. 跨域问题（针对浏览器插件）：Anki Connect默认只接受来自127.0.0.1的请求。浏览器插件运行在不同的源。需要在Anki Connect插件配置中（如果有）或通过修改其源码来允许跨域，这涉及更复杂配置，通常不建议新手操作。可以考虑让浏览器插件将数据发送给一个本地运行的代理服务，再由代理服务转发给Anki Connect。

问题5：卡片添加成功，但在Anki中显示错乱或字段丢失。

现象：卡片出现了，但正面内容跑到了背面，或者标签没加上。
排查：
1. 字段名不匹配：这是最常见原因。通过Anki Connect的modelNames和modelFieldNamesAPI，动态获取你Anki中确切的笔记类型名称和字段名。不要硬编码“Front”和“Back”。
```
# 获取所有笔记类型 payload = {"action": "modelNames", "version": 6} resp = requests.post(ANKI_CONNECT_URL, json=payload) models = resp.json()['result'] print(f"可用笔记类型: {models}") # 获取某个类型的字段 payload = {"action": "modelFieldNames", "version": 6, "params": {"modelName": "Basic"}} resp = requests.post(ANKI_CONNECT_URL, json=payload) fields = resp.json()['result'] print(f"‘Basic’类型的字段: {fields}")
```
2. HTML/特殊字符转义：如果卡片内容包含HTML标签（如<br>）或Markdown，Anki可能会将其渲染或转义。确保传递给Anki Connect的字段内容是纯文本，或者是你期望的格式。必要时进行HTML实体编码。

问题6：处理长文档时API调用成本高或超时。

现象：一篇长论文导致API调用费用激增，或中间某段失败导致整个任务中断。
优化策略：
1. 更智能的文本分割：按章节、标题分割，而不是单纯按token数。这能保证语义完整性，有时还能减少不必要的API调用（因为有些章节可能不包含可制卡的知识点）。
2. 缓存与去重：对于相同的文本块，可以缓存LLM的响应结果，避免重复计费。
3. 异步与重试：使用异步请求并发处理多个文本块，并在失败时加入指数退避重试机制。
4. 使用更经济的模型：对于知识提取这种相对模式化的任务，gpt-3.5-turbo通常足够好且比gpt-4便宜一个数量级。可以先用小模型，对结果不满意再针对性地用大模型重处理部分内容。

5.3 成本与效率优化

问题7：如何控制API使用成本？

策略：
1. 设置预算和用量监控：在OpenAI后台设置使用量硬上限。
2. 预处理过滤：在调用LLM前，先用简单的规则或本地小模型过滤掉明显无意义的文本（如版权声明、参考文献列表）。
3. Prompt精简：优化你的Prompt，去掉不必要的叙述，让它更简洁直接。但要注意，不能以牺牲指令清晰度为代价。
4. 考虑本地模型：如果使用频率极高，长期来看，投资硬件本地部署一个7B-13B参数量的优秀开源模型（如Qwen1.5-7B-Chat, Llama 3 8B Instruct），可能是更经济的选择。虽然单次生成速度慢，但无持续费用。

问题8：生成的卡片需要大量后期编辑，并没有节省太多时间。

现象：AI生成的卡片有70%可用，但剩下的30%需要手动修正或删除，整体效率提升不明显。
解决：这提示你的Prompt和工作流需要优化。
1. 实施“审核-编辑”流程：不要追求100%全自动。设计一个流程，让AI生成卡片后，先进入一个“暂存”牌组或标记为“待审核”。你快速浏览一遍，批量删除明显错误的，修改有瑕疵的，然后再批量移动到正式学习牌组。这个“审核”步骤比从零制卡仍然快得多。
2. 迭代你的Prompt：将那些需要你手动修改的卡片作为“训练数据”，分析LLM在哪里出错了，并据此调整Prompt。这是一个持续的过程。
3. 提供更优质的源材料：AI的理解质量很大程度上取决于输入质量。尽量提供结构清晰、语言规范的文本。从混乱的网页直接抓取的效果，通常不如从PDF教科书或经过整理的笔记中提取。

最终，使用“anki-card-skill”这类工具的心态很重要：它不是一个完美的、完全自动化的解决方案，而是一个强大的“协作者”。它承担了初稿起草的繁重工作，将你从机械劳动中解放出来，让你能将宝贵的认知资源投入到更高层级的任务中——知识的结构化、关联与批判性思考。接受它需要一定的调试和后期润色，就像你使用任何高级工具一样，当磨合到位后，它将成为你学习武器库中一件不可或缺的利器。

查看全文

http://www.jsqmd.com/news/830316/