当前位置：首页 > news >正文

使用 Taotoken 聚合 API 为你的 Markdown 文档自动生成摘要与标签

news 2026/5/10 13:09:44

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度

使用 Taotoken 聚合 API 为你的 Markdown 文档自动生成摘要与标签

对于内容创作者和文档管理者而言，处理大量 Markdown 格式的笔记或文章是一项日常工作。手动为每篇文档撰写摘要和标签不仅耗时，而且难以保持一致性。借助 Taotoken 提供的统一 API，你可以轻松编写一个 Python 脚本，自动化这一流程。本文将介绍如何利用 Taotoken 的多模型能力，为本地 Markdown 文件自动生成内容摘要和关键词标签，从而提升文档管理效率。

1. 场景与方案设计

假设你有一个存放技术博客或项目笔记的文件夹，里面都是 Markdown 文件。你的目标是：运行一个脚本，脚本能读取这些文件，调用大模型 API 分析其内容，并生成一段简洁的摘要和几个相关的标签，最后将结果保存或更新到原文件中。

使用 Taotoken 的核心优势在于其OpenAI 兼容的 API。这意味着你可以直接使用熟悉的openaiPython 库，而无需为接入不同厂商的模型而编写多套代码。你可以根据文档内容的特点，在 Taotoken 的模型广场中选择适合文本总结和理解的模型，例如claude-sonnet-4-6或gpt-4o-mini，整个过程通过一个统一的端点完成。

2. 环境准备与脚本编写

首先，确保你已安装必要的 Python 库。除了openai，我们还需要处理 Markdown 文件。

pip install openai

接下来，在 Taotoken 控制台创建一个 API Key，并记下它。同时，在模型广场确定你打算使用的模型 ID。

下面是一个核心脚本示例。它定义了函数来读取 Markdown 内容、调用 Taotoken API 以及将结果写回文件。

import os from openai import OpenAI import re # 初始化 Taotoken 客户端 client = OpenAI( api_key="你的_Taotoken_API_Key", # 替换为你的实际 Key base_url="https://taotoken.net/api", # 注意 Base URL ) def generate_summary_and_tags(file_content, model="claude-sonnet-4-6"): """调用 API 生成摘要和标签""" prompt = f""" 请分析以下 Markdown 文档内容，并完成两项任务： 1. 生成一段不超过 150 字的简洁摘要，概括核心内容。 2. 提取 3 到 5 个关键词或短语作为标签，用英文逗号分隔。 文档内容： {file_content} 请以严格的 JSON 格式回复，包含两个字段：“summary” 和 “tags”。 “tags” 字段的值是一个由逗号分隔的字符串。 """ try: completion = client.chat.completions.create( model=model, messages=[ {"role": "system", "content": "你是一个专业的文档分析助手。"}, {"role": "user", "content": prompt} ], temperature=0.3, # 较低的温度使输出更稳定 ) response_text = completion.choices[0].message.content # 尝试从响应中解析 JSON import json # 清理响应文本，提取可能的 JSON 部分 json_match = re.search(r'\{.*\}', response_text, re.DOTALL) if json_match: result = json.loads(json_match.group()) return result.get("summary", ""), result.get("tags", "") else: # 如果解析失败，退回简单处理 return response_text, "" except Exception as e: print(f"API 调用出错: {e}") return "", "" def process_markdown_file(file_path, model): """处理单个 Markdown 文件""" with open(file_path, 'r', encoding='utf-8') as f: content = f.read() # 可选：去除 Markdown 元数据（如 Front Matter）以专注于正文 # 这里简单处理，直接使用全部内容 summary, tags = generate_summary_and_tags(content[:6000], model) # 限制长度以防超出上下文 return summary, tags def update_file_with_metadata(file_path, summary, tags): """将摘要和标签以特定格式插入文件头部""" with open(file_path, 'r', encoding='utf-8') as f: lines = f.readlines() # 在文件开始处插入元数据块 metadata_block = f"""--- summary: {summary} tags: [{tags}] --- """ # 检查是否已有元数据块（如 YAML Front Matter），这里做简单追加处理 # 为简化示例，我们直接在文件最前面添加 new_content = metadata_block + ''.join(lines) with open(file_path, 'w', encoding='utf-8') as f: f.write(new_content) print(f"已更新文件: {file_path}") if __name__ == "__main__": # 配置参数 TAOTOKEN_MODEL = "claude-sonnet-4-6" # 从模型广场选择 DOCS_DIR = "./my_docs" # 你的 Markdown 文档目录 for filename in os.listdir(DOCS_DIR): if filename.endswith('.md'): file_path = os.path.join(DOCS_DIR, filename) print(f"正在处理: {filename}") summary, tags = process_markdown_file(file_path, TAOTOKEN_MODEL) if summary: update_file_with_metadata(file_path, summary, tags) else: print(f" 处理失败或未生成内容。")