当前位置：首页 > news >正文

PardusBot：基于AI Agent的智能定时任务与数据抓取自动化工具

news 2026/5/8 15:35:29

1. 项目概述：当AI遇上定时任务，数据科学家的“自动化之爪”

作为一名和数据打了十几年交道的从业者，我深知数据科学家和工程师们日常的痛点：那些重复、琐碎但又至关重要的数据抓取、监控和报告任务。从手动刷新网页查看竞品价格，到定时爬取新闻生成日报，这些工作消耗了大量本该用于核心分析和建模的精力。今天要聊的PardusBot，正是为了解决这个“脏活累活”而生的一个开源工具。你可以把它理解为一个运行在你本地或服务器上的“智能调度员”，它结合了AI Agent的意图理解能力和传统的定时任务调度，让你能用最自然的方式描述任务，剩下的交给它自动执行。

它的核心价值在于“降本增效”。对于数据团队而言，效率就是生命线。PardusBot通过一个简洁的Web界面，将复杂的网页抓取、数据处理、定时触发和结果归档流程封装起来。你不再需要写一长串的Python爬虫脚本、处理反爬机制、搭建Celery或Airflow调度系统、再设计存储和告警。你只需要告诉它：“每天下午4点，去抓取这几个竞争对手网站的产品价格，如果有超过5%的变动就通知我。” 它就能理解你的意图，并自动规划执行路径。这背后依赖的是其“OpenClaw”的设计理念——一个为数据科学家打造的开放式抓取与自动化框架。

这个工具特别适合几类人：一是独立开发者或小团队，资源有限但自动化需求迫切；二是数据分析和运营人员，需要频繁获取外部数据但编程能力有限；三是任何希望将重复性网页操作自动化，却又不想陷入复杂技术栈的学习和维护成本的从业者。接下来，我将带你从设计思路到实操细节，彻底拆解这个工具，并分享我在部署和使用中积累的一手经验。

2. 核心架构与设计思路拆解：为什么是“AI Agent + 任务队列”？

PardusBot的设计并不复杂，但组合得非常巧妙。它没有尝试去造一个无所不能的机器人，而是聪明地采用了“AI Agent作为执行引擎，传统任务队列作为调度核心”的混合架构。理解这个设计，能帮你更好地使用它，甚至在其基础上进行定制。

2.1 双核驱动：意图理解与可靠调度

传统自动化工具（如Selenium脚本、Scrapy爬虫）的问题是“脆弱”和“僵硬”。网页结构一变，XPath或CSS选择器就失效，脚本立刻崩溃。而纯AI驱动的工具（如一些基于GPT的浏览器自动化工具）虽然灵活，但缺乏可靠的调度、状态管理和错误恢复机制，不适合生产环境的持续运行。

PardusBot的解决方案是分而治之：

调度与状态管理层（可靠部分）：使用一个内置的、基于SQLite的任务队列来管理所有任务的创建、调度、执行状态、重试和日志。这部分是确定性的，保证了系统的可靠性。任务可以设置为立即执行、定时执行或周期性执行（Cron-like）。
任务执行层（灵活部分）：当任务被调度执行时，PardusBot会将你的自然语言描述（Task Description）发送给配置的AI Agent（默认是Claude Code）。AI Agent的角色是一个“高级执行者”，它需要理解任务目标，自主规划步骤（如：打开某个URL，定位特定元素，提取文本，计算差价，保存为CSV），并调用工具（可能是内置的浏览器模拟、HTTP请求库等）来完成任务。

这种架构的优势很明显：调度层坚如磐石，执行层灵活智能。即使AI某次执行因为网页改版而卡住，任务本身的状态（失败）会被记录，你可以在Web UI上查看详细日志进行排查，然后选择重试或修改任务描述。

2.2 本地优先与数据隐私

另一个值得称道的设计选择是“本地优先”。PardusBot默认在本地运行，所有数据（任务配置、执行结果、中间文件）都存储在你机器上的pardus_data目录中。这意味着：

数据不出域：你抓取的竞品价格、监控的网站内容，都不会经过第三方服务器（除了你选择的AI Agent的API，如Claude）。这对于处理商业敏感数据至关重要。
离线可用性：一旦安装，核心调度功能不依赖网络（当然，执行网页抓取任务时需要网络，调用AI Agent API也需要）。
简化部署：无需配置远程数据库、消息队列或对象存储，一个npx命令就能跑起来，降低了使用门槛。

这种设计牺牲了一定的多机协同和分布式扩展能力，但换来了极致的简单和隐私安全，对于个人和中小团队的大多数自动化场景来说，这个权衡是明智的。

2.3 可插拔的AI Agent引擎

PardusBot没有把自己绑定在某个特定的AI模型上。在设置中，你可以看到它支持多种“Agent Type”：Claude Code（默认）、OpenCode、Cursor以及需要配置API Key的Pardus。这实际上定义了一个执行接口规范。不同的AI Agent在代码理解、工具调用和步骤规划能力上各有侧重。

Claude Code：在代码生成和复杂指令遵循上表现突出，适合需要逻辑判断和多步操作的任务。
OpenCode/Cursor：提供了备选方案，可能在响应速度或成本上有不同优势。
Pardus：这可能是通往自定义或更强大Agent的接口，留给了高级用户扩展空间。

这个设计意味着，随着底层AI模型的快速演进，PardusBot可以通过更换更强大的Agent来提升整体能力，而无需重写整个调度和UI系统。作为用户，你可以根据任务复杂度、预算和对不同AI的偏好进行选择。

3. 从零开始部署与核心配置详解

理论说得再多，不如动手跑起来。这一部分，我会带你完成一次完整的PardusBot部署，并深入每一个配置选项，解释其背后的考量。

3.1 环境准备与一键安装

PardusBot基于Bun运行时，这是一个比Node.js更快的JavaScript运行时。安装过程极其简单，但有几个细节需要注意。

步骤1：安装Bun如果你的系统还没有安装Bun，需要先安装它。打开终端（Terminal），执行官方的一键安装脚本：

curl -fsSL https://bun.sh/install | bash

安装完成后，重启你的终端，或者执行source ~/.bashrc（或source ~/.zshrc）来让bun命令生效。然后通过bun --version验证安装。

注意：虽然npx可以自动获取并运行PardusBot，但它的底层依赖Bun来执行。如果系统没有Bun，npx pardusbot命令可能会失败或提示你安装。先装Bun是更稳妥的做法。

步骤2：运行PardusBot在任意你喜欢的目录下，直接执行：

npx pardusbot

这个命令会完成以下几件事：

从npm仓库下载PardusBot的最新版本。
自动安装项目依赖（使用Bun的包管理器，速度很快）。
启动内置的Web服务器（默认端口13338）和API服务器（默认端口13337）。
在当前目录下创建pardus_data文件夹，用于存放所有持久化数据。

第一次运行可能会花费几十秒时间下载依赖。当你看到终端输出类似“PardusBot is running! Open http://localhost:13338”的信息时，就表示启动成功了。

步骤3：访问Web界面打开浏览器，访问http://localhost:13338。你应该能看到一个简洁、现代的任务管理界面。至此，基础部署完成。

3.2 目录结构与数据持久化解析

理解PardusBot创建的文件结构，对于备份、迁移和问题排查都很有帮助。执行npx pardusbot后，你的工作目录下会生成一个pardus_data文件夹，其结构如下：

pardus_data/ ├── pardus_queue.db # SQLite数据库，存储所有任务定义、调度时间、状态历史 ├── workspaces/ # 每个任务独立的工作空间目录 │ ├── [task-uuid-1]/ # 任务1的专属目录 │ │ ├── output.csv # 任务生成的文件 │ │ ├── screenshot.png │ │ └── debug.log # 可能的调试日志 │ └── [task-uuid-2]/ ├── memory/ # 任务的“记忆”存储，可能用于让AI记住上次执行的结果 └── logs/ # 系统和服务器的运行日志（区别于任务日志）

pardus_queue.db：这是核心。所有你通过Web界面或API创建的任务，都会以结构化的形式存在这里。包括标题、描述、下次执行时间、重复规则、状态（pending, running, success, failed）等。这意味着即使你关闭了PardusBot进程，下次启动时，所有任务计划和历史记录都会恢复。
workspaces/：这是“任务沙盒”。每个任务执行时，都会在一个以自己UUID命名的独立子目录中进行。AI Agent生成的所有文件（如抓取的CSV、截图、生成的报告）都会放在这里。这种隔离设计避免了任务间的文件冲突，也使得结果管理非常清晰。在Web UI的“Files”页面，你可以直接浏览和下载这些文件。
memory/和logs/：为高级功能预留。memory/可能用于实现跨任务执行周期的上下文记忆（例如，让AI记住上周抓取的价格，用于本周计算涨跌幅）。logs/则记录框架自身的运行情况。

实操心得：定期备份与迁移由于所有数据都在本地，备份变得非常简单。你只需要定期复制整个pardus_data文件夹即可。

# 简单的备份命令 cp -r pardus_data pardus_backup_$(date +%Y%m%d)

如果你想将PardusBot迁移到另一台机器，也只需要在新机器上安装好Bun，然后把pardus_data文件夹拷贝过去，在相同路径下运行npx pardusbot，所有任务和历史数据就都回来了。这种基于文件系统的数据管理，虽然原始，但在简单场景下非常有效。

3.3 关键配置项调优

PardusBot的配置项不多，但每一个都直接影响着运行行为和资源消耗。你可以在Web UI的“Settings”页面找到它们。

1. 心跳间隔 (Heartbeat)

默认值：60秒
作用：调度器检查是否有任务到达执行时间的频率。
如何选择：
- 10秒：适用于对任务执行时效性要求极高的场景，比如每分钟都要执行的监控任务。但更频繁的检查会带来稍高的CPU占用（虽然通常可忽略不计）。
- 60秒（默认）：平衡之选。对于大多数按小时、天或周执行的任务来说，一分钟的精度完全足够。
- 300秒（5分钟）或更高：适用于后台长期运行、任务调度不频繁的场景，可以进一步减少资源消耗。例如，你只是每天凌晨运行几个报告任务。

2. 智能体类型 (Agent Type)

选项：Claude Code (默认), OpenCode, Cursor, Pardus。
作用：选择执行任务时使用的“大脑”。这直接决定了任务执行的成功率和质量。
选择建议：
- 对于绝大多数任务，保持默认的Claude Code即可。它在理解复杂指令和生成可靠操作代码方面表现最稳定。
- 如果你有OpenAI或Cursor的API，并且想对比效果或控制成本，可以切换到OpenCode或Cursor。在实际测试中，不同Agent对同一任务的处理方式可能略有不同。
- Pardus选项通常需要额外的API Key配置，可能连接的是更定制化或功能更强的专属Agent。如果你没有相关配置，暂时不要选择它。

3. 端口号

虽然UI上没有直接提供修改端口的地方，但通过启动参数或环境变量是可以修改的。如果你本地13338端口被占用，可能需要查找源码中服务器启动的配置部分进行调整。对于绝大多数用户，确保13338端口可用即可。

4. 实战：创建与管理你的第一个自动化任务

现在，让我们进入最核心的部分：如何用PardusBot真正地解放双手。我将通过几个从简单到复杂的实际案例，手把手演示任务创建的全过程，并分享让任务更稳定的技巧。

4.1 案例一：一次性数据抓取——抓取今日Hacker News头条

假设你每天早上想快速浏览Hacker News的Top 5新闻，但不想手动打开网站。我们可以让PardusBot来做。

打开任务创建界面：在Web UI点击“New Task”。
填写任务详情：
- Title: “Daily Hacker News Top 5”
- Description: 这是核心。你需要用清晰、无歧义的自然语言描述任务。我建议的格式是：“目标 + 具体操作 + 输出要求”。例如：
  “Go tohttps://news.ycombinator.com/and extract the top 5 news stories. For each story, get the title, the URL link, and the score (points). Save the results into a CSV file namedhacker_news_top5.csvwith columns:rank,title,url,score. The CSV should be saved in the task's workspace.”
- Due Time: 选择“Now”或者设置一个未来的时间，比如明天早上9点。
- Recurrence: 留空，因为这是一次性任务。
点击Save：任务创建后，会进入“Pending”状态。如果Due Time是Now，调度器会在下一个心跳周期（默认60秒内）将其状态改为“Running”，并交给AI Agent执行。

关键点解析与避坑指南：

描述越具体，成功率越高：不要只说“抓取Hacker News头条”。明确指定网站URL、要抓取的元素（top 5 stories）、每个元素要提取的字段（title, url, score）、输出格式（CSV）和文件名。AI Agent会根据这些细节生成更精准的操作代码。
提供示例格式：在描述中写明CSV的列名（rank, title, url, score），这能极大地引导AI生成结构规整的数据。
结果查看：任务状态变为“Success”后，点击任务行最右侧的“Files”按钮（或去主界面的“Files”标签页），找到对应任务ID的文件夹，就能下载生成的hacker_news_top5.csv文件了。
如果失败了：点击任务旁边的“Logs”按钮（📄图标）。日志里会完整显示AI Agent的“思考过程”和执行步骤，比如它尝试访问了哪个URL，找到了哪些元素，为什么失败（可能是网络超时、元素选择器不对等）。这是调试任务最宝贵的依据。

4.2 案例二：周期性价格监控——追踪电商商品价格

这是一个更经典的需求：监控某电商网站上的商品价格，并在降价时得到通知。由于PardusBot没有内置的通知系统（如邮件、Slack），我们可以让它将结果保存到文件，然后配合其他工具（如cronjob检查文件变化）来实现告警。

创建任务：
- Title: “Monitor Product X Price”
- Description:
  “Visithttps://www.example-store.com/product/12345every day at 10 AM. Extract the current price of the product (look for the element containing ‘$’ or ‘€’ and a number, usually with class ‘price’ or ‘product-price’). Also extract the product title. Save the result to a CSV file namedproduct_price_history.csv. If the file already exists, append the new data as a new row with today's date. The columns should be:date,product_title,price.”
- Due Time: 设置为今天或明天的上午10:00。
- Recurrence: 选择“Every 1 day”。
任务执行逻辑：AI Agent每天上午10点会打开商品页面，尝试定位价格元素并提取文本。它会检查工作空间里是否存在product_price_history.csv，如果存在，则追加新行；如果不存在，则创建新文件并写入表头和数据。

实现价格变化告警（进阶）：PardusBot本身不发送告警，但我们可以通过一个简单的Shell脚本配合系统定时任务来实现。

首先，让PardusBot正常生成CSV文件。

然后，写一个脚本check_price_drop.sh：

#!/bin/bash LATEST_PRICE=$(tail -n 1 /path/to/pardus_data/workspaces/[task-uuid]/product_price_history.csv | cut -d',' -f3) PREVIOUS_PRICE=$(tail -n 2 /path/to/pardus_data/workspaces/[task-uuid]/product_price_history.csv | head -n 1 | cut -d',' -f3) # 简单的数值比较（需处理货币符号） LATEST_NUM=$(echo $LATEST_PRICE | tr -d '$€£,' ) PREVIOUS_NUM=$(echo $PREVIOUS_PRICE | tr -d '$€£,' ) CHANGE=$(echo "scale=2; ($LATEST_NUM - $PREVIOUS_NUM)/$PREVIOUS_NUM * 100" | bc) if (( $(echo "$CHANGE < -5" | bc -l) )); then echo "Price dropped by more than 5%! New price: $LATEST_PRICE" | mail -s "Price Alert for Product X" your-email@example.com fi

最后，用系统的cron定时执行这个脚本，比如在PardusBot任务执行后5分钟（10:05 AM）运行。

实操心得：应对网站结构变化网页结构改变是自动化抓取的天敌。为了提高任务的健壮性，在描述中可以加入一些“容错指令”：

“...Extract the current price. The price might be inside an element with class ‘price’, ‘product-price’, ‘current-price’, or ‘value’. Try to find the most prominent numerical value with a currency symbol that represents the selling price. If you cannot find a clear price, save ‘PRICE_NOT_FOUND’ in the CSV and log an error message.”

这样，即使网站的CSS类名变了，AI Agent也有更大的机会通过语义（货币符号、数字）找到价格，或者在失败时给出明确的错误信号，而不是 silently fail。

4.3 案例三：复杂研究与报告生成——自动编写行业简报

这个案例展示PardusBot处理多步骤、多数据源任务的能力。假设你需要每周一生成一份AI领域的技术简报。

创建任务：
- Title: “Weekly AI Tech Briefing”
- Description:
  “Every Monday at 9 AM, perform the following research and generate a consolidated markdown report:
  1. Go tohttps://arxiv.org/list/cs.AI/recentand extract the titles and abstracts of the 5 most recent papers (usually the first 5 in the list). Note the submission date.
  2. Go tohttps://techcrunch.com/category/artificial-intelligence/and extract the headlines and summaries of the top 3 news articles from the past 7 days.
  3. Analyze the extracted information. Write a summary report in a markdown file namedai_weekly_report_[YYYY-MM-DD].md. The report should have two sections: ‘Recent Research Papers’ and ‘Industry News’. In each section, list the items with titles, links, and a one-sentence summary. At the end, add a ‘Key Trends’ section with 2-3 bullet points highlighting potential trends observed from this week's content.”
- Due Time: 下周一 9:00 AM。
- Recurrence: Every 1 week。
任务解析：这个描述非常详细，它定义了一个多步工作流：访问两个不同的网站，分别执行不同的抓取逻辑，然后对抓取到的信息进行分析和整合，最后生成结构化的Markdown报告。AI Agent需要理解步骤之间的顺序和最终的报告格式要求。
查看结果：任务完成后，在工作空间你会找到一个格式良好的Markdown文件，可以直接用于团队分享或发布到知识库。

注意事项：

任务复杂度与执行时间：复杂任务意味着AI需要执行更多操作，调用更多次数的网络请求和推理，因此执行时间会更长，消耗的AI API Token也可能更多。对于免费或额度有限的API，需要留意。
结果稳定性：研究类任务的成功率受源网站布局变化影响较大。定期检查生成的报告质量是必要的。你可以在描述中要求AI在遇到问题时将错误信息写入报告，而不是完全失败。

5. 高级用法与API集成

对于开发者和希望将PardusBot融入现有工作流的团队，其提供的REST API是一个强大的功能。这意味着你可以用代码来管理任务，将其集成到你的CI/CD管道、数据流水线或其他管理系统中。

5.1 使用cURL管理任务

PardusBot的API服务器运行在http://localhost:13337。所有在Web界面上能做的操作，几乎都能通过API完成。

创建任务：

curl -X POST http://localhost:13337/api/tasks \ -H "Content-Type: application/json" \ -d '{ "title": "API Created Task - Stock Check", "description": "Extract the current price of Tesla (TSLA) from Yahoo Finance and save to CSV.", "due_time": 1704067200000, # Unix timestamp (毫秒) "recurrence": "every 1 day" }'

成功后会返回一个包含任务UUID的JSON响应。

查询所有任务：

curl http://localhost:13337/api/tasks | jq . # 使用jq美化输出

强制立即执行某个任务：

curl -X POST http://localhost:13337/api/tasks/{task-uuid}/force

删除任务：

curl -X DELETE http://localhost:13337/api/tasks/{task-uuid}

5.2 编程集成示例（Python）

你可以用任何能发送HTTP请求的语言来与PardusBot交互。下面是一个Python脚本示例，用于创建监控任务并检查结果：

import requests import json import time from datetime import datetime, timedelta PARDUS_API_BASE = "http://localhost:13337" def create_daily_monitor_task(url, selector, output_filename): """创建一个每日监控任务""" description = f""" Visit {url} every day at 09:00 UTC. Extract the text content from the element identified by the selector: '{selector}'. Save the extracted text along with the current date to a CSV file named '{output_filename}'. If the file exists, append a new row. """ due_time = int((datetime.utcnow() + timedelta(days=1)).replace(hour=9, minute=0, second=0, microsecond=0).timestamp() * 1000) payload = { "title": f"Daily Monitor: {url}", "description": description, "due_time": due_time, "recurrence": "every 1 day" } response = requests.post(f"{PARDUS_API_BASE}/api/tasks", json=payload) if response.status_code == 200: task_data = response.json() print(f"Task created successfully! UUID: {task_data.get('uuid')}") return task_data.get('uuid') else: print(f"Failed to create task: {response.text}") return None def get_task_logs(task_uuid): """获取指定任务的执行日志""" response = requests.get(f"{PARDUS_API_BASE}/api/logs/{task_uuid}") if response.status_code == 200: return response.text else: return f"Failed to get logs: {response.status_code}" # 使用示例 if __name__ == "__main__": # 创建一个监控某网站标题的任务 task_id = create_daily_monitor_task( url="https://example.com", selector="h1.page-title", output_filename="site_title_tracker.csv" ) if task_id: # 等待一段时间后获取日志（这里只是示例，实际应用中可能需要更复杂的轮询） time.sleep(120) # 等待2分钟 logs = get_task_logs(task_id) print("Recent logs:", logs[:500]) # 打印前500个字符

这个脚本展示了如何以编程方式定义和提交一个监控任务。你可以将其扩展，结合数据库存储任务ID，或者添加更复杂的逻辑，比如解析任务生成的CSV文件内容，进行进一步分析或触发告警。

5.3 从源码运行与自定义开发

如果你需要修改PardusBot的行为，或者想了解其内部机制，可以从GitHub克隆源码并运行。

# 克隆仓库（假设你知道仓库地址） git clone https://github.com/JasonHonKL/PardusClawer.git cd PardusClawer # 安装依赖 bun install # 启动开发服务器 bun run server

从源码运行让你可以：

修改默认配置：比如更改默认端口、调整心跳逻辑。
扩展Agent能力：研究agent/目录下的代码，了解如何集成新的AI Agent。
自定义任务处理逻辑：虽然不推荐直接修改核心调度器，但你可以为特定任务编写更复杂的预处理或后处理脚本，并通过API与PardusBot联动。
运行测试套件：使用bun run test:all来确保你的修改没有破坏现有功能。

6. 常见问题排查与性能优化实录

在实际使用中，你可能会遇到一些问题。下面是我在测试和使用过程中遇到的一些典型情况及其解决方法。

6.1 任务执行失败排查清单

当任务状态变成“Failed”时，不要慌，按照以下步骤排查：

第一步：查看任务日志这是最重要的一步。点击任务旁边的“Logs”按钮。日志通常会显示AI Agent的完整“思考链”（Chain of Thought），包括：
- 计划步骤：AI打算怎么做。
- 执行动作：例如，“Navigating to https://...”。
- 页面内容：可能包含抓取到的HTML片段（有助于判断是否定位到了正确元素）。
- 错误信息：例如，“Element not found”、“Timeout”、“Network error”。
根据日志信息针对性解决：
- 网络错误/超时：可能是目标网站暂时不可访问或响应慢。可以尝试在任务描述中增加重试逻辑的暗示，或者将任务推迟一段时间后重试。
- 元素未找到：这是最常见的问题。网页结构可能已经改变。你需要： a. 手动打开目标网站，用浏览器开发者工具检查你想要的元素（如价格、标题）现在的HTML结构和CSS选择器。 b. 修改任务描述，使用更通用、更稳健的选择方式。例如，不要用div.price > span.value这种精确路径，改用“查找包含‘$’符号的第一个span元素”或“查找class属性中含有‘price’的div元素”这类基于文本或属性部分匹配的描述。 c. 让AI尝试多个备选方案。在描述中写：“尝试寻找class为‘price’的元素，如果没找到，再寻找包含‘current-price’文本的元素。”
- AI理解偏差：有时AI会误解你的意图。比如，你让它“提取最新文章”，它可能去翻页找“最新发布”的标签，而不是列表的第一项。这时需要更精确的描述：“提取页面主内容区域列表中的第一个项目的标题和链接。”
- 输出格式错误：AI可能没有按照你要求的格式（如CSV）保存文件。在描述中明确指定文件格式、列名和分隔符。例如：“保存为标准的CSV文件，第一行是列名，用逗号分隔。”
使用“Force Run”进行测试：修改任务描述后，不要等到下一个调度周期。直接点击“Force Run”按钮立即测试，快速验证修改是否有效。

6.2 性能与资源管理

PardusBot本身非常轻量，资源消耗主要来自两个方面：AI Agent的API调用和网页抓取/渲染（如果使用无头浏览器模式）。

控制并发与频率：避免创建大量在相同时间点触发的高频任务（例如，几十个任务都在每分钟执行）。这可能导致本地网络连接数暴增和AI API配额迅速耗尽。合理设置任务的“Due Time”，让它们错峰执行。
调整心跳间隔：如前所述，对于低频任务，将心跳间隔调到300秒（5分钟）可以进一步减少后台活动。
监控AI Token消耗：如果你使用按Token计费的AI API（如OpenAI），复杂的任务描述和频繁执行会产生费用。在任务描述中尽量简洁明确，避免不必要的上下文。对于纯数据抓取任务，可以尝试使用更便宜的Agent（如果可用）。
磁盘空间：长期运行的任务会不断生成日志和结果文件。定期清理pardus_data/logs/目录下旧的日志文件，或者归档不需要的workspace数据。

6.3 稳定性提升技巧

为任务添加“健康检查”描述：在任务描述末尾，可以加入一句：“如果无法在60秒内完成主要数据提取，则终止任务并记录超时错误。” 这可以防止某些任务因网站加载慢或AI“卡住”而长期占用资源。
利用“记忆”功能（如果实现）：如果未来版本增强了memory/目录的功能，可以利用它来让任务更智能。例如，在价格监控任务中，描述可以写：“将本次抓取的价格与上次存储在工作空间price_memory.json文件中的价格进行比较，如果差价超过10%，则在输出CSV中增加一列 ‘alert: PRICE_DROP’ 或 ‘alert: PRICE_RISE’。” 这需要AI具备读取和写入本地文件的能力。
任务拆分：对于非常复杂、涉及多个不相关网站的任务，拆分成多个独立的小任务。这样不仅更容易调试（哪个子任务失败一目了然），还能利用PardusBot的队列机制实现简单的并行处理（如果AI Agent支持并发的话）。