当前位置：首页 > news >正文

AI绘画自动化：从批量生成到Pixiv发布的半自动工具实践

news 2026/7/10 23:57:46

1. 项目概述：从手动到自动，解放AI绘画生产力的全流程工具

如果你是一名深度使用NovelAI或Stable Diffusion这类AI绘画工具的创作者，那么你一定对“批量生成”和“自动发布”这两个词背后的痛楚深有体会。每次生成图片，你都需要在WebUI里手动输入提示词、调整参数、点击生成，然后等待，再手动保存。当你想把满意的作品发布到Pixiv时，又得经历上传、填写标签、设置分类等一系列繁琐操作。这个过程重复几十次、上百次后，创作的热情很容易被机械的劳作消磨殆尽。

我最初就是为了解决这个问题，开始捣鼓自动化脚本。从最简单的用Python模拟点击，到后来封装成带图形界面的工具，再到现在这个功能庞杂的“Semi-Auto-NovelAI-to-Pixiv”（后文简称SANP），它已经从一个自用的小工具，演变成一个集成了批量生图、智能后处理、自动发布到Pixiv的全流程解决方案。它的核心价值很简单：把创作者从重复性劳动中解放出来，让你能更专注于提示词工程、构图设计和创意本身。

这个工具特别适合以下几类人：一是需要大量出图测试不同风格和参数的探索型画师；二是经营Pixiv账号，需要定期、批量更新作品的内容创作者；三是任何希望将AI绘画流程工业化、标准化，以提升产出效率的团队或个人。接下来，我会详细拆解这个工具的每一个核心模块，分享从部署到高阶使用的完整经验，以及那些在官方文档里找不到的“踩坑”实录。

2. 核心架构与设计思路：为什么是“半自动”？

2.1 “半自动”的哲学：在控制与效率间寻找平衡

项目名叫“半自动”，这个定义非常精准。它并非一个完全黑箱的、输入指令就坐等收图的“全自动”工厂。相反，它强调人的决策与机器的执行相结合。具体体现在：

批量生成，但逐张审核：工具可以一次性生成数十张甚至上百张图片，但生成后并非直接上传。它会将所有结果平铺在一个筛选界面中，供你快速浏览、评分、删除。你保留了最终的质量把控权，避免了垃圾图被误上传的尴尬。
流程自动化，但参数可微调：整个从生图到上传的流水线是自动的，但流水线上的每一个环节（如采样器、步数、放大算法）都允许你进行精细配置。你甚至可以针对不同的图片分类（例如“风景”和“人物”）设置不同的后处理参数模板。
插件化扩展：核心功能稳定，但通过插件系统，任何人都可以为工具添加新功能（如新的超分引擎、新的标签翻译服务）。这种设计保证了工具的活力，也使得“自动化”的边界可以由社区共同定义和拓展。

这种设计思路源于一个深刻的实践认知：AI绘画的“优质产出”严重依赖于人类的主观审美和即时调整。完全自动化在当前技术下容易产生大量不符合预期的结果，反而降低了效率。“半自动”正是在尊重创作者主观能动性的前提下，将那些确实可以、也应该交给机器完成的重复性工作自动化。

2.2 技术栈选型：为什么是Gradio + Python？

工具采用了Gradio作为WebUI框架，后端逻辑全部由Python实现。这是一个经过深思熟虑的选择：

Gradio的快速原型能力：对于这类需要频繁交互（调整参数、筛选图片）的工具，一个友好的界面至关重要。Gradio允许我用极少的代码快速搭建起一个功能完备的Web界面，并且天生支持实时更新和交互。相比于用传统Web框架（如Flask/Django）从零搭建前端，开发效率有数量级的提升。
Python的生态优势：整个AI绘画生态，从NovelAI的API调用、Stable Diffusion WebUI的进程管理，到各种图像处理库（PIL/Pillow, OpenCV），再到网络请求（requests, aiohttp），Python都有成熟且活跃的库支持。用Python作为“胶水语言”，可以轻松集成这些分散的组件。
易于分发和部署：最终打包给用户的是一个包含Python解释器、所有依赖库和前端资源的“整合包”。用户无需配置复杂的Python环境，双击运行脚本即可。这对于非技术背景的创作者来说门槛极低。

当然，这个选择也有代价。Gradio在构建非常复杂的单页面应用时，状态管理会变得有些棘手。这也是为什么在项目的重构版本ANR中，我开始评估像Streamlit或甚至用PyQt/WxPython重写本地客户端的可能性，以追求更极致的性能和交互体验。但对于绝大多数用户来说，当前的Gradio方案在易用性和功能性上已经取得了很好的平衡。

3. 环境部署与初始配置详解

3.1 两种部署方式：源码与整合包

官方提供了两种部署方式，我强烈建议不同用户根据自身情况选择：

方式一：从源码部署（适合开发者或喜欢折腾的用户）

安装Python 3.10.11：这是一个关键点。许多深度学习库对Python版本有严格限制，3.10.11是一个经过广泛测试、兼容性最好的版本。安装时务必勾选“Add Python to PATH”，这是后续所有命令行操作能正常进行的基础。
安装Git：用于克隆代码仓库。
克隆仓库：在命令行中执行git clone -b main --depth=1 https://github.com/zhulinyv/Semi-Auto-NovelAI-to-Pixiv.git。--depth=1参数只克隆最新的一次提交，速度更快。
运行启动脚本：进入项目目录，双击run.bat。脚本会自动创建Python虚拟环境并安装所有依赖。这个过程会下载数百MB的包，耗时较长，取决于你的网络速度。

注意：国内用户在这一步可能会因为网络问题导致pip安装超时或失败。如果遇到，可以尝试修改项目内的requirements.txt或 pip 的镜像源为国内源（如清华、阿里云）。这是一个常见的坑点。

方式二：使用整合包（推荐绝大多数用户）这是最省心的方法。直接在项目的GitHub Release页面下载最新的整合包，解压到任意目录（路径不要包含中文或特殊字符），然后运行目录内的整合包启动(Modpack launcher).bat即可。整合包已经内置了Python解释器、所有依赖库以及必要的超分引擎可执行文件，真正做到开箱即用。

实操心得：即使你是技术用户，我也建议先使用整合包快速把工具跑起来，验证核心功能是否符合预期。之后再决定是否需要从源码部署进行二次开发。这能帮你避开大量初期环境配置的坑。

3.2 核心配置项解析：Token与Cookie的获取

工具运行需要两个关键凭证：NovelAI的token和Pixiv的cookie及x-csrf-token。配置不正确，所有自动化功能都会失效。

1. NovelAI Token获取：这个token用于调用NovelAI的生成API。获取方法比想象中简单：

登录你的NovelAI账户。
打开浏览器开发者工具（F12），切换到“网络”(Network)选项卡。
在NovelAI网站上任意操作一下（比如刷新画廊页面）。
在网络请求中，找到一个指向api.novelai.net的请求。
查看该请求的“标头”(Headers)，在“请求头”部分找到Authorization字段。其值通常以Bearer开头，后面的一长串字符就是你的token。将其完整复制到SANP设置页面的对应配置项中即可。

2. Pixiv Cookie 和 X-Csrf-Token 获取：这是实现自动上传的关键。官方教程的步骤很清晰，这里我强调几个容易出错的细节：

必须使用浏览器手动模拟一次完整上传：目的是让Pixiv的会话中生成一个有效的CSRF Token。这个Token是防跨站请求伪造的，每次登录会话都会变化，但在一段时间内有效。
F12抓包的时机：一定要在点击“投稿”按钮之前就打开开发者工具并清空网络记录。点击投稿后，立刻在纷杂的网络请求中找到名为illust或类似的那个POST请求。这是上传图片的核心请求。
复制的内容：在illust请求的“标头”中，你需要复制两个东西：
- Cookie：这是一个很长的字符串，包含了你的登录会话信息。全部复制。
- X-Csrf-Token：这是一个较短的字符串。注意，它的值可能每次会话都不同，如果失效了需要重新抓取。
将这两个值分别填入SANP设置页面的pixiv_cookie和pixiv_token字段。

重要警告：这两个凭证极度敏感，等同于你的账号密码。切勿泄露给他人，也不要上传到任何公开的代码仓库。SANP工具本身是本地运行的，你的凭证只存在你自己的电脑上。

3.3 其他重要配置

代理设置：如果你的网络环境需要代理才能访问NovelAI或Pixiv，必须在工具的设置中配置好HTTP代理。格式通常是http://127.0.0.1:7890（具体端口请根据你的代理客户端设置填写）。配置错误会导致网络请求全部失败。
目录设置：建议清晰地设置好“生成图片保存目录”、“待上传图片目录”、“已完成上传图片目录”。良好的目录管理习惯，能让你在后期整理和回溯时事半功倍。
超分引擎路径：如果你使用了整合包，引擎路径通常已预设好。如果从源码部署，你需要根据README的指引，自行下载对应的超分引擎（如waifu2x-ncnn-vulkan）的可执行文件，并在此处指定其路径。

4. 核心工作流实操：从提示词到Pixiv时间线

配置妥当后，我们进入核心使用环节。一个完整的自动化工作流通常包含以下步骤：

4.1 批量文生图/图生图

这是工具的起点。在“文生图”标签页，你可以：

批量输入提示词：在提示词框内，你可以一次性输入多条提示词，每条占一行。工具会按顺序为每一条提示词生成图片。
参数模板化：你可以为“画风”、“质量”、“负面提示词”等设置一个基础模板，然后为每条提示词进行微调。例如，基础负面提示词包含“bad hands”，但针对某张特定图，你可以追加“blurry”。
指定生成数量：可以为每条提示词指定生成多少张不同种子的图片。
图生图：除了文生图，你也可以上传一批草图或线稿，进行批量图生图操作，统一应用相同的重绘强度、采样器等参数。

实操技巧：

在大量生成前，先用单张、低步数（如28步）测试一下提示词的效果，避免浪费点数生成一整批不符合预期的图。
利用“随机种子”和“变异强度”来创造多样性。你可以先固定一个满意的种子生成一张基准图，然后在此基础上进行小幅度的种子变异，得到风格一致但细节不同的系列图。

4.2 图片后处理与筛选

生成完成后，所有图片会进入“图片管理”或专门的筛选界面。这里是“半自动”的核心体现。

批量后处理：
- 超分辨率放大：工具集成了Waifu2x、Real-ESRGAN、Real-CUGAN等多种引擎。你可以选择一种，对筛选出的图片进行2x、4x甚至更高倍率的放大。对于AI生成的图片，放大能有效修复一些细节模糊的问题。
- 批量打码：针对NSFW内容，工具提供了多种打码方式（如高斯模糊、像素化、贴图覆盖），可以批量处理，以满足Pixiv的审核要求或你自己的发布标准。
- 水印与元数据处理：可以批量添加自定义水印，或选择清除图片中的AI生成元数据（如提示词、参数信息）。
高效筛选：
- 界面通常以缩略图网格展示图片，支持键盘快捷键（如方向键浏览，数字键1-5快速评分，Delete键删除）。
- 我的策略是“两轮筛选法”：第一轮快速浏览，用快捷键给一眼不错的图打3分以上，一眼废的图直接删除。第二轮再仔细查看高分图，进行微调或决定最终上传哪些。
- 工具通常支持“复制选中图片到新目录”的功能，方便你将最终候选图整理到一起。

4.3 自动化上传至Pixiv

这是工作流的终点，也是自动化价值最大的环节。在“Pixiv上传”模块，你需要：

设置发布参数：包括作品标题、描述、标签（Tags）、年龄限制（R-18/G）、是否AI生成、公开范围、是否允许评论等。这些参数可以设置为一个模板，应用于本次上传的所有图片。
关联图片与标题/标签：更高级的用法是，你可以准备一个CSV文件或通过特定命名规则，为每一张图片指定独立的标题和标签集。工具会自动匹配并应用。
启动上传：点击上传后，工具会模拟浏览器的行为，依次将图片、标题、标签等信息提交到Pixiv。你可以在日志窗口看到实时的上传进度和结果。

避坑指南：
频率限制：Pixiv对上传频率有严格限制，短时间内上传过多作品可能会触发风控，导致临时禁传。建议在工具中设置上传间隔，例如每张图间隔30-60秒，模拟人类操作速度。
标签规范：Pixiv的标签系统有自动补全和规范。工具上传的标签如果完全不在Pixiv的词库内，可能会被忽略。最好使用常见的、已有的标签。可以先用浏览器手动上传一次，观察Pixiv接受的标签格式。
Cookie失效：Pixiv的登录会话（Cookie）可能过期。如果上传开始报错（如403、401），首先检查Cookie和CSRF Token是否失效，需要按前述方法重新抓取。

5. 插件系统与高级功能探索

SANP的插件系统是其保持生命力的关键。它允许社区开发者扩展功能而不必修改核心代码。

5.1 内置插件与商店

工具内置了一个插件商店，你可以从中发现和安装社区贡献的插件。常见的插件类型包括：

新的超分引擎：集成最新的图像放大算法。
标签翻译器：自动将中文提示词翻译成英文标签（或反之），方便上传Pixiv。
风格迁移：将一张图的风格应用到另一批图上。
图片分析：自动为生成的图片打分、筛选，甚至用CV模型检测构图、色彩分布等。
对接其他平台：除了Pixiv，还可以开发自动上传到Twitter、DeviantArt等平台的插件。

安装插件通常只需在WebUI的插件页面点击安装，重启后即可使用。这极大地丰富了工具的可能性。

5.2 高级功能：视频转绘、分块重绘与提示词反推

除了核心流程，SANP还集成了一些提升创作能力的高级功能：

视频转绘：你可以导入一个视频，工具会将其逐帧提取，对每一帧进行图生图处理，然后再合成视频。这可以用来制作AI风格的动画短片或为现有视频添加统一的滤镜风格。需要注意的是，这对算力和时间消耗极大，通常需要先在低分辨率下测试效果。
分块重绘：当你想对一张高分辨率大图的局部进行修改时，直接整图重绘可能改变不想动的部分。分块重绘功能允许你将图片分割成多个瓦片（tiles），只对选定的瓦片区域应用重绘，最后再智能地拼接起来，尽量减少接缝。这需要重绘插件（如SD-WebUI的“重绘蒙版”）的支持，并精细调整重叠区域和融合参数。
提示词反推：这是一个非常实用的学习工具。当你看到一张喜欢的AI图或真人照片时，可以将其导入，工具会调用WD-Tagger等模型，自动反推出可能用于生成这张图的提示词（Tags）。这对于学习优秀作品的提示词构成、丰富自己的提示词库非常有帮助。

6. 常见问题与故障排查实录

即使工具设计得再完善，在实际使用中还是会遇到各种问题。下面是我和社区用户遇到的一些典型问题及解决方案：

问题现象	可能原因	排查与解决思路
启动`run.bat`后闪退或报错	1. Python环境问题（版本不对，PATH未设置） 2. 依赖库安装失败（网络问题） 3. 端口被占用（默认11451）	1. 确认Python版本为3.10.x，并在命令行输入`python --version`验证。 2. 查看闪退前命令行窗口的报错信息。如果是依赖问题，尝试使用整合包，或换用国内pip源重装。 3. 运行 `netstat -ano
NovelAI生成图片失败，报API错误	1. Token无效或过期 2. 网络问题，无法连接NovelAI服务器 3. 账户点数（Anlas）不足	1. 按前文方法重新获取Token并更新配置。 2. 检查代理设置是否正确，并尝试在浏览器中直接访问`api.novelai.net`看是否正常。 3. 登录NovelAI官网查看账户余额。
Pixiv上传失败，报403/404错误	1. Pixiv Cookie或CSRF Token失效 2. 上传频率过高被临时限制 3. 图片格式、大小不符合要求	1.这是最常见的原因。重新手动抓取Cookie和Token。 2. 增加上传间隔时间，休息几小时后再试。 3. 检查图片是否为JPG/PNG格式，文件大小是否超过Pixiv限制（通常10MB以内）。
超分（放大）功能无法使用	1. 超分引擎路径未正确设置 2. 缺少必要的运行库（如VC++ 2015） 3. 显存不足（对于GPU引擎）	1. 在设置中检查引擎可执行文件的路径是否正确。 2. 安装Microsoft Visual C++ 2015 Redistributable。 3. 尝试换用对显存要求更低的引擎（如某些NCNN-Vulkan的CPU模式），或降低同时处理的任务数。
WebUI界面卡顿、无响应	1. 同时处理的任务过多（如批量生成+放大） 2. 浏览器缓存问题 3. 机器性能瓶颈	1. 避免在前端进行极大规模（如数百张）的批量操作，可以分批次进行。 2. 尝试清除浏览器缓存，或使用无痕模式访问。 3. 生成、超分都是计算密集型任务，会占用大量CPU/GPU资源，导致UI响应慢属正常现象，耐心等待任务完成。
插件安装失败或加载错误	1. 插件与当前SANP版本不兼容 2. 插件自身有bug或依赖缺失 3. 网络问题无法从仓库拉取	1. 查看插件页面是否有兼容性说明，或等待插件作者更新。 2. 在社区或插件issue页面反馈问题。 3. 如果是从GitHub安装，检查网络连接。

最后的经验之谈：自动化工具的目的是提升效率，但它本身也需要维护成本。定期关注项目的更新（尤其是重构后的ANR项目），及时更新工具和插件，可以避免很多因版本滞后导致的问题。当遇到复杂问题时，善于利用项目的Issue页面和社区（如QQ群）寻求帮助，通常开发者或其他资深用户已经遇到过类似情况。记住，所有自动化流程在首次搭建和调试时都是最耗时的，一旦稳定运行起来，它为你节省的时间将是巨大的。

查看全文

http://www.jsqmd.com/news/792681/