当前位置: 首页 > news >正文

AI诗人工作室:OpenClaw+nanobot生成藏头诗并自动排版成电子书

AI诗人工作室:OpenClaw+nanobot生成藏头诗并自动排版成电子书

1. 缘起:当AI诗人遇上自动化工具

去年冬天,我在整理家族长辈的口述历史时萌生了一个想法——能否用技术手段将零散记忆转化为可传承的诗歌集?传统创作流程需要经历"收集素材-人工创作-排版校对-电子书制作"多个环节,而作为技术爱好者,我决定尝试用OpenClaw+nanobot搭建自动化创作流水线。

经过两个月的迭代,这套系统已经能实现:输入主题关键词→自动生成符合格律的藏头诗→批量转换为标准EPUB格式→推送至Kindle设备。最让我惊喜的是,整个流程中AI不仅负责内容生成,还通过OpenClaw完成了文件转换、格式校验等原本需要人工介入的机械操作。

2. 技术选型与核心组件

2.1 为什么选择OpenClaw+nanobot组合

在方案验证阶段,我测试过多种组合方式。最终选择这对组合主要基于三个考量:

  1. 轻量化部署:nanobot内置的Qwen3-4B模型在诗歌生成任务上表现优异,且vllm推理框架对消费级显卡友好(我的RTX 3060笔记本就能流畅运行)
  2. 操作集成度:OpenClaw的文件操作和命令行调用能力,能完美衔接生成→转换→推送的完整链路
  3. 隐私安全性:所有创作数据都在本地处理,适合包含个人记忆等敏感内容的创作场景

2.2 系统架构概览

整个工作流包含三个核心模块:

graph LR A[主题输入] --> B(nanobot诗歌生成) B --> C[OpenClaw格式转换] C --> D[Calibre电子书制作] D --> E[Kindle推送]

3. 实战搭建过程

3.1 基础环境准备

首先通过星图平台获取nanobot镜像(包含预置的Qwen3-4B模型),配合OpenClaw完成基础部署:

# 拉取nanobot镜像(假设已配置星图平台访问) docker pull registry.mirror.csdn.net/nanobot-qwen3:latest # 安装OpenClaw核心组件 curl -fsSL https://openclaw.ai/install.sh | bash openclaw onboard --model-provider local --model-endpoint http://localhost:5000

特别提醒:如果本地GPU显存不足8GB,建议在nanobot启动时添加--max-lora-rank=4参数限制显存占用。

3.2 诗歌生成模块配置

nanobot的chainlit界面提供了友好的交互方式,但我们需要通过OpenClaw实现批量调用。在~/.openclaw/skills/poetry_generator.py创建自定义skill:

import requests def generate_acrostic(keyword: str, style: str = "七言绝句"): prompt = f"""请以'{keyword}'为藏头创作一首{style},要求: 1. 严格遵循平仄格律 2. 避免生僻字 3. 每行不超过8个汉字""" response = requests.post( "http://localhost:5000/v1/completions", json={ "model": "qwen3-4b-instruct", "prompt": prompt, "max_tokens": 256 } ) return response.json()["choices"][0]["text"]

测试时发现模型偶尔会输出非诗歌内容,通过添加temperature=0.3参数可以有效控制生成稳定性。

3.3 电子书自动化生产链路

这是整个系统最精妙的部分——用OpenClaw串联多个工具链:

  1. 文本收集阶段:将生成的诗歌按章节整理为Markdown
  2. 格式转换阶段:调用Calibre的ebook-convert命令行工具
  3. 设备推送阶段:通过Kindle邮箱服务自动发送

对应的OpenClaw任务配置文件(~/.openclaw/tasks/ebook_pipeline.json)核心片段:

{ "steps": [ { "name": "generate_poems", "type": "python", "script": "poetry_generator.py", "args": { "keyword": "{{input.keyword}}", "style": "{{input.style}}" } }, { "name": "compile_markdown", "type": "shell", "command": "pandoc -o output/chapter_{{timestamp}}.md" }, { "name": "convert_epub", "type": "shell", "command": "ebook-convert output/chapter_*.md output/anthology.epub --chapter-mark=none" }, { "name": "send_to_kindle", "type": "python", "script": "kindle_mailer.py", "args": { "filepath": "output/anthology.epub" } } ] }

4. 创作实践中的经验沉淀

4.1 内容质量控制技巧

在生成200+首诗歌后,我总结出这些提升质量的方法:

  • 种子词优化:在提示词中加入"参考《唐诗三百首》的意象运用"比简单要求"有文采"更有效
  • 温度系数调整:叙事诗用0.7增强创造性,格律诗用0.3保证规范性
  • 后处理脚本:用正则表达式过滤掉"这是一首..."等模型惯用前缀

4.2 典型问题与解决方案

问题1:生成内容突然偏离主题

  • 根因:长时间运行后显存不足导致模型退化
  • 解决:在OpenClaw任务中添加定期重启指令:
    { "pre_steps": [ { "type": "shell", "command": "docker restart nanobot" } ] }

问题2:Calibre转换丢失中文排版

  • 根因:缺少中文字体依赖
  • 解决:在Dockerfile中预装字体:
    RUN apt-get update && apt-get install -y fonts-wqy-zenhei

5. 成果展示与创作建议

最终系统生成的《江南记忆》诗集包含32首藏头诗,从祖父的抗战经历到侄女的出生故事,用七言律诗的形式凝固了家族记忆。相比人工创作,这套方案有三个独特优势:

  1. 批量创作能力:单次可生成10-20首主题关联的组诗
  2. 风格一致性:通过固定prompt模板保持整体格调统一
  3. 即时可读性:生成后2分钟内即可在Kindle上阅读成书

对于想尝试类似创作的朋友,建议从这些方向入手:

  • 先聚焦单一诗体(如五言绝句)打磨prompt
  • 用OpenClaw的watch功能监控生成质量
  • 为不同家族成员建立专属风格模板

这个项目的意义不仅在于技术验证,更让我体会到:当AI成为创作伙伴而非工具时,技术就能真正服务于人文传承。或许未来每个家庭都可以拥有自己的AI史官,用诗意的语言记录平凡生活中的不朽瞬间。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

http://www.jsqmd.com/news/558238/

相关文章:

  • 【专栏导读】拒绝过度设计!零运维成本打造单体Java应用的“铁桶级”极简监控体系
  • 猫抓浏览器扩展深度解析:现代网页资源嗅探的技术内幕与实践指南
  • OpenClaw技能市场:为GLM-4.7-Flash寻找合适插件
  • 5步实战LivePortrait:从零部署到高级人像动画生成
  • Windows安装OpenClaw完整教程,小白轻松上手
  • Qwen2.5-7B-Instruct参数详解:RMSNorm归一化对训练稳定性的影响分析
  • 泛微E9 OA流程表单右上角加按钮?用Ecode 5分钟搞定(附完整代码)
  • Rust嵌入式安全开发:STM32F4性能优化与跨平台实践指南
  • Python新手必看:PyCharm 2021.2.3社区版安装与配置全攻略(附环境变量检查)
  • 2026年靠谱的防爆电液推杆精选公司 - 品牌宣传支持者
  • 从仿真到PCB:用Proteus 8.15 Professional完整走一遍STM32项目开发流程
  • 有手就会!OpenClaw接入飞书教程
  • Emu3.5 视觉 tokenizer 及其 decoder 的训练过程
  • VTK编译踩坑实录:从源码到VS2022可运行环境的完整避坑指南
  • ESP32-S3开发避坑:搞懂Kconfig、Kconfig.projbuild和组件依赖,让你的menuconfig不再混乱
  • Bongo Cat Mver:终极键盘可视化工具完整指南 - 让直播与教学更生动
  • 别再死磕手册了!Nexys A7开发板快速上手指南:从点亮第一个LED到驱动数码管
  • MCP协议实战踩坑:当Claude Desktop遇上n8n 1.93.0的混合通信
  • OpenClaw学术研究:Qwen3.5-4B-Claude自动整理文献综述
  • 如何快速实现Axure RP界面本地化:3步搞定专业级中文汉化完整教程
  • React Native Material Design 项目迁移指南:从旧版本升级到现代方案的完整教程
  • ImageNet2012验证集分类避坑指南:从标签文件获取到Python脚本调试全流程
  • BMAD 开发者的日常如果你正在用
  • 重构Git操作体验:Tig文本界面如何颠覆命令行工作流
  • Vue2 + 百度地图API避坑指南:从AK申请到精准定位,我踩过的坑你别再踩了
  • 信用卡欺诈检测实战:用sklearn实现代价敏感随机森林(含完整代码)
  • mPLUG VQA可解释性分析:注意力热力图可视化+关键区域定位效果展示
  • 2024轻量级跨平台Rust工具集极速部署指南:Windows/macOS/Linux全适配
  • OpenClaw权限管理:GLM-4.7-Flash操作安全控制方案
  • RS-485串口通信实战:从差分信号原理到多节点组网调试