当前位置: 首页 > news >正文

基于ComfyUI的AI图像生成实验报告

一、实验引言

1.实验目的

熟悉千里云平台中ComfyUI节点式工作流的整体结构与核心节点作用,掌握基础文生图工作流搭建、参数设置、正负提示词撰写以及图像生成完整流程。理解LoRA模型加载节点的功能,学会单LoRA与多LoRA组合使用方式,对比基础模型和LoRA增强模型的出图效果。同时探究采样器、采样步数、图像分辨率等参数,对图像质量与程序运行效率造成的影响。

二、实验环境与软硬件配置

千里云容器实例,ComfyUI在线运行环境,访问地址:https://4d8fef1c-8188fz.suanlihou.com

三、实验原理

ComfyUI采用节点串联的形式完成AI图像生成,底层依托Stable Diffusion模型运行。基础大模型决定图像整体画风与画质基底,空Latent图像会生成带有噪声的潜在图像空间,也是最终画面的原始载体,分辨率参数直接决定输出图片尺寸。CLIP文本编码能够将人为编写的正向、负向提示词转化为模型可识别的特征向量,正向词用来定义画面内容、风格与细节,负向词用于规避畸形、模糊、水印等缺陷。

K采样器是核心推理模块,依靠采样算法逐步去除噪声,采样步数、CFG数值、采样器类型会同时影响画面细节和生成速度。VAE解码负责将处理后的潜在图像转化为常规像素图像,最后由保存图像节点导出成品。LoRA属于轻量化微调模型,依附基础大模型使用,可强化特定角色、画风与装饰细节,多个LoRA叠加还能实现多种风格融合。

四、实验全流程步骤

本次实验分为基础文生图、LoRA模型增强图像生成两大模块,按照流程分步开展操作。

(一)前期准备

登录千里云容器实例,通过指定网址进入ComfyUI操作界面。清空原有工作流,依次添加并连接标准文生图所需节点,顺序为Checkpoint加载器、空Latent图像、正负向CLIP文本编码、K采样器、VAE解码、保存图像。在模型加载节点中选定指定基础模型,统一初始图像分辨率为512×512。

(二)基础文生图实验

第一组:林间萤火木屋(治愈森系风景)

第二组:古风执扇江南少女(国风人物)

第三组:星际太空花园(科幻幻想风)

第四组:复古街角咖啡店(欧式日常场景)

(三)LoRA模型增强实验

在基础工作流的基础上新增LoRA加载器节点,将其串联在基础模型加载节点

五、实验结果与详细分析

正向提示词 plaintext A small wooden house deep in the forest, twilight, countless fireflies flying around, dense green plants, old wooden windows, warm candlelight through the window, soft mist, peaceful atmosphere, natural scenery, soft focus, masterpiece, best quality, highly detailed 负向提示词(通用防缺陷) plaintext lowres, bad anatomy, blurry, text, watermark, logo, signature, ugly, deformed, disfigured, extra objects, messy composition, worst quality, low quality, 3d render, cartoon distortion

正向提示词 plaintext 1girl, traditional Chinese style, ancient costume, long hanfu, holding silk fan, long black hair tied with hairpin, standing by lotus pond, willow trees, rippling water, soft breeze, elegant posture, classical beauty, ink painting style, delicate facial features, vibrant colors, masterpiece, best quality 负向提示词 plaintext lowres, bad hands, missing fingers, extra fingers, mutated hands, poorly drawn face, ugly, deformed, blurry, text, watermark, modern clothes, western style, nsfw, extra limbs, bad proportions, cropped, jpeg artifacts

正向提示词 plaintext Space station garden, floating alien flowers, glowing neon plants, starry universe background, distant planets, zero gravity, floating petals, futuristic metal corridor, cosmic light, sci-fi style, surreal scene, ultra detailed, cinematic lighting, masterpiece, best quality 负向提示词 plaintext lowres, blurry, text, watermark, ground, earth scenery, deformed plants, ugly, messy lines, worst quality, low quality, realistic photo, human crowd, extra limbs, bad perspective

正向提示词 plaintext Retro European street corner cafe, vintage storefront, wrought iron window frame, potted roses on windowsill, warm afternoon sunlight, old street lamp, cobblestone road, lazy cat lying on the steps, retro tone, warm color palette, street view, detailed texture, masterpiece, best quality 负向提示词 plaintext lowres, blurry, text, watermark, logo, graffiti, modern billboard, deformed animals, ugly, disfigured, messy scene, bad proportions, cropped, jpeg artifacts, 3d anime distortion

七、实验结论

本实验完整掌握了千里云平台中 ComfyUI 节点式工作流的搭建、连接与参数配置流程,熟悉了各核心节点的功能定位与协作逻辑,四组基础文生图实验均成功生成图像,整体流程运行稳定可靠。

实验表明,提示词撰写对最终生成效果具有决定性影响:正向提示词需明确画面主题、风格、构图与细节描述,负向提示词则可有效规避 AI 绘图中的各类常见缺陷。LoRA 模型能够以较低成本实现风格强化、角色定制与多风格融合,单 LoRA 适用于单一风格优化,多 LoRA 组合则可实现风格混搭,配合分辨率调整,能灵活平衡生成画质与运行效率。

ComfyUI 的运行效率受分辨率、采样参数、LoRA 数量及节点布局等多因素共同影响,采用标准分辨率、适中采样步数与精简节点结构,可实现高效稳定出图。本次实验所用的千里云容器实例,能够稳定支撑 ComfyUI 开展基础文生图、LoRA 增强绘图等操作,可满足入门学习与常规创作的需求。

  • 实验不足与未来展望

本实验仅采用单一采样器与固定调度器,未对不同采样算法的生成效果差异进行对比,也未探究不同 LoRA 权重对画面表现的影响,因此实验内容存在一定局限性,工作流节点也仍有优化空间。后续可开展拓展实验,对比多款主流采样器的生成质量与运行效率,测试不同 LoRA 权重的最优搭配方案;也可引入 ControlNet 等进阶节点,实现人物姿态、画面构图的精准控制,还能利用队列功能完成批量生成,进一步提升实操深度与创作效率。

http://www.jsqmd.com/news/987270/

相关文章:

  • 2026东莞蒂芙尼尚美巴黎钻石回收:权威高价领跑,合扬稳居TOP1 - 奢侈品交易观察员
  • 2026天津塘沽高端权威大型装修公司TOP10口碑推荐 - 品牌帮
  • LeetCode 380:Insert Delete GetRandom O(1) 题解和一些延伸
  • 2026佛山卡地亚积家回收哪家好?本地五大机构测评 - 奢侈品回收测评
  • 2026爱好者选源头厂家直供手办二手交易平台怎么选:货源多性 - 13425704091
  • 三分钟掌握:如何用《蔚蓝档案》主题打造个性化鼠标指针
  • AI_windows1.0 通过AI辅助的windows自动点击操作软件
  • 6月奢侈品回收避坑指南|南京百达翡丽回收S级梯队夺冠,断层领先同行 - 奢侈品回收评测
  • 【架构深评】打破多品牌壁垒:如何基于 GB28181 与 RTSP 栈,构建高解耦的 AI 视频流媒体管理平台?(附源码交付)
  • Java——多线程编程技巧
  • 2026年优质之选:国内性价比高的打包箱房厂家推荐 - GrowthUME
  • 重庆公司注册工商代办排行榜:口碑、资质、效率三维度评选! - 果果1998
  • MQTT教程详解-05.SpringBoot集成mqtt client 性能分析
  • 2026真空净油机TOP排名推荐|工业专用净油设备源头厂家批发选购指南 - 工业环保设备
  • 计算机毕业设计之基于Python的书店ERP系统的设计与实现
  • 2026桂林防水补漏公司推荐TOP权威榜单正式发布 精选桂林防水补漏口碑好的商家 严选靠谱桂林正规防水堵漏公司 针对性解决厨卫外墙楼顶飘窗等各类房屋渗漏问题 - 防水空鼓维修家
  • 2026北京抖音短视频代运营公司推荐可靠度实测排行盘点 - 起跑123
  • 为什么别人网站天天有询盘,你的网站却无人问津?
  • 本地跑大模型,终于找到靠谱 AI 工具了。
  • Gitee 信创安全全面解析:国产化研发效能平台的安全能力与落地实践
  • Windows系统文件d3dx11_43.dll丢失找不到问题解决
  • PowerToys中文汉化版:解锁Windows效率工具的全部潜力
  • 打造你的专属音乐世界:MusicFree插件化播放器完整指南
  • 腾讯应用宝上架
  • 跨设备传一段代码或文件,到底用什么最省事?我把常见的几种方案认真比了一遍
  • 柳州泰遇尚养生馆全场景服务与价值落地指南
  • 【Kafka源码解读和使用指南】第23篇:KafkaConsumer源码全景图——消息消费背后的精密机器
  • 心脏衰竭治疗医院怎么选?2026年最新指南来了(附安徽地区推荐)
  • 核心拆解:基金名字里的“四大密码”
  • 多模态大模型表格解析方案