当前位置：首页 > news >正文

fft npainting lama保姆级教程：从环境部署到图片去文字完整流程

news 2026/3/26 19:15:23

fft npainting lama保姆级教程：从环境部署到图片去文字完整流程

1. 快速开始与环境部署

1.1 环境准备与服务启动

本系统基于fft npainting lama图像修复模型构建，支持通过WebUI界面实现图像重绘、物品移除、文字清除等操作。系统已封装为可一键启动的服务，适用于Linux服务器环境。

在终端中执行以下命令进入项目目录并启动服务：

cd /root/cv_fft_inpainting_lama bash start_app.sh

成功启动后，终端将显示如下提示信息：

===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================

该服务由科哥二次开发，集成了画笔标注、自动推理、结果保存等功能，极大简化了图像修复的使用门槛。

1.2 访问WebUI界面

服务启动后，在浏览器中输入以下地址进行访问：

http://<服务器IP>:7860

例如，若服务器IP为192.168.1.100，则访问：

http://192.168.1.100:7860

页面加载完成后即可进入图像修复主界面。

2. 界面功能详解

2.1 主界面布局说明

系统采用双栏式设计，左侧为编辑区，右侧为结果展示区，整体结构清晰直观。

┌─────────────────────────────────────────────────────┐ │ 🎨 图像修复系统 │ │ webUI二次开发 by 科哥 | 微信：312088415 │ ├──────────────────────┬──────────────────────────────┤ │ │ │ │ 🎨 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [图像上传/编辑] │ [修复后图像显示] │ │ │ │ │ [🚀 开始修复] │ 📊 处理状态 │ │ [🔄 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘

左侧区域：负责图像上传、修复区域标注（mask绘制）
右侧区域：实时显示修复结果及处理状态
底部状态栏：提示当前操作步骤或错误信息

2.2 工具功能解析

画笔工具（Brush）

用于标记需要修复的区域。涂抹区域将以白色显示，表示该部分将被模型重建。

支持调整画笔大小（1px ~ 100px）
推荐根据目标物体尺寸选择合适笔触
白色覆盖越完整，修复效果越自然

橡皮擦工具（Eraser）

用于修正误标区域。点击橡皮擦图标后可在画布上擦除已标注的mask区域。

可切换回画笔继续补充标注
支持多次撤销操作（Ctrl+Z）

控制按钮

🚀 开始修复：触发图像修复流程，调用lama模型进行推理
🔄 清除：清空当前图像和所有标注，重新开始
图层管理：支持多图层操作（高级用户使用）

3. 完整使用流程

3.1 第一步：上传原始图像

系统支持三种上传方式：

点击上传：点击上传区域选择文件
拖拽上传：直接将图像文件拖入编辑区
粘贴上传：复制图像后使用Ctrl+V粘贴

支持格式包括：PNG、JPG、JPEG、WEBP。

建议优先使用PNG格式，避免因JPG压缩导致颜色失真影响修复质量。

3.2 第二步：标注待修复区域

确保画笔工具已激活
调整画笔大小至合适范围
在需要去除的文字、水印或物体上均匀涂抹白色
若标注超出范围，使用橡皮擦工具进行修正

标注时建议略微扩大边缘范围，便于模型更好地融合周围纹理。

3.3 第三步：执行图像修复

点击"🚀 开始修复"按钮，系统将执行以下流程：

将原始图像与mask传入lama模型
模型基于FFT频域变换与扩散机制进行内容重建
输出修复后的图像并自动保存

处理时间参考：

小图（<500px）：约5秒
中图（500~1500px）：10~20秒
大图（>1500px）：20~60秒

3.4 第四步：查看与下载结果

修复完成后，右侧将显示修复后的图像预览。

输出文件自动保存路径为：

/root/cv_fft_inpainting_lama/outputs/

文件命名规则：outputs_YYYYMMDDHHMMSS.png

可通过FTP工具或服务器文件管理器下载结果。

4. 典型应用场景实践

4.1 场景一：去除图片水印

适用情况：版权标识、LOGO、半透明浮水印

操作要点：

使用中等画笔完整覆盖水印区域
对于模糊水印，适当扩大标注范围
如一次修复不彻底，可重复操作

# 示例代码片段：手动调用修复函数（供二次开发者参考） from inpainting_pipeline import InpaintingPipeline pipeline = InpaintingPipeline() result = pipeline(image_path="input.jpg", mask_path="mask.png") result.save("output.png")

4.2 场景二：移除干扰物体

典型应用：路人、电线杆、垃圾桶等背景杂物

技巧建议：

复杂边缘使用小画笔精细描绘
保持标注连续性，避免断点
周围背景越规律，修复效果越好

4.3 场景三：清除图像文字

常见需求：广告牌文字、文档敏感信息、界面UI元素

分步策略：

大段文字建议分块标注
每次处理一行或一个区块
修复后重新上传继续处理其他部分

避免一次性标注过多区域，可能导致上下文理解偏差。

4.4 场景四：人像瑕疵修复

适用对象：面部痘印、皱纹、划痕等

注意事项：

使用最小画笔精确点选瑕疵
避免大面积涂抹面部特征区域
可结合“分层修复”策略提升细节还原度

5. 高级使用技巧

5.1 分区域多次修复

对于含多个需处理区域的图像，推荐采用分步修复策略：

修复第一个目标区域
下载中间结果
重新上传该图像
标注下一个区域并再次修复

此方法可有效避免模型混淆上下文，提升整体修复质量。

5.2 边缘羽化优化

若发现修复边界存在明显接缝：

重新标注时让mask超出目标区域3~5像素
系统会自动进行边缘渐变融合
结合背景纹理实现自然过渡

5.3 批量处理建议

目前WebUI暂不支持批量处理，但可通过脚本方式实现自动化：

#!/bin/bash for img in ./inputs/*.png; do python run_inpaint.py --image $img --mask ./masks/$(basename $img) done

适合有二次开发能力的用户扩展使用。

6. 常见问题与解决方案

6.1 修复后颜色异常

可能原因：

输入图像为BGR格式（OpenCV读取）
JPG压缩引入噪声

解决办法：

系统已内置BGR转RGB转换模块
建议使用PNG格式上传
若仍存在问题，请联系开发者获取更新补丁

6.2 未检测到有效标注

错误提示：⚠️ 未检测到有效的mask标注

检查项：

是否使用画笔进行了涂抹
是否仅上传图像但未标注
浏览器是否正常加载JavaScript功能

应对措施：

刷新页面重试
更换Chrome/Firefox浏览器
确认网络连接稳定

6.3 服务无法访问

排查步骤：

检查服务是否运行：
```
ps aux | grep app.py
```
查看端口占用情况：
```
lsof -ti:7860
```
检查防火墙设置：
```
ufw status
```

确保7860端口对外开放。

6.4 输出文件找不到

默认保存路径：

/root/cv_fft_inpainting_lama/outputs/

可通过以下命令查看最新生成文件：

ls -lt /root/cv_fft_inpainting_lama/outputs/ | head -5

7. 状态码与提示信息对照表

状态提示	含义说明
等待上传图像并标注修复区域...	初始空闲状态
初始化...	加载模型权重阶段
执行推理...	正在进行图像修复
完成！已保存至: xxx.png	修复成功
⚠️ 请先上传图像	未上传任何图像
⚠️ 未检测到有效的mask标注	未进行画笔标注

8. 服务管理与维护

8.1 正常停止服务

在启动终端按下Ctrl+C即可安全退出服务。

8.2 强制终止进程

当服务无响应时，可使用以下命令强制关闭：

# 查找进程ID ps aux | grep app.py # 终止指定进程（替换实际PID） kill -9 <PID>

8.3 日志查看

系统日志输出在控制台，包含模型加载、推理耗时、异常捕获等信息，可用于故障诊断。

9. 总结

本文详细介绍了fft npainting lama图像修复系统的完整使用流程，涵盖环境部署、界面操作、典型场景应用及问题排查。

该系统由科哥基于lama模型二次开发，具备以下优势：

操作简便：图形化界面，无需编程基础
修复精准：结合FFT频域分析与深度学习重建
扩展性强：支持本地部署与二次开发集成
永久开源：承诺免费使用，保留原作者版权

无论是去除水印、删除文字，还是修复图像瑕疵，均可通过本系统高效完成。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/270615/

DeepSeek-OCR-WEBUI实战：高精度中文OCR识别全解析

高保真语音合成新选择｜Supertonic设备端TTS深度体验

模拟输出型温度传感器工作原理深度剖析

DeepSeek-R1代码生成案例：云端GPU免配置，3步出结果

基于Java+SpringBoot+SSM大学生心理互助社区(源码+LW+调试文档+讲解等)/大学生心理支持平台/大学生心理辅导社区/大学生心理健康互助/大学生心理交流社区/大学生心理援助社区

MGeo政府项目：支撑人口普查、税务登记的地址标准化

基于Java+SpringBoot+SSM学生学业质量分析系统(源码+LW+调试文档+讲解等)/学生学业评估系统/学业质量分析平台/学生成绩分析系统/学业表现分析工具/学生学业监测系统

Hunyuan-MT-7B高效部署：利用镜像实现秒级环境初始化

声纹数据库构建好帮手：CAM++批量处理实测体验

Open-AutoGLM开发调试技巧：实时查看屏幕截图与操作流

跑SAM 3太烧钱？按秒计费方案省90%成本

DeepSeek-R1-Distill-Qwen-1.5B vs Llama3-1B：轻量模型GPU利用率谁更强？

AI抠图效果对比：科哥UNet完胜传统方法？

YOLOv11与ROS集成：机器人视觉系统部署

HBase在实时大数据处理中的应用案例

Z-Image-ComfyUI工作流分享：高效生成不重来

1小时1块钱：BGE-Reranker低成本体验全攻略

Emotion2Vec+ Large深度解析：utterance与frame粒度识别差异对比

Multisim示波器触发设置技巧：深度剖析稳定波形方法

避坑指南：用vLLM部署通义千问3-14B-AWQ的常见问题解决

零基础入门大模型微调：Qwen2.5-7B + ms-swift快速上手指南

Vetur对Vue2语法支持详解：全面讲解

AI副业神器：Qwen3-VL-8B+云端GPU，接单修图月省5000硬件成本

HY-MT1.5开箱即用指南：小白3分钟调用翻译API

IndexTTS-2-LLM技术探索：端到端语音合成系统实现

Qwen3-4B-Instruct-2507应用：智能客服机器人

通义千问2.5-0.5B模型解释：可视化工具助你理解AI决策

没GPU能玩AI Agent吗？Open-AutoGLM云端镜像3块钱搞定

Qwen2.5-0.5B-Instruct部署教程：支持中文问答的极简方案

DeepSeek-R1实战：智力题自动求解系统