当前位置: 首页 > news >正文

LLM应用剖析: 小红书AI图文生成器-红墨

1. 背景

  • 花了近一周时间,深入研究了Github近几天比较有意思的一个项目,小红书AI图文生成器RedInk。仅需输入一个主题以及可选的参考图片,系统则会自动生成大纲,然后针对每个章节生成对应的图片。
  • 项目前端采用Vue+TypeScript,后端采用Flask。
  • 支持docker部署及编译部署,文本模型及图像模型支持系统编辑。
  • Ps: 国内有哪些平台可以访问nano banana 2 pro? 本人使用的是七牛,免费试用额度还不少哦。

2. 系统效果

  • 模型选择: Qwen3-14B大语言模型,Nano Banana2生图模型。
  • 输入: 3岁宝宝冬季保暖攻略
  • 输出效果:

生成效果图

3. 整体流程

流程

  • (1) 用户通过系统输入关注的主题,也可同时上传参考的多个图片
  • (2) 系统会调用LLM生成大纲,包含封面、多个内容片段以及总结,如果针对生成效果不满意,可以直接在线编辑。
  • (3) 编辑好每个段落后,即可开始一键生图,可根据服务商模型特性,采用串行及并行两种方式。
  • (4) 生成好的图片后,如果针对其中某些不满意,可以执行重新生成,最终可以一键生成。

4. 代码浅析

  • (1) 前后端代码的可读性很强,建议可以本地进行调试。如果想要在vscode中同时联调前端和后端,可以采用如下vscode的调试配置文件launch.json
{"version": "0.2.0","configurations": [{"type": "chrome","request": "launch","name": "调试 Vue 应用","url": "http://localhost:5173", // 你的开发服务器地址"webRoot": "${workspaceFolder}/frontend/src","breakOnLoad": true,"sourceMapPathOverrides": {"/src/*": "${webRoot}/*","/@fs/*": "${webRoot}/*","vite://@fs/*": "${webRoot}/*"},"runtimeArgs": ["--remote-allow-origins=*"],"skipFiles": ["<node_internals>/**","${workspaceFolder}/frontend/node_modules/**"]},{"type": "node","request": "launch","name": "调试构建脚本","program": "${workspaceFolder}/frontend/node_modules/vite/bin/vite.js","args": ["dev"]},{"name": "Python 调试程序: 当前文件","type": "debugpy","request": "launch","program": "${file}","console": "integratedTerminal","justMyCode": false,"purpose": ["debug-in-terminal"],"cwd": "${workspaceFolder}","env": {"PYTHONPATH": "${workspaceFolder}"},"args": []}]}
  • (2) 模型配置信息如下:
# 大语言模型
active_provider: qwenproviders:
  qwen:
    api_key: test
    base_url: http://172.16.0.32:20080
    endpoint_type: /v1/chat/completions
    model: Qwen3-14B
    type: openai_compatible# 生图模型
active_provider: 七牛
providers:七牛:api_key: sk-34xxxxx0base_url: https://api.qnaigc.comendpoint_type: /v1/images/editshigh_concurrency: falsemodel: gemini-3.0-pro-image-previewshort_prompt: falsetype: image_api

5. 总结与思考

  • 本文介绍了小红书的一键图文生成平台,并提供了系统的基本执行流程及原理。同时分享了本人基于本地部署后,生成的图文效果,眼过千遍不如手过一遍,实践方能出真知。

6. 参考

  • (1) 项目地址: https://github.com/HisMax/RedInk
  • (2) 七牛云平台生图模型文档:https://developer.qiniu.com/aitokenapi/13166/text-to-image-api

公众号

http://www.jsqmd.com/news/67331/

相关文章:

  • openSIS 8.0 SQL注入漏洞技术分析与利用
  • 【把Linux“聊”明白】进程的概念与状态 - 详解
  • 17.Mybatis之代理对象的执行
  • 哥大与某机构共建AI研究中心,五年投资500万美元
  • linux基础命令
  • 中国电子学会全国机器人技术等级考试(一级)2019年12月 - 详解
  • 道1:“知识型英语”和“本能型英语”都要学
  • IDEA源码阅读神器-Diagram专业的工具
  • 读书笔记 XILINX ug1137-Zynq UltraScale+ MPSoC Software Developer Guide 软件开发者指南 Chapter7
  • 2025年苗木批发基地供应商口碑榜:前十强深度解析,丝棉木/金森女贞/青叶复叶槭/红叶李/国槐/白蜡/无刺枸骨球苗木批发基地供应商排行榜单
  • 2025 年优质服装批发市场推荐:精准适配需求,解锁高效采批新体验
  • MySQL 性能实测:Docker 容器 vs 裸机部署,差距到底有多大?
  • 详细介绍:【二叉搜索树】:程序的“决策树”,排序数据的基石
  • thinkphp6 request /i /s等转换
  • An Explainable KG-RAG-Based Approach to Evidence-Based Fake News Detection Using LLMs
  • 10 种低情商行为
  • 科学破解“睡眠信用卡”困局:狄耐克脑电波交互技术,重塑健康作息新模式
  • 2025 最新免费降 AI 率网站测评!13 款中英文工具实测,哪个最好用?
  • Google 开源项目风格指南
  • 男士洗面奶哪个牌子最好?露卡菲娅山茶花洗面奶,排行榜单热销款揭秘!
  • 软件构造大作业:儿童故事管理平台的开发
  • flex布局精进: align-items: stretch;属性
  • v-if
  • Python 简单基础教程
  • 英语_阅读_Paddling a dragon boat_待读
  • langchain4j 学习系列(6)-结构化输出(参数提取)
  • 小型功率三极管S9013、SOT-23介绍
  • if 的虚拟语气和省略形式
  • 屏幕上那一行刺眼的红色 `Time Limit Exceeded`,是不是你我再熟悉不过的场景?
  • 【论术】项目复盘总结-响应式界面