当前位置：首页 > news >正文

OpenClaw+Phi-3-vision-128k-instruct：电商商品图自动生成详情页文案

news 2026/7/23 17:51:37

OpenClaw+Phi-3-vision-128k-instruct：电商商品图自动生成详情页文案

1. 为什么需要自动化商品文案生成

作为一个经营小众饰品网店的店主，我每天最头疼的就是给新上架的商品写详情页文案。从拍摄照片到整理商品属性，再到绞尽脑汁想卖点描述，整个过程耗时耗力。直到我发现OpenClaw与Phi-3-vision-128k-instruct模型的组合，才真正解决了这个痛点。

传统方式下，我需要手动记录每件商品的材质、颜色、尺寸等属性，然后根据经验编写描述。这个过程不仅效率低下，而且容易遗漏关键信息。现在，通过将商品图片直接上传给多模态模型，系统可以自动识别商品特征并生成专业文案，效率提升了至少5倍。

2. 技术方案选型与搭建过程

2.1 为什么选择Phi-3-vision-128k-instruct

在尝试了多个多模态模型后，我最终选择了Phi-3-vision-128k-instruct。这个模型有几个显著优势：

视觉理解能力强：能准确识别商品图片中的材质、颜色、款式等细节
长文本生成能力：128k的上下文窗口可以生成完整的详情页文案
指令跟随精准：能严格按照"生成卖点文案"、"提取关键词"等指令输出结构化内容

相比之下，其他模型要么视觉理解不够细致，要么生成的文案过于通用化，缺乏商品特异性。

2.2 OpenClaw的集成方式

OpenClaw在这个方案中扮演了"自动化执行者"的角色。我将它配置为：

监控指定文件夹，当有新商品图片上传时自动触发处理流程
调用Phi-3-vision-128k-instruct的API接口发送图片和分析指令
接收模型返回的结构化数据
按照预设模板生成最终的详情页HTML文件

配置核心部分如下（在~/.openclaw/openclaw.json中）：

{ "models": { "providers": { "phi3-vision": { "baseUrl": "http://localhost:8000/v1", "apiKey": "your-api-key", "api": "openai-completions", "models": [ { "id": "phi-3-vision-128k-instruct", "name": "Phi-3 Vision", "contextWindow": 131072 } ] } } } }

3. 实际工作流程与效果展示

3.1 从图片到文案的全自动流程

我的工作流程现在变得非常简单：

将商品照片放入指定文件夹（如~/products/to_process）
OpenClaw自动检测新文件并调用模型API
模型返回结构化数据，包括：
- 商品材质和颜色识别结果
- 3-5个核心卖点建议
- 竞品价格区间分析
- 完整的详情页文案草稿
系统生成最终的HTML文件并保存到发布目录

整个过程完全自动化，我只需要在最后阶段对生成的文案做简单审核和微调。

3.2 实际案例效果对比

以一款手工银饰为例，传统手工编写与自动化生成的对比：

传统方式（手动编写）：

纯银手工项链 材质：925银 长度：45cm 手工打造，每件都是独一无二的 适合日常佩戴和特殊场合

自动化生成结果：

【匠心独运】手工锻造925银项链 ▫️ 材质认证：国际标准925纯银，含92.5%纯银+7.5%合金，确保硬度与光泽持久 ▫️ 工艺亮点：全手工锤纹工艺，每件产品纹路都独一无二，体现匠人精神 ▫️ 佩戴场景：45cm完美锁骨链长度，日常通勤与晚宴搭配两相宜 ▫️ 保养建议：随赠专业擦银布，避免接触香水、泳池水等腐蚀性液体 【设计师灵感】 本系列灵感来自北欧极简美学，锤纹表面捕捉光线变化，打造低调奢华感。每件作品需要匠人3-4小时手工完成，真正意义上的"可佩戴艺术品"。 【价格参考】 同类手工银饰市场价：￥380-680 建议零售价：￥520（性价比之选）

可以看到，自动化生成的文案不仅包含了更多专业细节，还提供了附加价值信息，如保养建议和市场定位，这些都是手工编写时容易忽略的。

4. 实现细节与技术要点

4.1 精准的提示词工程

要让模型输出符合电商场景的专业文案，精心设计的提示词至关重要。我的基础提示词模板如下：

你是一个专业的电商文案生成助手。请根据提供的商品图片： 1. 识别并列出商品的主要材质、颜色、尺寸等物理属性 2. 提取3-5个最具吸引力的产品卖点 3. 分析同类商品的市场价格区间 4. 生成完整的商品详情页文案，包含： - 吸引人的标题 - 详细的产品描述 - 使用场景建议 - 保养注意事项 - 其他增值信息 文案风格要求：专业但不晦涩，突出产品差异化优势，适当使用emoji符号增强可读性（但不要过度）。针对不同商品类目调整语气： - 服饰类：强调穿搭场景和设计理念 - 家居类：突出实用功能和空间搭配 - 电子产品：注重技术参数和使用体验

这个提示词确保了模型输出的结构化与专业性，避免了通用化的描述。

4.2 OpenClaw的自动化脚本

OpenClaw通过简单的JavaScript脚本实现了全流程自动化。核心脚本如下：

const fs = require('fs'); const path = require('path'); const { OpenClaw } = require('openclaw-sdk'); const claw = new OpenClaw(); const watchDir = '/path/to/watch/folder'; const outputDir = '/path/to/output/folder'; // 监控文件夹变化 fs.watch(watchDir, (eventType, filename) => { if (eventType === 'rename' && filename) { const filePath = path.join(watchDir, filename); // 确保文件完全写入 setTimeout(async () => { try { // 调用Phi-3模型分析图片 const analysis = await claw.models.invoke('phi-3-vision-128k-instruct', { prompt: '...', // 上述提示词 image: fs.readFileSync(filePath).toString('base64') }); // 生成HTML详情页 const html = generateProductPage(analysis); const outputPath = path.join(outputDir, `${path.parse(filename).name}.html`); fs.writeFileSync(outputPath, html); console.log(`Generated product page: ${outputPath}`); } catch (err) { console.error('Error processing image:', err); } }, 1000); } }); function generateProductPage(analysis) { // 将模型返回的结构化数据转换为HTML return ` <!DOCTYPE html> <html> <head> <title>${analysis.title}</title> <style>.product-desc { line-height: 1.6; }</style> </head> <body> <h1>${analysis.title}</h1> <div class="product-desc">${analysis.description}</div> <!-- 更多HTML结构 --> </body> </html> `; }