AI 每天写 3 篇番茄短篇,结果 3 篇阅读全是 0:我终于明白不能只拼产量
最近我在做一个真实项目,叫 FanqieGold。
这个项目不是简单地让 AI 写小说,也不是写几篇爽文玩一玩。
它的目标很明确:研究“AI 能不能辅助批量创作番茄短篇小说,并通过真实发布、真实数据、真实复盘,最终找到可持续的内容变现路径”。
最开始,我的想法很直接。
既然 AI 已经能写长文、写故事、写短篇,那是不是可以提高产能?
于是我们开始每天写 3 篇番茄短篇小说。
每篇大概 8000 到 10000 字。
题材主要集中在女频、家庭伦理、复仇打脸、婚姻背叛、亲情压迫这些方向。
从执行角度看,AI 的产能确实很强。
一天 3 篇,连续几天跑下来,项目已经积累了十几篇短篇故事。
如果只看产量,这件事似乎跑通了。
但很快,现实给了我一巴掌。
某天新发的 3 篇作品,后台阅读量全部是 0。
不是 1,不是 2,不是阅读少。
而是 3 篇全部 0。
这时候我才真正意识到:AI 内容项目最危险的地方,不是写不出来,而是写出来之后,平台根本不给你有效反馈。
更可怕的是,如果没有数据闭环,你可能还会继续写,继续发,继续重复错误。
最后看起来很勤奋,实际上只是在批量制造无效内容。
先说一下真实数据
项目跑到这个阶段,账号整体并不是完全没数据。
后台曾经有过这样的累计数据:
总展现量:8719
总阅读量:188
点击率:2.16%
15 秒阅读:57
30 秒阅读:44
60 秒阅读:33
触底人数:10
评论:0
点赞:1
加入书架:4
单看这些数据,其实不算完全没流量。
至少说明平台曾经给过冷启动展现,也有人点进来看过。
但问题在于,后面某一天发的 3 篇作品,阅读全部为 0。
这说明什么?
它说明问题可能已经不只是“内容不够好”,而是新发内容没有进入有效推荐,或者被系统认为新鲜度不足、重复度过高、互动价值太低。
这类问题,单靠继续写更多篇,是解决不了的。
为什么每天 3 篇反而可能是错的?
在 AI 内容生产里,很多人第一反应都是提高产量。
一天 1 篇不够,那就一天 3 篇。
一天 3 篇不够,那就一天 10 篇。
但真实平台不是这样运行的。
平台推荐系统要看的不是你有多勤奋,而是用户有没有正反馈。
有没有点击?
有没有停留?
有没有看完?
有没有评论?
有没有收藏?
有没有点赞?
有没有继续阅读?
如果这些信号没有起来,产量越高,可能只是让系统更快识别出你的内容同质化。
我们前期写的很多短篇,确实符合番茄爽文的基本结构:
开头强冲突。
极品亲戚或伴侣压迫。
大额金钱或房产纠纷。
女主忍无可忍。
甩出证据链。
反派翻车。
结尾断亲或离婚。
这一套确实爽,也确实容易写。
但连续写多了,问题就来了。
标题像。
封面像。
冲突像。
反派像。
翻盘方式像。
情绪节奏像。
结尾惩罚也像。
读者可能还没疲劳,系统可能已经先疲劳了。
我们内部复盘时发现,很多作品虽然换了标题、换了金额、换了人物关系,但本质还是同一套“家庭压迫 + 金钱冲突 + 证据链反杀”。
这就不是简单的题材重复,而是更深层的叙事 DNA 重复。
换题材也不一定有用
后面我们尝试换一个冲突模型。
比如不再写抢房、抢钱、彩礼、拆迁款,而是写“顶罪入狱”。
表面看,这已经不是原来的老套路了。
但我们做了判重检测后,结果还是很高。
为什么?
因为它虽然换了故事前提,但保留了很多相同的获胜元素:
还是家庭内部压迫。
还是妈妈和弟弟这类反派。
还是女主被牺牲。
还是证据链翻盘。
还是最后让反派受到惩罚。
也就是说,AI 表面上换了故事,骨子里还是在写同一个东西。
这给了我一个很重要的启发:
内容差异化不是只换 premise,不是只换“这次抢房,下次顶罪”。
真正要换的是 craft DNA。
也就是:
反派类型要换。
冲突结构要换。
翻盘方式要换。
爽点触发方式要换。
证据链节奏要换。
结尾互动方式要换。
读者情绪入口也要换。
如果这些东西不换,故事看起来是新的,实际上还是旧的。
于是我们开始做判重检测器
为了不再凭感觉判断“像不像”,我们给 FanqieGold 做了一个确定性判重检测器。
它不是用大模型模糊评价,而是先做一个可解释的 MVP。
主要从 8 个维度判断:
标题公式是否相似。
开头冲突是否相似。
反派类型是否相似。
金额套路是否相似。
证据链结构是否相似。
结尾惩罚是否相似。
女主翻盘方式是否相似。
情绪关键词是否相似。
最后给出一个 0 到 100 的风险分。
0 到 30 是低风险。
31 到 60 是中风险。
61 到 80 是高风险。
81 到 100 是强判重风险,原则上禁止发布。
这个检测器跑完历史作品后,结果非常扎心。
历史 9 篇归档作品,平均判重分很高,中位数也很高,基本都处在高风险区间。
这说明我们之前不是“偶尔重复”,而是整个题材池已经同构化。
这个发现非常重要。
因为它让项目从“我感觉最近写得有点像”,变成了“数据证明高度相似”。
内容项目一旦能量化,就能开始优化。
评论为 0,比阅读少更危险
这次复盘里,还有一个更刺眼的数据:评论为 0。
阅读低,早期还可以理解。
展现少,也可能是冷启动问题。
但是评论长期为 0,说明读者没有被激发参与。
对短篇内容来说,评论不一定要多,但至少要有破冰。
一条评论都没有,说明结尾没有留下情绪出口。
读者看完就走了。
平台也拿不到更深层的正反馈。
所以我们后面加了一个“互动三件套”。
每篇发布包里必须带三个问题:
第一,价值判断型问题。
比如:如果是你,会原谅这样的家人吗?
第二,代入选择型问题。
比如:如果你是女主,会拿钱走人,还是彻底反击?
第三,情绪共鸣型问题。
比如:你身边有没有见过这种偏心到离谱的父母?
这种问题看起来很简单,甚至有点土。
但内容平台上,能不能激发评论,很多时候就是靠这种明确的情绪出口。
以前我们把故事写完就结束了。
现在不行。
故事结尾必须为数据服务。
从每天 3 篇,改成 2+1
经历这次 0 阅读之后,我不再建议盲目每天 3 篇。
现在项目策略改成:
每天 2 篇创作 + 1 个实验/复盘任务。
这比每天硬写 3 篇更重要。
这个“1”可以做什么?
可以补发布台账。
可以记录真实后台数据。
可以做标题 A/B。
可以做封面 A/B。
可以做开头 300 字重写。
可以做判重检测。
可以做题材矩阵。
可以做结尾互动测试。
可以做发布时间对照。
内容项目不是工厂流水线。
它更像实验系统。
每一次发布,都应该带着一个假设。
比如:
今天测试“弹幕预知”是否比传统家庭伦理更容易提高点击。
今天测试“结尾互动问题”能否让评论从 0 到 1。
今天测试早晨发布是否比中午发布更好。
今天测试封面人物大字报风格是否还能继续用。
如果没有假设,只是每天写,那就是盲目堆量。
数据闭环比写作能力更重要
FanqieGold 现在已经证明了一件事:
AI 写 8000 到 10000 字短篇,技术上不难。
难的是后面的闭环。
选题怎么来?
写完存在哪里?
发布状态有没有记录?
单篇数据有没有追踪?
标题、封面、分类、标签有没有记录?
哪篇发了,哪篇没发?
哪篇阅读高,哪篇阅读低?
哪篇被判重,哪篇通过?
哪篇评论破冰,哪篇完全没人互动?
这些问题如果不解决,AI 写得越快,管理越混乱。
我们这次就踩了一个坑。
有 7 篇已经发到番茄的作品,后来发现正文没有归档进数据库。
也就是说,作品发出去了,但项目本地没有完整正文。
这会导致什么?
无法复盘。
无法判重。
无法分析开头。
无法分析结构。
无法总结失败原因。
无法把经验回流到下一篇。
这就是典型的数据闭环断裂。
所以后来我们补了发布台账,修复了状态字段,把已发布但正文缺失的作品标记为 published_missing_content。
注意,不是编造正文补进去。
而是诚实标记:这篇发过,但正文遗失。
做项目最怕自欺欺人。
缺数据就是缺数据,不能为了报表好看就乱补。
题材矩阵开始变得重要
这次复盘后,我们不再只写家庭伦理复仇。
而是把题材分成三条线。
A 线:家庭伦理复仇打脸。
这条线保留,但不能再每天大量写。
B 线:家庭伦理 + 脑洞设定。
比如弹幕预知、重生、读心术、未来日记、反派心声、死亡倒计时。
C 线:悬疑家庭隐秘。
比如亲子鉴定反转、遗产谜案、身世秘密、多年前案件、失踪亲人、伪造诊断书、婚姻骗局。
这三条线的目的不是为了好看,而是为了做对照实验。
如果 B 线明显比 A 线点击高,就加大 B 线比例。
如果 C 线评论更容易破冰,就继续挖 C 线。
如果 A 线继续判重高,就减少 A 线产出。
这才是内容项目该有的样子。
不是今天想到什么写什么,而是用矩阵做实验。
AI 内容变现,最容易犯的错
这次失败让我确认了一个判断:
AI 内容变现最容易犯的错,就是把“产能”误认为“竞争力”。
AI 可以让你一天写很多。
但平台不奖励你写得多。
平台奖励的是用户反馈。
如果你没有数据闭环,没有判重机制,没有题材实验,没有互动设计,没有发布台账,那你只是把低质量决策放大了。
以前人工一天只能写 1 篇,错也只错 1 篇。
现在 AI 一天能写 10 篇,如果方向错,就是一天错 10 篇。
所以 AI 不是自动赚钱机器。
AI 是放大器。
它会放大你的执行力,也会放大你的错误。
接下来怎么做?
FanqieGold 后面会继续做,但策略已经变了。
第一,不再盲目每天 3 篇。
第二,优先发布差异化更高的作品。
第三,高判重作品不发布,先重写。
第四,每篇都必须进入发布台账。
第五,每篇都必须归档 Markdown 和数据库。
第六,每篇发布包必须带互动三件套。
第七,每天至少做一个实验或复盘动作。
第八,所有结论分清楚:事实、弱信号、推测。
这点很重要。
比如“某个题材可能更好”,在样本不足时只能叫弱信号,不能叫结论。
“某篇阅读为 0”,这是事实。
“可能被判重”,这是推测。
如果不区分这些,复盘就会变成玄学。
总结
这次 3 篇阅读全是 0,其实不是坏事。
它让 FanqieGold 从一个“AI 批量写小说项目”,开始变成一个“AI 内容实验系统”。
以前我们关注的是:
今天写了几篇?
现在我们更关注:
哪篇为什么能被推荐?
哪篇为什么没人看?
哪种题材更有差异化?
哪种标题更容易点击?
哪种开头更能留住人?
哪种结尾更能引发评论?
判重分多少才安全?
评论能不能从 0 变成 1?
AI 写小说不难。
难的是把它变成一套能持续迭代的内容生产系统。
这也是我现在越来越相信的一点:
AI 时代真正值钱的,不是单次生成内容,而是把生成、发布、数据、复盘、迭代做成闭环。
只会让 AI 写文章,价值有限。
能让 AI 参与一整套项目系统,才是真正的生产力。
