一千条用户反馈要打标分类,我没人肉,让 Agent 批量跑完了
产品攒了一千多条用户反馈,老板要按"功能建议/bug/吐槽/好评"分类统计。人肉一条条看,看到眼瞎还容易标不一致。这种又多又重复、规则又明确的活,正适合交给 Agent 批量跑。
记一下我的批量处理思路。
单条先调通,再批量
别一上来就跑一千条。先做好"处理一条"的逻辑:搭一个分类 Agent,把分类标准和几个示例写进设定,拿几十条试,确认它标得准、标得稳。
我用讯飞星辰搭分类 Agent、发布成 API。单条调通后,批量这步在我自己脚本里做:读数据 → 逐条(或并发)调 API → 收集结果落表。
for item in feedbacks: label = call_agent(item.text) # 调分类 Agent save(item.id, label)批量要注意的
控制并发 + 限速,别一下打太猛把接口限流了,加重试。
断点续跑:跑到一半挂了能接着跑,别从头来(一千条重跑很亏)。
结果要可核查:让它顺带输出"判断理由",方便抽检它标得对不对。
坑
边界 case 会标飘,既像 bug 又像吐槽的,抽检时重点看这类,必要时人工兜。
成本要算,一千条就是一千次调用,跑之前估下花销,简单分类用小模型就够。
标准固化下来,同一套标准跑,比不同人人肉分类一致性还高。
把"批量打标"这种体力活交给 Agent,一下午跑完还统一。批量脚本(限速+续跑)我放评论区了。你们处理批量数据都咋搞的?
