AI 辅助用户画像与场景构建:从访谈文本到可验证的研究假设
在用户研究中,用户画像和使用场景常常被当作“设计共识工具”使用:它们帮助团队理解用户是谁、用户想完成什么、用户为什么会失败、产品应该优先解决什么问题。
但在很多实际项目中,用户画像也容易变成一种“漂亮但不严谨”的文档:
- 画像来自少量访谈,但没有说明证据来源;
- 人设名称很生动,但与真实行为数据脱节;
- 场景故事写得完整,却没有转化成可验证的研究假设;
- 团队记住了“焦虑的宝妈”“忙碌的白领”,却忘记了背后的任务、指标和样本偏差。
如果我们把 AI 用在用户画像构建中,最有价值的地方并不是让 AI “编几个用户”,而是让 AI 充当一个定性材料整理助手、证据索引助手、模式识别助手和研究假设生成助手。
一、为什么用户画像不应该只是“人物小传”?
很多人理解的用户画像是这样的:
李女士,32岁,一线城市白领,工作繁忙,重视效率,喜欢简洁的产品体验。
这种画像看起来合理,但科研价值和决策价值都有限。
它的问题在于:
描述过于笼统
“重视效率”“喜欢简洁”几乎适用于所有用户,无法指导设计决策。缺少行为证据
她为什么重视效率?在哪些任务中体现?她放弃操作的节点在哪里?缺少任务情境
用户不是抽象地使用产品,而是在具体场景下完成任务。缺少可量化指标
如果后续要验证这个画像是否重要,我们要测什么?完成率?任务时间?错误率?满意度?留存率?缺少群体边界
这个画像代表多少人?与其他用户群有什么差异?是否只是研究者对少数人的印象?
因此,更适合科研与产品决策的用户画像,应该包含以下要素:
| 模块 | 关键问题 |
|---|---|
| 用户背景 | 用户处于什么角色、经验水平、资源条件中? |
| 核心任务 | 用户真正想完成什么? |
| 行为路径 | 用户通常如何完成任务? |
| 痛点与障碍 | 用户在哪些节点失败、犹豫或绕路? |
| 目标与动机 | 用户为什么要完成这个任务? |
| 情境变量 | 什么环境、时间压力、设备条件会影响行为? |
| 证据来源 | 哪些访谈原话、观察记录或问卷回答支持该判断? |
| 可验证假设 | 后续可以用什么指标和方法验证? |
AI 的价值,正是帮助研究者在这些模块之间建立更系统的连接。
二、AI 在用户画像构建中的正确定位
在这类任务中,AI 不应该被当成“创意文案生成器”,而应该被当成一个研究助理。
它适合做:
- 对访谈文本进行摘要;
- 从原始材料中提取用户目标、痛点、行为和情绪;
- 帮助研究者初步编码;
- 聚类相似主题;
- 发现反复出现的场景;
- 为画像生成结构化模板;
- 将定性发现转化为可检验假设;
- 帮助写出更清晰的研究报告语言。
但它不适合直接做:
- 替你判断某类用户一定存在;
- 替你决定样本是否具有代表性;
- 替你虚构不存在的访谈证据;
- 替你完成统计显著性判断;
- 替你忽略伦理和隐私问题。
一句话总结:
AI 可以帮助我们更快地整理证据,但不能替代我们对证据质量的判断。
三、工作流:从原始材料到画像与场景
下面是一套可以直接用于科研、用户体验研究或产品分析的工作流。
Step 1:整理输入材料,不要一上来就让 AI “生成画像”
在使用 AI 前,先准备好材料。输入质量决定输出质量。
你可以准备以下材料:
- 访谈逐字稿
- 可用性测试观察记录
- 开放式问卷回答
- 客服反馈与用户评论
- 用户任务记录
- 基本人口统计信息
- 产品使用背景说明
建议整理成如下格式:
项目背景: 我们正在研究一款面向研究生和青年教师的文献管理工具。 研究目标: 理解用户在文献收集、阅读、标注、引用和写作中的主要痛点。 样本说明: 共访谈12名用户,其中博士生6名,硕士生3名,青年教师3名。 材料类型: 半结构化访谈逐字稿。 分析目标: 希望从访谈中提炼用户目标、任务场景、痛点、行为策略,并形成初步用户画像。注意:如果材料涉及真实用户,请先做匿名化处理。
例如:
- 删除姓名;
- 删除手机号、邮箱、学校、公司;
- 删除可识别个人身份的细节;
- 用“受访者P01、P02”替代真实身份;
- 对敏感经历进行概括化处理。
四、Prompt 1:从访谈文本中提取结构化研究信息
这是最基础也最重要的 Prompt。
你可以直接复制使用。
你是一名用户体验研究助理。请基于我提供的访谈材料,进行结构化分析。 研究主题: 【填写你的研究主题】 目标用户: 【填写目标用户群体】 请完成以下任务: 1. 提取每位受访者的核心任务目标。 2. 提取用户在完成任务过程中的主要行为路径。 3. 提取用户遇到的痛点、障碍、困惑和 workaround。 4. 提取用户表达出的情绪与态度。 5. 提取影响用户体验的情境因素,例如时间压力、设备环境、知识水平、协作关系等。 6. 请不要编造材料中没有出现的信息。 7. 每一个判断都要尽量附上对应的原文证据或受访者编号。 8. 最后请用表格输出。 输出字段包括: 受访者编号 / 用户目标 / 典型任务 / 行为路径 / 痛点 / workaround / 情绪态度 / 情境因素 / 证据摘录这个 Prompt 的重点不是“让 AI 总结”,而是要求它:
- 按字段提取;
- 不编造;
- 附证据;
- 保留受访者编号;
- 输出可审查的表格。
五、Prompt 2:从个体材料中识别跨用户模式
第一步是个体级别分析,第二步是跨个体模式识别。
你是一名用户研究方法专家。请基于上一步的结构化表格,识别跨用户的共性模式和差异模式。 请完成以下任务: 1. 找出反复出现的用户目标。 2. 找出高频痛点,并统计涉及的受访者编号。 3. 找出不同用户之间的关键差异,例如经验水平、使用频率、任务复杂度、协作需求、工具熟练度。 4. 将相似的痛点合并为主题,但不要过度合并。 5. 区分“明确证据支持的发现”和“需要进一步验证的推测”。 6. 输出一个主题矩阵。 输出字段包括: 主题名称 / 主题解释 / 涉及用户 / 证据摘要 / 可能影响的用户体验指标 / 研究者备注这里我特别建议保留一个字段:可能影响的用户体验指标。
因为如果我们只停留在“痛点主题”,很容易变成定性描述;但如果把痛点和指标连接起来,就可以进入量化研究。
例如:
| 痛点主题 | 可能影响的指标 |
|---|---|
| 找不到引用导出入口 | 任务完成率、任务时间、错误率 |
| 文献标签体系混乱 | 查找成功率、主观满意度 |
| 多设备同步不稳定 | 任务中断率、信任评分 |
| 不知道如何与写作软件联动 | 学习成本、SUS 得分 |
用户体验研究的关键,就是把“用户说的不舒服”转化为“可以被观察、记录和分析的指标”。
六、Prompt 3:生成用户画像,但必须基于证据
完成前两步之后,才适合让 AI 生成用户画像。
你是一名资深用户体验研究员。请基于前面的访谈结构化分析和主题矩阵,生成初步用户画像。 要求: 1. 每个画像必须来自材料中反复出现的行为模式,而不是凭空想象。 2. 每个画像需要说明其代表的用户特征、核心任务、主要痛点、典型场景、成功标准。 3. 每个画像都要标注支持该画像的受访者编号。 4. 不要使用夸张或刻板印象式命名。 5. 请明确说明每个画像的证据强度:强 / 中 / 弱。 6. 请指出每个画像还需要通过哪些数据进一步验证。 每个画像请按以下结构输出: 画像名称: 代表用户: 支持证据: 核心目标: 典型任务: 关键行为: 主要痛点: 常见 workaround: 使用情境: 成功标准: 可能影响的 UX 指标: 后续验证建议: 证据强度:这个 Prompt 和普通画像生成最大的不同是:它要求 AI 标注证据强度和验证建议。
这非常重要。
因为用户画像不是终点,而是一个研究中间产物。它应该帮助我们形成后续研究问题,例如:
- 这个用户群是否真的占主要比例?
- 他们的问题是否比其他群体更严重?
- 某个设计改版能否显著提高他们的任务完成率?
- 他们的满意度是否低于其他用户?
- 某个痛点是否会影响续费、留存或推荐意愿?
七、示例:文献管理工具用户画像
假设我们研究的是一款文献管理工具,AI 基于访谈材料可能输出这样的画像:
用户画像 A:任务驱动型论文写作者
代表用户:正在写毕业论文、投稿论文或课题报告的研究生和青年教师。
支持证据:P01、P03、P05、P08 多次提到“赶 deadline”“引用格式反复修改”“写作时找不到之前标注过的内容”。
核心目标:在写作过程中快速找到相关文献、准确插入引用,并减少格式调整成本。
典型任务:
- 收集某一主题下的核心文献;
- 阅读并标注重点段落;
- 写作时检索已有文献;
- 将引用插入 Word、LaTeX 或其他写作环境;
- 按期刊或学校格式导出参考文献。
关键行为:
- 先在数据库或搜索引擎中下载文献;
- 将 PDF 导入文献管理软件;
- 用标签、文件夹或笔记标记主题;
- 写作时通过关键词回忆文献;
- 反复检查引用格式是否正确。
主要痛点:
- 标注内容和写作环境之间割裂;
- 引用格式转换不稳定;
- 文献越多,越难找回曾经读过的内容;
- 不同设备之间同步不及时;
- 对高级功能依赖教程或同门经验。
常见 workaround:
- 用 Excel 额外维护文献清单;
- 用微信文件传输助手保存重要 PDF;
- 在文件名中加入关键词;
- 将常用引用格式手动保存为模板;
- 截图保存关键段落。
使用情境:
- 写作 deadline 临近;
- 同时处理多个研究主题;
- 多设备切换;
- 与导师或合作者共享文献;
- 对格式错误容忍度低。
成功标准:
- 能在短时间内找到目标文献;
- 引用插入和格式导出稳定;
- 标注内容能被快速检索;
- 不需要反复查教程;
- 写作流程不中断。
可能影响的 UX 指标:
- 查找文献任务完成率;
- 查找任务时间;
- 引用插入错误率;
- 用户主观满意度;
- SUS 或 UMUX-LITE 得分;
- 推荐意愿;
- 留存率。
后续验证建议:
- 设计一个“在已有文献库中找到某篇文献并插入引用”的任务测试;
- 记录任务完成率、任务时间、错误次数;
- 对比新手用户与高频用户的表现差异;
- 用标准化问卷测量可用性和满意度;
- 分析是否存在经验水平与任务表现之间的关系。
证据强度:中。
原因:多个用户都提到类似任务和痛点,但仍需扩大样本并结合行为数据验证。
这个画像比“32岁博士生,喜欢高效工具”更有价值,因为它已经把:
- 用户目标;
- 任务流程;
- 痛点;
- workaround;
- 场景变量;
- UX 指标;
- 后续验证路径;
连接到了一起。
这才是适合科研和产品决策的用户画像。
八、Prompt 4:把用户画像转化为使用场景
画像回答“谁”,场景回答“在什么情况下做什么任务”。
一个好的用户场景不应该只是故事,而应该包含:
- 触发条件;
- 用户目标;
- 环境约束;
- 操作路径;
- 失败节点;
- 情绪变化;
- 成功标准;
- 可测指标。
可使用以下 Prompt:
请基于以下用户画像,生成3个高价值使用场景。 要求: 1. 每个场景必须包含触发条件、用户目标、环境约束、操作路径、潜在失败点、用户情绪、成功标准。 2. 每个场景都要说明它适合用于哪类研究:访谈、可用性测试、问卷调查、A/B测试或日志分析。 3. 每个场景都要转化为至少2个可验证的研究假设。 4. 每个研究假设都要匹配可能的用户体验指标。 5. 不要编造过度戏剧化的故事,要保持研究报告风格。 输出结构: 场景名称: 适用画像: 触发条件: 用户目标: 环境约束: 典型操作路径: 潜在失败点: 用户情绪: 成功标准: 适合的研究方法: 可验证假设: 对应指标:九、示例:deadline 前的引用插入任务
场景名称
论文截稿前的引用插入与格式检查
适用画像
任务驱动型论文写作者
触发条件
用户正在修改论文终稿,需要在 30 分钟内补充 5 篇参考文献,并确保引用格式符合目标期刊要求。
用户目标
快速找到对应文献,插入正文引用,并生成正确的参考文献列表。
环境约束
- 时间压力较高;
- 用户可能同时打开 Word、PDF 阅读器、文献管理工具和浏览器;
- 用户对格式错误较敏感;
- 用户不愿意在此时学习复杂的新功能。
典型操作路径
- 打开论文文档;
- 根据正文内容回忆需要引用的文献;
- 在文献管理工具中搜索文献;
- 选择目标文献;
- 插入引用;
- 切换引用格式;
- 检查文末参考文献;
- 手动修正异常格式。
潜在失败点
- 搜索结果过多,用户找不到目标文献;
- 文献元数据不完整;
- 插件连接失败;
- 引用格式转换错误;
- 用户无法判断错误来自软件还是文献数据源;
- 用户最终选择手动编辑参考文献。
用户情绪
从“希望快速完成”转向“焦虑、怀疑工具可靠性、倾向于手动处理”。
成功标准
- 用户能够顺利找到目标文献;
- 插入引用过程不中断;
- 引用格式准确;
- 用户不需要额外查教程;
- 用户认为工具节省了时间而不是增加负担。
适合的研究方法
- 可用性测试;
- 任务完成率分析;
- 任务时间分析;
- 错误率统计;
- 事后满意度问卷;
- 行为日志分析。
可验证假设
假设 1:如果搜索结果页面增加“最近阅读”和“高频引用”排序,用户找到目标文献的任务时间会降低。
对应指标:
- 查找目标文献的任务时间;
- 搜索次数;
- 点击错误次数;
- 主观难度评分。
假设 2:如果系统在插入引用前提示文献元数据缺失,引用格式错误率会降低。
对应指标:
- 引用格式错误率;
- 用户手动修改次数;
- 任务完成率;
- 满意度评分。
假设 3:如果引用插件失败时提供明确的错误原因与修复建议,用户放弃任务的比例会降低。
对应指标:
- 任务放弃率;
- 错误恢复成功率;
- 用户信任评分;
- SUS 或 UMUX-LITE 得分。
十、如何让 AI 输出更可靠?五个关键技巧
1. 要求 AI 引用证据
不要只问:
请帮我总结用户画像。而要问:
请为每个画像标注支持证据,包括受访者编号和原文摘录。没有证据的画像,是故事,不是研究发现。
2. 要求区分“发现”和“推测”
AI 很容易把合理推测写成确定结论。你要明确要求它区分:
- 明确出现的事实;
- 多名用户重复提到的模式;
- 研究者推测;
- 需要进一步验证的问题。
可加入一句:
请将输出分为“材料明确支持的发现”和“需要进一步验证的推测”,不要混合呈现。3. 要求保留反例和少数派
在用户研究中,少数派并不一定不重要。
尤其当少数用户代表高价值用户、专家用户、极端场景用户时,他们的反馈可能非常关键。
可使用:
请识别材料中的反例、少数派观点和与主流模式不一致的用户行为,并说明这些差异可能意味着什么。4. 不要让 AI 过早命名画像
一旦画像有了名字,团队容易产生认知固化。
建议先做行为模式聚类,再命名。
例如不要让 AI 一开始就生成:
- 效率达人;
- 焦虑新手;
- 沉默专家。
而是先让它识别:
- 高频写作任务用户;
- 多工具协作用户;
- 低经验依赖教程用户;
- 高风险格式敏感用户。
这些名称虽然不够“营销化”,但更接近研究事实。
5. 把画像连接到量化指标
这是最重要的一步。
用户画像不应该停留在“谁很痛苦”,而应该进一步问:
- 这个痛点会影响什么指标?
- 是否可以通过任务测试测出来?
- 是否可以通过问卷测出来?
- 是否可以通过日志数据验证?
- 改版后能否比较前后差异?
例如:
| 定性发现 | 可量化指标 |
|---|---|
| 用户找不到关键功能 | 任务完成率、首次点击位置、任务时间 |
| 用户不理解术语 | 错误率、求助次数、主观难度评分 |
| 用户对系统不信任 | 信任评分、放弃率、重复检查次数 |
| 用户觉得流程繁琐 | SUS、UMUX-LITE、SEQ、任务时间 |
| 用户手动绕开系统 | workaround 次数、功能使用率、日志路径 |
定性研究帮助我们发现问题,量化研究帮助我们判断问题的范围、严重程度和改进效果。
十一、完整 Prompt 模板
下面是一份可以直接收藏使用的完整 Prompt。
你是一名资深用户体验研究员和定性研究分析师。请基于我提供的用户访谈、开放题回答或观察记录,辅助我构建用户画像与使用场景。 研究背景: 【填写项目背景】 研究目标: 【填写研究目标】 目标用户: 【填写目标用户】 样本说明: 【填写样本数量、用户类型、招募方式等】 材料内容: 【粘贴匿名化后的访谈文本或观察记录】 请按照以下步骤分析: 第一步:个体级信息提取 请逐位受访者提取: - 核心目标 - 典型任务 - 行为路径 - 痛点和障碍 - workaround - 情绪态度 - 情境因素 - 关键原文证据 第二步:跨用户主题分析 请识别: - 高频目标 - 高频痛点 - 行为模式 - 用户差异 - 少数派观点 - 反例 - 需要进一步验证的推测 第三步:生成用户画像 每个画像包括: - 画像名称 - 代表用户 - 支持证据 - 核心目标 - 典型任务 - 关键行为 - 主要痛点 - workaround - 使用情境 - 成功标准 - 可能影响的用户体验指标 - 后续验证建议 - 证据强度:强 / 中 / 弱 第四步:生成使用场景 每个场景包括: - 场景名称 - 适用画像 - 触发条件 - 用户目标 - 环境约束 - 典型操作路径 - 潜在失败点 - 用户情绪 - 成功标准 - 适合的研究方法 - 可验证假设 - 对应指标 输出要求: 1. 不要编造材料中没有出现的信息。 2. 每个重要判断都要尽量附上受访者编号或原文证据。 3. 区分“明确发现”和“推测”。 4. 保留少数派观点和反例。 5. 语言保持研究报告风格,避免营销化和刻板印象。 6. 最后请给出下一步研究建议,包括可以进行的问卷、可用性测试、A/B测试或日志分析。十二、从 AI 输出到研究报告:还需要人工做什么?
AI 可以帮我们完成初步分析,但科研工作不能止步于此。
研究者至少需要继续做五件事。
1. 回到原始材料核对
AI 可能会误读、过度概括或遗漏细节。所有重要发现都应回到原文核对。
2. 检查样本偏差
例如,你的样本是否只来自高学历、高频使用、愿意表达意见的人?如果是,画像就不能代表全部用户。
3. 进行研究者间一致性检查
如果是严肃研究,可以让两名研究者分别编码,再比较一致性。AI 可辅助整理,但不应成为唯一编码者。
4. 将画像转化为可验证假设
这是从“定性洞察”进入“量化用户体验研究”的关键。
例如:
- 新手用户是否比专家用户任务时间更长?
- 多工具协作用户是否满意度更低?
- 高时间压力场景下错误率是否显著增加?
- 改进搜索排序后是否能提升查找成功率?
5. 用标准化指标验证
可以考虑使用:
- 任务完成率;
- 任务时间;
- 错误率;
- SEQ,单题任务难度评分;
- SUS,系统可用性量表;
- UMUX-LITE,简短可用性量表;
- NPS,推荐意愿;
- 用户留存和功能使用日志。
用户画像是研究的起点,不是研究的终点。
十三、一个更严谨的判断标准:什么是“好画像”?
你可以用下面这张清单检查 AI 生成的画像是否可用。
| 检查项 | 合格标准 |
|---|---|
| 是否基于真实材料 | 有受访者编号或原文证据 |
| 是否描述具体任务 | 不只描述性格,而是描述行为 |
| 是否有情境变量 | 包括时间、设备、协作、经验等 |
| 是否有痛点机制 | 解释为什么会出问题 |
| 是否保留差异 | 不把所有用户混成一种人 |
| 是否能指导设计 | 能导出功能、流程或内容优化方向 |
| 是否能进入量化验证 | 能对应任务完成率、时间、错误率、满意度等指标 |
| 是否避免刻板印象 | 不用年龄、性别、职业做过度推断 |
| 是否说明证据强度 | 明确强、中、弱 |
| 是否提出下一步研究 | 有可执行的验证计划 |
如果一个画像不能指导研究问题、不能连接指标、不能被验证,它就更像内容包装,而不是研究工具。
十四、结语:AI 让用户画像更快,但研究者让它更可信
AI 时代,用户画像的生产成本会大幅降低。
但越是容易生成,我们越要警惕“看起来合理”的幻觉。
真正有价值的用户画像,不是 AI 写得多像一个人,而是它能否回答以下问题:
- 它基于哪些证据?
- 它代表哪类行为模式?
- 它解释了什么用户问题?
- 它能指导什么设计决策?
- 它可以通过哪些指标验证?
- 它有哪些不确定性和样本限制?
对于科研者、用户研究者和产品团队来说,AI 最好的用法不是替代判断,而是帮助我们更系统地整理材料、更清楚地表达发现、更快速地生成假设,并把定性洞察连接到量化验证。
一句话总结:
不要让 AI 替你“编用户”,要让 AI 帮你“整理证据、发现模式、生成假设、连接指标”。
