当前位置：首页 > news >正文

AI 辅助用户画像与场景构建：从访谈文本到可验证的研究假设

news 2026/7/17 8:54:04

在用户研究中，用户画像和使用场景常常被当作“设计共识工具”使用：它们帮助团队理解用户是谁、用户想完成什么、用户为什么会失败、产品应该优先解决什么问题。

但在很多实际项目中，用户画像也容易变成一种“漂亮但不严谨”的文档：

画像来自少量访谈，但没有说明证据来源；
人设名称很生动，但与真实行为数据脱节；
场景故事写得完整，却没有转化成可验证的研究假设；
团队记住了“焦虑的宝妈”“忙碌的白领”，却忘记了背后的任务、指标和样本偏差。

如果我们把 AI 用在用户画像构建中，最有价值的地方并不是让 AI “编几个用户”，而是让 AI 充当一个定性材料整理助手、证据索引助手、模式识别助手和研究假设生成助手。

一、为什么用户画像不应该只是“人物小传”？

很多人理解的用户画像是这样的：

李女士，32岁，一线城市白领，工作繁忙，重视效率，喜欢简洁的产品体验。

这种画像看起来合理，但科研价值和决策价值都有限。

它的问题在于：

描述过于笼统
“重视效率”“喜欢简洁”几乎适用于所有用户，无法指导设计决策。
缺少行为证据
她为什么重视效率？在哪些任务中体现？她放弃操作的节点在哪里？
缺少任务情境
用户不是抽象地使用产品，而是在具体场景下完成任务。
缺少可量化指标
如果后续要验证这个画像是否重要，我们要测什么？完成率？任务时间？错误率？满意度？留存率？
缺少群体边界
这个画像代表多少人？与其他用户群有什么差异？是否只是研究者对少数人的印象？

因此，更适合科研与产品决策的用户画像，应该包含以下要素：

模块	关键问题
用户背景	用户处于什么角色、经验水平、资源条件中？
核心任务	用户真正想完成什么？
行为路径	用户通常如何完成任务？
痛点与障碍	用户在哪些节点失败、犹豫或绕路？
目标与动机	用户为什么要完成这个任务？
情境变量	什么环境、时间压力、设备条件会影响行为？
证据来源	哪些访谈原话、观察记录或问卷回答支持该判断？
可验证假设	后续可以用什么指标和方法验证？

AI 的价值，正是帮助研究者在这些模块之间建立更系统的连接。

二、AI 在用户画像构建中的正确定位

在这类任务中，AI 不应该被当成“创意文案生成器”，而应该被当成一个研究助理。

它适合做：

对访谈文本进行摘要；
从原始材料中提取用户目标、痛点、行为和情绪；
帮助研究者初步编码；
聚类相似主题；
发现反复出现的场景；
为画像生成结构化模板；
将定性发现转化为可检验假设；
帮助写出更清晰的研究报告语言。

但它不适合直接做：

替你判断某类用户一定存在；
替你决定样本是否具有代表性；
替你虚构不存在的访谈证据；
替你完成统计显著性判断；
替你忽略伦理和隐私问题。

一句话总结：

AI 可以帮助我们更快地整理证据，但不能替代我们对证据质量的判断。

三、工作流：从原始材料到画像与场景

下面是一套可以直接用于科研、用户体验研究或产品分析的工作流。

Step 1：整理输入材料，不要一上来就让 AI “生成画像”

在使用 AI 前，先准备好材料。输入质量决定输出质量。

你可以准备以下材料：

访谈逐字稿
可用性测试观察记录
开放式问卷回答
客服反馈与用户评论
用户任务记录
基本人口统计信息
产品使用背景说明

建议整理成如下格式：

项目背景： 我们正在研究一款面向研究生和青年教师的文献管理工具。 研究目标： 理解用户在文献收集、阅读、标注、引用和写作中的主要痛点。 样本说明： 共访谈12名用户，其中博士生6名，硕士生3名，青年教师3名。 材料类型： 半结构化访谈逐字稿。 分析目标： 希望从访谈中提炼用户目标、任务场景、痛点、行为策略，并形成初步用户画像。

注意：如果材料涉及真实用户，请先做匿名化处理。

例如：

删除姓名；
删除手机号、邮箱、学校、公司；
删除可识别个人身份的细节；
用“受访者P01、P02”替代真实身份；
对敏感经历进行概括化处理。

四、Prompt 1：从访谈文本中提取结构化研究信息

这是最基础也最重要的 Prompt。

你可以直接复制使用。

你是一名用户体验研究助理。请基于我提供的访谈材料，进行结构化分析。 研究主题： 【填写你的研究主题】 目标用户： 【填写目标用户群体】 请完成以下任务： 1. 提取每位受访者的核心任务目标。 2. 提取用户在完成任务过程中的主要行为路径。 3. 提取用户遇到的痛点、障碍、困惑和 workaround。 4. 提取用户表达出的情绪与态度。 5. 提取影响用户体验的情境因素，例如时间压力、设备环境、知识水平、协作关系等。 6. 请不要编造材料中没有出现的信息。 7. 每一个判断都要尽量附上对应的原文证据或受访者编号。 8. 最后请用表格输出。 输出字段包括： 受访者编号 / 用户目标 / 典型任务 / 行为路径 / 痛点 / workaround / 情绪态度 / 情境因素 / 证据摘录

这个 Prompt 的重点不是“让 AI 总结”，而是要求它：

按字段提取；
不编造；
附证据；
保留受访者编号；
输出可审查的表格。

五、Prompt 2：从个体材料中识别跨用户模式

第一步是个体级别分析，第二步是跨个体模式识别。

你是一名用户研究方法专家。请基于上一步的结构化表格，识别跨用户的共性模式和差异模式。 请完成以下任务： 1. 找出反复出现的用户目标。 2. 找出高频痛点，并统计涉及的受访者编号。 3. 找出不同用户之间的关键差异，例如经验水平、使用频率、任务复杂度、协作需求、工具熟练度。 4. 将相似的痛点合并为主题，但不要过度合并。 5. 区分“明确证据支持的发现”和“需要进一步验证的推测”。 6. 输出一个主题矩阵。 输出字段包括： 主题名称 / 主题解释 / 涉及用户 / 证据摘要 / 可能影响的用户体验指标 / 研究者备注

这里我特别建议保留一个字段：可能影响的用户体验指标。

因为如果我们只停留在“痛点主题”，很容易变成定性描述；但如果把痛点和指标连接起来，就可以进入量化研究。

例如：

痛点主题	可能影响的指标
找不到引用导出入口	任务完成率、任务时间、错误率
文献标签体系混乱	查找成功率、主观满意度
多设备同步不稳定	任务中断率、信任评分
不知道如何与写作软件联动	学习成本、SUS 得分

用户体验研究的关键，就是把“用户说的不舒服”转化为“可以被观察、记录和分析的指标”。

六、Prompt 3：生成用户画像，但必须基于证据

完成前两步之后，才适合让 AI 生成用户画像。

你是一名资深用户体验研究员。请基于前面的访谈结构化分析和主题矩阵，生成初步用户画像。 要求： 1. 每个画像必须来自材料中反复出现的行为模式，而不是凭空想象。 2. 每个画像需要说明其代表的用户特征、核心任务、主要痛点、典型场景、成功标准。 3. 每个画像都要标注支持该画像的受访者编号。 4. 不要使用夸张或刻板印象式命名。 5. 请明确说明每个画像的证据强度：强 / 中 / 弱。 6. 请指出每个画像还需要通过哪些数据进一步验证。 每个画像请按以下结构输出： 画像名称： 代表用户： 支持证据： 核心目标： 典型任务： 关键行为： 主要痛点： 常见 workaround： 使用情境： 成功标准： 可能影响的 UX 指标： 后续验证建议： 证据强度：

这个 Prompt 和普通画像生成最大的不同是：它要求 AI 标注证据强度和验证建议。

这非常重要。

因为用户画像不是终点，而是一个研究中间产物。它应该帮助我们形成后续研究问题，例如：

这个用户群是否真的占主要比例？
他们的问题是否比其他群体更严重？
某个设计改版能否显著提高他们的任务完成率？
他们的满意度是否低于其他用户？
某个痛点是否会影响续费、留存或推荐意愿？

七、示例：文献管理工具用户画像

假设我们研究的是一款文献管理工具，AI 基于访谈材料可能输出这样的画像：

用户画像 A：任务驱动型论文写作者

代表用户：正在写毕业论文、投稿论文或课题报告的研究生和青年教师。

支持证据：P01、P03、P05、P08 多次提到“赶 deadline”“引用格式反复修改”“写作时找不到之前标注过的内容”。

核心目标：在写作过程中快速找到相关文献、准确插入引用，并减少格式调整成本。

典型任务：

收集某一主题下的核心文献；
阅读并标注重点段落；
写作时检索已有文献；
将引用插入 Word、LaTeX 或其他写作环境；
按期刊或学校格式导出参考文献。

关键行为：

先在数据库或搜索引擎中下载文献；
将 PDF 导入文献管理软件；
用标签、文件夹或笔记标记主题；
写作时通过关键词回忆文献；
反复检查引用格式是否正确。

主要痛点：

标注内容和写作环境之间割裂；
引用格式转换不稳定；
文献越多，越难找回曾经读过的内容；
不同设备之间同步不及时；
对高级功能依赖教程或同门经验。

常见 workaround：

用 Excel 额外维护文献清单；
用微信文件传输助手保存重要 PDF；
在文件名中加入关键词；
将常用引用格式手动保存为模板；
截图保存关键段落。

使用情境：

写作 deadline 临近；
同时处理多个研究主题；
多设备切换；
与导师或合作者共享文献；
对格式错误容忍度低。

成功标准：

能在短时间内找到目标文献；
引用插入和格式导出稳定；
标注内容能被快速检索；
不需要反复查教程；
写作流程不中断。

可能影响的 UX 指标：

查找文献任务完成率；
查找任务时间；
引用插入错误率；
用户主观满意度；
SUS 或 UMUX-LITE 得分；
推荐意愿；
留存率。

后续验证建议：

设计一个“在已有文献库中找到某篇文献并插入引用”的任务测试；
记录任务完成率、任务时间、错误次数；
对比新手用户与高频用户的表现差异；
用标准化问卷测量可用性和满意度；
分析是否存在经验水平与任务表现之间的关系。

证据强度：中。
原因：多个用户都提到类似任务和痛点，但仍需扩大样本并结合行为数据验证。

这个画像比“32岁博士生，喜欢高效工具”更有价值，因为它已经把：

用户目标；
任务流程；
痛点；
workaround；
场景变量；
UX 指标；
后续验证路径；

连接到了一起。

这才是适合科研和产品决策的用户画像。

八、Prompt 4：把用户画像转化为使用场景

画像回答“谁”，场景回答“在什么情况下做什么任务”。

一个好的用户场景不应该只是故事，而应该包含：

触发条件；
用户目标；
环境约束；
操作路径；
失败节点；
情绪变化；
成功标准；
可测指标。

可使用以下 Prompt：

请基于以下用户画像，生成3个高价值使用场景。 要求： 1. 每个场景必须包含触发条件、用户目标、环境约束、操作路径、潜在失败点、用户情绪、成功标准。 2. 每个场景都要说明它适合用于哪类研究：访谈、可用性测试、问卷调查、A/B测试或日志分析。 3. 每个场景都要转化为至少2个可验证的研究假设。 4. 每个研究假设都要匹配可能的用户体验指标。 5. 不要编造过度戏剧化的故事，要保持研究报告风格。 输出结构： 场景名称： 适用画像： 触发条件： 用户目标： 环境约束： 典型操作路径： 潜在失败点： 用户情绪： 成功标准： 适合的研究方法： 可验证假设： 对应指标：

九、示例：deadline 前的引用插入任务

场景名称

论文截稿前的引用插入与格式检查

适用画像

任务驱动型论文写作者

触发条件

用户正在修改论文终稿，需要在 30 分钟内补充 5 篇参考文献，并确保引用格式符合目标期刊要求。

用户目标

快速找到对应文献，插入正文引用，并生成正确的参考文献列表。

环境约束

时间压力较高；
用户可能同时打开 Word、PDF 阅读器、文献管理工具和浏览器；
用户对格式错误较敏感；
用户不愿意在此时学习复杂的新功能。

典型操作路径

打开论文文档；
根据正文内容回忆需要引用的文献；
在文献管理工具中搜索文献；
选择目标文献；
插入引用；
切换引用格式；
检查文末参考文献；
手动修正异常格式。

潜在失败点

搜索结果过多，用户找不到目标文献；
文献元数据不完整；
插件连接失败；
引用格式转换错误；
用户无法判断错误来自软件还是文献数据源；
用户最终选择手动编辑参考文献。

用户情绪

从“希望快速完成”转向“焦虑、怀疑工具可靠性、倾向于手动处理”。

成功标准

用户能够顺利找到目标文献；
插入引用过程不中断；
引用格式准确；
用户不需要额外查教程；
用户认为工具节省了时间而不是增加负担。

适合的研究方法

可用性测试；
任务完成率分析；
任务时间分析；
错误率统计；
事后满意度问卷；
行为日志分析。

可验证假设

假设 1：如果搜索结果页面增加“最近阅读”和“高频引用”排序，用户找到目标文献的任务时间会降低。

对应指标：

查找目标文献的任务时间；
搜索次数；
点击错误次数；
主观难度评分。

假设 2：如果系统在插入引用前提示文献元数据缺失，引用格式错误率会降低。

对应指标：

引用格式错误率；
用户手动修改次数；
任务完成率；
满意度评分。

假设 3：如果引用插件失败时提供明确的错误原因与修复建议，用户放弃任务的比例会降低。

对应指标：

任务放弃率；
错误恢复成功率；
用户信任评分；
SUS 或 UMUX-LITE 得分。

十、如何让 AI 输出更可靠？五个关键技巧

1. 要求 AI 引用证据

不要只问：

请帮我总结用户画像。

而要问：

请为每个画像标注支持证据，包括受访者编号和原文摘录。

没有证据的画像，是故事，不是研究发现。

2. 要求区分“发现”和“推测”

AI 很容易把合理推测写成确定结论。你要明确要求它区分：

明确出现的事实；
多名用户重复提到的模式；
研究者推测；
需要进一步验证的问题。

可加入一句：

请将输出分为“材料明确支持的发现”和“需要进一步验证的推测”，不要混合呈现。

3. 要求保留反例和少数派

在用户研究中，少数派并不一定不重要。

尤其当少数用户代表高价值用户、专家用户、极端场景用户时，他们的反馈可能非常关键。

可使用：

请识别材料中的反例、少数派观点和与主流模式不一致的用户行为，并说明这些差异可能意味着什么。

4. 不要让 AI 过早命名画像

一旦画像有了名字，团队容易产生认知固化。

建议先做行为模式聚类，再命名。

例如不要让 AI 一开始就生成：

效率达人；
焦虑新手；
沉默专家。

而是先让它识别：

高频写作任务用户；
多工具协作用户；
低经验依赖教程用户；
高风险格式敏感用户。

这些名称虽然不够“营销化”，但更接近研究事实。

5. 把画像连接到量化指标

这是最重要的一步。

用户画像不应该停留在“谁很痛苦”，而应该进一步问：

这个痛点会影响什么指标？
是否可以通过任务测试测出来？
是否可以通过问卷测出来？
是否可以通过日志数据验证？
改版后能否比较前后差异？

例如：

定性发现	可量化指标
用户找不到关键功能	任务完成率、首次点击位置、任务时间
用户不理解术语	错误率、求助次数、主观难度评分
用户对系统不信任	信任评分、放弃率、重复检查次数
用户觉得流程繁琐	SUS、UMUX-LITE、SEQ、任务时间
用户手动绕开系统	workaround 次数、功能使用率、日志路径

定性研究帮助我们发现问题，量化研究帮助我们判断问题的范围、严重程度和改进效果。

十一、完整 Prompt 模板

下面是一份可以直接收藏使用的完整 Prompt。

你是一名资深用户体验研究员和定性研究分析师。请基于我提供的用户访谈、开放题回答或观察记录，辅助我构建用户画像与使用场景。 研究背景： 【填写项目背景】 研究目标： 【填写研究目标】 目标用户： 【填写目标用户】 样本说明： 【填写样本数量、用户类型、招募方式等】 材料内容： 【粘贴匿名化后的访谈文本或观察记录】 请按照以下步骤分析： 第一步：个体级信息提取 请逐位受访者提取： - 核心目标 - 典型任务 - 行为路径 - 痛点和障碍 - workaround - 情绪态度 - 情境因素 - 关键原文证据 第二步：跨用户主题分析 请识别： - 高频目标 - 高频痛点 - 行为模式 - 用户差异 - 少数派观点 - 反例 - 需要进一步验证的推测 第三步：生成用户画像 每个画像包括： - 画像名称 - 代表用户 - 支持证据 - 核心目标 - 典型任务 - 关键行为 - 主要痛点 - workaround - 使用情境 - 成功标准 - 可能影响的用户体验指标 - 后续验证建议 - 证据强度：强 / 中 / 弱 第四步：生成使用场景 每个场景包括： - 场景名称 - 适用画像 - 触发条件 - 用户目标 - 环境约束 - 典型操作路径 - 潜在失败点 - 用户情绪 - 成功标准 - 适合的研究方法 - 可验证假设 - 对应指标 输出要求： 1. 不要编造材料中没有出现的信息。 2. 每个重要判断都要尽量附上受访者编号或原文证据。 3. 区分“明确发现”和“推测”。 4. 保留少数派观点和反例。 5. 语言保持研究报告风格，避免营销化和刻板印象。 6. 最后请给出下一步研究建议，包括可以进行的问卷、可用性测试、A/B测试或日志分析。

十二、从 AI 输出到研究报告：还需要人工做什么？

AI 可以帮我们完成初步分析，但科研工作不能止步于此。

研究者至少需要继续做五件事。

1. 回到原始材料核对

AI 可能会误读、过度概括或遗漏细节。所有重要发现都应回到原文核对。

2. 检查样本偏差

例如，你的样本是否只来自高学历、高频使用、愿意表达意见的人？如果是，画像就不能代表全部用户。

3. 进行研究者间一致性检查

如果是严肃研究，可以让两名研究者分别编码，再比较一致性。AI 可辅助整理，但不应成为唯一编码者。

4. 将画像转化为可验证假设

这是从“定性洞察”进入“量化用户体验研究”的关键。

例如：

新手用户是否比专家用户任务时间更长？
多工具协作用户是否满意度更低？
高时间压力场景下错误率是否显著增加？
改进搜索排序后是否能提升查找成功率？

5. 用标准化指标验证

可以考虑使用：

任务完成率；
任务时间；
错误率；
SEQ，单题任务难度评分；
SUS，系统可用性量表；
UMUX-LITE，简短可用性量表；
NPS，推荐意愿；
用户留存和功能使用日志。

用户画像是研究的起点，不是研究的终点。

十三、一个更严谨的判断标准：什么是“好画像”？

你可以用下面这张清单检查 AI 生成的画像是否可用。

检查项	合格标准
是否基于真实材料	有受访者编号或原文证据
是否描述具体任务	不只描述性格，而是描述行为
是否有情境变量	包括时间、设备、协作、经验等
是否有痛点机制	解释为什么会出问题
是否保留差异	不把所有用户混成一种人
是否能指导设计	能导出功能、流程或内容优化方向
是否能进入量化验证	能对应任务完成率、时间、错误率、满意度等指标
是否避免刻板印象	不用年龄、性别、职业做过度推断
是否说明证据强度	明确强、中、弱
是否提出下一步研究	有可执行的验证计划