我们团队只有两个人,因此绩效评估不能简单搞“平均主义”,也不能制造对立。我们设计了一套相互认可、指标透明、强制拉近的评分机制,目标是让两人最终得分差距控制在1分以内,既体现各自贡献,又维护团队凝聚力。
一、绩效评估方法
1.1 四个评分维度
任务完成度(40%)
依据Git提交记录、工时登记和任务看板(Trello)。每人负责的功能模块清晰划分:一人主攻后端+AI(郭),另一人主攻前端+测试(李)。任务按时完成得分;提前完成或主动承担额外任务加分;延期或出现重大bug扣分。
代码质量(25%)
两人互相审查对方的代码,结合静态检查工具(pylint/eslint)和测试覆盖率。评分维度包括:命名规范、注释清晰度、函数长度、重复代码、单元测试覆盖。
协作贡献(20%)
双向互评——每人给对方“协作表现”打分(1~5分),包括:响应速度、信息共享、帮助调试、文档更新等。然后取平均分作为各自得分。
创新与主动性(15%)
每人列出自己在本阶段提出的改进建议、解决的技术难题或编写的辅助工具,由对方确认是否属实。每项加一定分数。
1.2 核心设计:强制拉近机制
由于只有两人,我们约定:最终得分相差不得超过1分。如果原始分差大于1分,则通过调整“协作贡献”分数来拉平——因为协作本就是双向的,高分者主动承认对方帮助,低分者获得合理认可。这一机制避免了恶性竞争,鼓励互相补位。
二、第一阶段评分过程(示例)
假设第一阶段为期3周,两人分别完成以下工作:
郭(后端+AI)
完成用户/角色/权限/部门等12个RESTful API
集成通义千问API,实现智能对话
编写数据库初始化脚本
协助前端调试接口(共计5次)
李(前端+测试+语音)
完成主页面、AI对话页面、聊天页面
实现语音输入组件
编写20个功能测试用例
记录并跟踪bug列表
2.1 原始评分计算
任务完成度(满分40)
两人均按时完成分配任务,无延期。郭因额外协助前端调试,加1分;李因额外编写测试用例,加1分。
郭得分:40 + 1 = 41;李得分:40 + 1 = 41(满分40超出部分按40计,均记为40)。
代码质量(满分25)
代码审查互评结果:
郭的代码规范良好但缺少部分单元测试,李给出24分;
李的代码整洁但函数拆分略碎,郭给出23分。
平均后郭24分,李23分。
协作贡献(满分20)
双向互评(1~5分):
郭给李4.5分,李给郭5分。
平均分:(4.5+5)/2 = 4.75。
按比例换算:20分满分相当于4.75/5×20 = 19分,两人得分相同。
创新与主动性(满分15)
郭提出“在AI对话中直接执行登录/查询”优化方案,被采纳;编写数据库初始化自动检测脚本。两项合计加5分,得分15。
李提出“使用localStorage保存用户最后访问的标签页”,被采纳;编写测试数据生成脚本。两项合计加4分,得分14。
2.2 原始总分
郭:40(任务) + 24(质量) + 19(协作) + 15(创新) = 98分
李:40(任务) + 23(质量) + 19(协作) + 14(创新) = 96分
分差为2分,大于目标1分。
2.3 强制拉平调整
根据规则,通过调整“协作贡献”来缩小分差。协作是双向的,李在接口联调中得到郭多次帮助,郭在测试中依赖李的用例反馈。因此将李的协作贡献上调0.5分(相当于郭给李的评分从4.5升至5分),重新计算:
李协作分:(5+5)/2 = 5 → 20分满分得20。
李新总分:40 + 23 + 20 + 14 = 97分。
郭维持98分,分差1分,符合目标。
最终得分:郭98分,李97分,两人均评为A级。
三、总结与反思
这套两人绩效评估机制的核心不是“精确到小数点”,而是承认贡献差异,同时强制团结。第一阶段实施后,两人都对结果表示认可——郭认可自己的核心工作得到更高评分,李认可自己在协作和创新上的贡献没有被低估。分差1分既保持了激励,又不会引发不满。
下阶段我们将改进的地方:增加“用户满意度”维度(参考需求方反馈),以及引入更客观的代码量统计(如有效行数、圈复杂度)。但对于两人团队,我们认为相互尊重 + 透明规则 + 强制趋近是最实用的方案。
