当你询问一位管理者是否需要绩效评估,几乎都会答复“需要”,可员工们(被评估者)并不喜欢这种管理方式,其主要原因在于绩效评估与实际情况有大量误差,而且大多数人并不知道如何缩小误差。
很多管理者都希望通过几个简单的数字或者指标来快速确定一个人或者一个团队在过去一段时间对于公司业务的贡献。在这样一个理想的世界里,“绩效”是一个基于客观事实和数据所进行的“计算”工作,现如今,这种看上去简单有效的方式越来越行不通了,“绩效评估”逐渐演变成一项更依赖人为“判断”的工作。
亚当·斯密在他的著作《国富论》中所描绘的针扣厂中,10个工人对18道工序进行分工,每个人的产出都可以精准量化。然而在现代产业化进程中,人的“工具属性”已经逐渐被剥离,更多的“知识工作者”(见《德鲁克的管理思想精要》)开始涌现。例如对于一个“研发主管”或者“品牌总监”来说,我们很难找到精准的指标来衡量他们的产出。
业务和岗位越来越复杂导致“知识工作者”需要平衡多个目标,甚至有些时候多个目标之间是有冲突的。例如对于研发岗位来说,有限的时间精力下产出的代码质量和数量这两者之间就是不可调和的客观矛盾。
在这种时候,纯粹指标导向的绩效意义就有限了,因此,“判断”为主的绩效评估工作越来越受管理者的认可。
360度环评中的系统性“噪声”
一句话介绍360度环评那就是:通过全方位的评估维度和全方位的评价人范围对于被评人进行360度绩效判断。(下文简称“360”)
360是我一直在使用的绩效评估方法。360要求评估人不仅仅是领导者,也包含协作者和自身,这使得个人的工作并不再是为了取悦领导。另外更全面的评估维度摒弃了单一指标的方式,更符合知识工作类型的岗位要求。
乍一看360度评估反馈的确是更加优秀的体系。但是在过去的一轮轮实践中,我们还是会发现评估过程中的很多“噪声”。我们先来看看一个典型的360问卷的问题设置:
水平噪声:不同部门的整体评估尺度不一样(研发or营销)
360的“他评”环节一般会引入密切协作的同事进行评价,这些密切协作的同事有可能并不是同一个部门。不同的部门对于评估尺度的理解水平是不一样的。例如我们在过往的问卷数据中就可以明显感受到研发部门的评估总体比业务部门要更严苛一些,他们更少的使用“杰出”这类刻度。这就会导致评估人组成中,不同部门的比重不一样造成最后的数据结果差异巨大;
模式噪声:不同评估人的喜好不一样(发散or严谨)
除了团队整体评估水平差异导致的噪声以外,每个评估人自身的认知模式也会在不同被评人之间产生影响。例如A员工更喜欢严谨有计划有条理的协作者,而对发散型创造性思维的协作者则没有太多好感;再例如B员工对于不同岗位的重要性和工作难度理解不一,在最终评价时也会在无意中引入这些变量从而影响评估结果;这些种种在认知模式的差异也会最终影响评价结果,然而我们虽然知道有这些因素存在,但我们并无法改变评估的过程和结果。
情景噪声:评估当下的各类外界因素(心情、忙碌程度、策略性评估等其他)
最后一种噪声模式其实也是非常普遍存在的,那就是情景因素的影响下所产生的噪声。情景因素的噪声也远比我们想象中更有杀伤力:情绪因素、疲劳程度、忙碌情况等等。如果你希望更加体系化地理解“噪声”这个概念,可以深入阅读学习一下丹尼尔·卡尼曼的著作《噪声》。
两种不同评估模式的弊端
除了上述的噪声以外,我们常用的评估模式也存在不少弊端。
如果不引入任何的参照系进行相对性的对比,评估结果很可能会陷入到“完全符合预期”的通货膨胀中。如果我们要对一个由精英人士组成管理团队来说,绝对判断很可能造成一个结果就是所有人都是“完全符合预期”。这也会产生一种需要警惕的文化,那就是“自鸣得意”的文化。
为了避免这种情况的发生,杰克·韦尔奇在他的著作《赢》中提到了一种“强制排名”的方法。对评估结果进行强制排名是一种相对判断。相对判断的结果的确看上去更加公正合理,但也会引发很多不良影响。例如对于一个“精英团队”来说强制评出10%的“不满意”,对于团队的伤害要远大于收益。
不论是评估过程中无法避免所出现的系统性噪声还是各种评估方式所存在的弊端,都使得我们花了大量心血所执行的绩效评估工作最终所产出的结果与实际情况相去甚远。这种情况在过去一段时间我的实践中也一直遇到。为了解决(至少减少)这些问题,我和我的团队在过去的一个季度里面回到“绩效评估”的目的本身,重新树立并设计了新的360绩效体系。
重新定义绩效
我们对于一件事情的认知和预期会决定我们把它做成什么样子。
传统的绩效评估工作定义中,绩效是对于过去工作的回顾。包括在前段时间和字节跳动OKR团队互动的时候,他们介绍到目标管理和绩效管理之间的区别在于OKR管理着重于“价值创造”,而绩效管理则侧重于“价值分配”。
这是一种普遍而且合理的理解。但是对于我们来说,我们希望绩效不仅仅承载者对于过去的回顾,也是一种对于未来的发展性的反馈,它不仅能够评估我们当前工作所处的阶段,也能帮助明确后续的成长与发展方向。如今的绩效管理方法(包括360在内)都更侧重于对于过去的回顾,而弱化了对于未来的指导意义。
如果要设计一套兼顾两者的系统,其关键在于我们可以有一个明确标明当前所处位置的对照表。在过去的一个季度,我们花费了不少精力制定这个对照表,暂且称之为:“能力锚定评估表”。
结合岗位晋升和能力模型的“能力锚定评估表”
“能力锚定评估表”是一个具有行列结构的表格。如图所示。在表格的纵轴,是一系列岗位所要求的能力/特质维度,而在表格的横轴则是岗位的晋升路线。
结合业务要求对于能力要求进行拆解,形成能力维度表,如图是我们的能力维度拆解,结合了《高效能人士的7个习惯》
打过游戏的小伙伴对这张表一定不陌生。纵轴可以理解为角色成长技能树,根据角色需要加点即可成长。横轴则是打怪升级路线,每升一级都伴随着纵轴每个维度能力描述的变化。
图中的每一个格子都体现了不同岗位职级下对于岗位能力/特质的具体要求,清晰标注了每一个维度都需要成长路径。
“能力锚定评估表”可以让每一位员工清晰地看到自身所处的位置,并通过绩效考核知晓自己目前的评估结果是居于右侧(超出现状)还是左侧(低于现状)。在知晓现状的情况下,锚定评估表也对每一项能力的未来进行了清晰的指引。
在360问卷的刻度设置上,我们将刻度的描述优化为:“不确定、不符合、勉强符合、符合预期、超出预期”,这里面的“符合预期”即当前维度在当前职级的具体要求,这时候“能力锚定评估表”就能提供对于“符合预期”更加具体的描述。
例如:小明当季度在业务难度维度的表现根据能力锚定评估表的要求为高亮区域描述,若他的实际表现为图中“实际表现A”区域所示,那么在评估时他的评估结果将为“超出预期”,反之若实际表现落在“C”区域,那么最终结果将会是“低于预期”。
减少360环评中的“噪声”水平
虽然能力锚定评估表可以从标准出发降低一定的噪声水平,但是评估过程中的噪声情况依然不容乐观。也就是前文提到的三种不同类型的噪声(回顾前文)。为了解决这个,我们还需要对评估过程进行改造,因此我们额外引入了3个变化。
通过数据降低噪声水平
大部分人都觉得自己具有比较优秀的判断能力来处理复杂信息,但是研究表明:人类在许多方面都不如统计模型。其中一个最主要弱点在于人类的判断过程存在噪声。
即便是最简单的统计模型也可以有效对心理偏差进行校准。如果你对一些关键变量进行权重设置可以一定程度上增加整个统计模型的准确性。在此基础上如果运用机器学习的技术可以有效降低噪声的比重,从而更加精准的产出结论。更精准的结果意味着更多的投入、更多的成本。
在本文提到的绩效评估场景,即便是引入少量简单的统计模型,也可以很大程度上减少噪声所带来的误差影响。
所以传统360的评估结构是:上级评+自评+他评,我们增加了一个新的板块:客观指标。同样是基于能力锚定评估表的能力维度拆分,每一个维度都确定了一个日常工作的数据收集口径。
通过这四个角度的统计,进行一定的加权计算,最终的结果可以辅助绩效评估做最后的矫正。
结构化问卷降低噪声水平
我们翻找了市面上很多的360环评的问卷设置,很多都会将维度本身作为问题的设置。然而很多时候一个维度会包含多项实际业务表现。例如下图所示的工作产出,对于“产品经理”岗位来说,工作产出包含:需求评估、排期管理、方案设计等等。
这种不够具体的问卷设置会产生一种“印象污染”的结果,而这种印象污染会带来非常大的结论偏差。所以我们需要将问卷进行进一步的结构化,保障每一个问题所标的业务表现是相对单一具体的,减少评估过程中的“噪声”。
优化他评范围降低噪声水平
评估范围同样值得注意,尤其在“他评”范围的确定,我们建议与被评人在资历/经验等方面尽可能地相近。不同资历/经验对于某项能力是否符合预期的认知水平是不一样的。这会造成评估过程中的水平噪声泛滥。尽量将“他评范围”控制在与被评人详尽的情况可以有效降低这部分的噪声。
下方所示是他评范围选择优先级
按照以下优先级依次考虑人选:
- 当季度密切协作
- 当前职级/资历相近
- 总计不少于5份
- 最少1个本部门
- 最少2个跨部门
上述介绍的几种方式都是降低评估误差的有效方式。但一个客观事实是:“只要有评估,就一定会存在误差。”所以基于企业自身情况进行持续性地优化是非常必要的,也是必不可少的。关于绩效这个话题还有非常多可探讨的部分,例如:“在如今的组织结构中,每个人的协作属性加强,在这种高度互动的环境中个人绩效的概念是否有价值?”、“绩效是面向过去的回顾,还是面向未来的预测?”。
附:
文中提及的绩效管理系统源于:轻流·360度环评系统、轻流·OKR管理系统(注册登陆可免费安装试用)
文中“噪声”、“误差”、“偏差”等定义描述源于:《噪声》