人类天生喜欢分类,但它一定靠谱吗?

哈佛商业评论 · 2019-10-14
但在商业世界中,我们常常创造并依赖一些虚假或者无用的分类,这会导致重大的决策失误。

编者按:本文来自微信公众号“哈佛商业评论”(ID:hbrchinese),作者 巴特·德朗格(Bart de Langhe)菲利普·菲恩巴赫(Philip Fernbach) ,36氪经授权发布。

人类大脑是一个分类机器,一刻不停地吸收外界海量的混乱数据,将其简化和格式化处理,以便理解这个世界。这是大脑最重要的能力之一:一眼看出某个东西到底是蛇还是木棍,对人类来说很有价值。

分类法有价值的前提是两点:第一,必须实事求是。你不能随意地将同类强行分开。正如柏拉图所说,有效分类是“从关节处切分种类”,就像蛇和木棍。第二,必须有用。不同类别必须有你所关心的差异。区分蛇和木棍是有意义的,能帮助人类在丛林探险中存活下来。

但在商业世界中,我们常常创造并依赖一些虚假或者无用的分类,这会导致重大的决策失误。

分类思维的危害体现在四个重要方面。它会脸谱化同类别下的成员,忽略彼此间的差异;夸大不同类别成员的差异;歧视、偏爱某些类别;将人为制造的类别构架视为恒定不变。

脸谱化

我们在分类时,依据的是原型。这样一来很容易忘记每个类别中的各种变数。

目标客户的迷思。营销部门最常用的工具之一就是研究细分市场,旨在将顾客分类,找到公司的目标客户群——也就是公司的战略重点和需要特殊关注的一类客户。

细分用户研究一般先询问顾客的行为、意愿和人口统计特征,再根据答案的相似程度,通过聚类算法将答题者分为不同类别。这类分析很少得出差异很大的类别。但营销人员很少会认真评估这些群体是否真实存在,而是直接进入细分流程的下一步:确定平均值、顾客画像、创造原型。

屏蔽效应。脸谱化还会影响人才选拔。假如你负责公司招聘,在贴出广告后,有20人应聘。你先做一轮筛查,然后根据候选人的技术能力进行排名,选择前5名来面试。

即便这5个人的技术能力大相径庭,但到了这时也不会太多影响你的录用决定。一旦你基于技术能力筛选出候选人,进入下一阶段的候选人在你眼中技术能力都差不多。受到分类思维影响,你在面试中会主要基于软技能进行筛选:他们的气质谈吐如何,沟通是否高效等。当然这些技能很重要,但对很多职位来说,最重要的是找到技术能力最高者,但屏蔽效应妨碍了你找到这些人才的能力。

夸大效应

分类思维会促使你夸大不同类别间的区别,对其他群组的人产生刻板印象,在决策中随意设立阈值,得出错误结论。

群组动态。在大数据和用户画像时代,基于分类思维产生的夸大令人担忧。例如,Facebook根据用户浏览记录(“中立”“保守” “自由”),为其打上政治标签,并为广告主提供这类信息。这会让广告主觉得Facebook不同类型用户间的区别比实际要大,而讽刺的是,广告主因此为每个群体量身打造广告内容,反而会进一步扩大真实差异。2016年美国总统大选和英国脱欧政治活动中,似乎就发生了这样的情况:Facebook为“保守派”和“自由派”用户提供了数千条加深分裂的内容。

很多公司的内部也饱受类似的夸大效应之苦。不同部门发挥协同效应往往会给企业带来成功。但是分类思维会让人严重低估团队跨部门合作的成效。如果你觉得公司的数据科学家很懂技术,但是对商业运作一窍不通,公司营销经理很懂营销,但面对数据一筹莫展,也许你根本不会想要让他们合作。这也是很多分析项目停摆的原因之一。

决策。夸大也会以不易察觉的方式影响管理决策。例如,NBA球队在以微弱比分输掉比赛后(100比101),相比以微弱比分赢得比赛(100比99),即使都是两分之差,教练在下一场比赛中,调整首发阵容的概率高17%。但很少有教练会因为球队以100比106,而不是100比108输掉比赛,而调整阵容,虽然差距也是两分。失败和成功从感觉上讲有本质差别,因为人们不会以连续统一体看待体育比赛结果。

统计显著性。随着行为经济学和数据科学的兴起,企业日益依赖A/B测试来评估效能。部分原因是A/B测试易于执行和分析:你创造出除一个因素外其余完全相同的两种情况,然后让一组人体验A版本,再让另一组体验B版本,接着看两组间是否有较大行为差异。

即便这一设计实则毫无作用,出于偶然性,两组之间总会有某些差异。因此,为了确定差距是不是足以说明测试设计有效,还要做统计测试。测试结果就是在假设控制因素无效的情况下,你可能会看到差距差异的可能性,即假设概率(p值)。该值越接近0,越能充分说明你所控制的因素才是差异的主要原因,而非偶然性。但多接近0是足够接近呢?

1925年,英国统计学家和遗传学家罗纳德·费希尔(Ronald Fisher)爵士随意选择了0.05作为分界。他也可以挑0.03,实际上他还建议,假设概率应当根据研究参数的不同设置不同值,但没人在乎。在随后几十年间,学界盲目追随,认定0.05是划分有效与否的楚河汉界,并成为商业实践的规范。

这带来各种问题。当A/B测试出现0.04的假设概率时,测验通过,而0.06则放弃,但从这数字本身来说,两者之间差异并无太大意义。更糟的是,很多实验人员会定期偷看数据,测试统计显著性,当看到低于0.05的假设概率后,就不再搜集数据。

这样做,更容易将实际无效的介入视为有效。近期,针对使用著名网上A/B测试平台的实验人员,有人进行了研究,发现多数人参与了“假设概率造假”行为,导致虚假测试率从33%上升到42%。

歧视

一旦你采用了某种分类体系,会倾向于更偏爱某些类别。但是,忽视另一些类别会带来有害结果。

过度定位。广告对目标客户也许有更大的积极影响,但在很多情况下,广告主无法收回每次点击多花费的成本。然而营销人员沉迷于目标客户,忽略了其他人身上的价值。

Facebook一直在致力于帮助广告客户理解与细分客户相关的覆盖率问题。它以一个曾关注男性用户的啤酒品牌为例。该品牌转向数字媒体后,能够缩小目标客户的范围,看似是件好事。但实际上,这严重限制了公司宣传的覆盖范围,品牌绩效下滑。调查过后,公司发现该品牌的消费者很大比例是女性。在拓宽目标范围并推出创意广告后,公司立即看到好的变化。

净推荐值。什么是净推荐值(NPS),它的作用是什么?——企业询问顾客(或员工),以0到10的标准,他们向亲朋好友推荐这家公司的可能性有多高。0代表“绝不会”,10代表“肯定会”。

在给出答案后,消费者会被分为三类:批评者(0-6分),被动者(7-8分)和推荐者(9-10)。得出NPS值,先要统计各类顾客的比例,然后用推荐者比例减去批评者比例。如果60%的顾客是推荐者,10%的顾客是批评者,你的NPS是50。

NPS体系本应帮公司避免夸大和偏见,但其本身也存在同样问题。例如,打6分的顾客更接近7分而不是0分,但它还是被归入批评者,而非被动者。决定分数时,跨类别的微小差异起了重要作用,换言之,同一类别中相同的,甚至更大的差异反而被忽略。

NPS还有另一个分类思维的问题:被动者的数量不予统计。以两个极端调研结果为例:一家公司有0%的批评者,0%的推荐者。另一家有50%的批评者和50%的推荐者。两家NPS值相同,但很明显两者的顾客状况非常不同,应当用不同的方式进行管理。

僵化

分类会导致僵化的世界观。它让我们觉得这样看到的就是真实的世界,而不是一部分人梳理世界的一种方式。约翰·凯恩斯(John Maynard Keynes)曾用精妙语言描述过这一观点,“困难不在于如何接受新思想,而在于如何摆脱旧思想”。

很多企业希望通过分类提高运营效率。他们将任务分配到人,将人分配到各部门等等。

这么做有其意义,但也会付出代价。为解决过去业务问题所作的分类,难以适应未来的问题。而依靠分类来思考问题,会给知识创造拖后腿,因为它会影响人们以全新方式结合各因素的能力。2016年,多伦多大学的研究人员进行了一项研究,要求200名参与者用乐高积木搭建一个外星人。

他们要求部分参与者使用分好类的积木,另外一组则使用随机分类的积木。第三组人就方案的创造性打分,结果使用未分类积木的小组,被认为更有创意。

如果类别僵化,还会让人觉得很难跳出规则使用物件(或想法),从而影响创新。这是功能固着性的问题。

分类思维危害控制

那么,一位深思熟虑的领导者该如何避免分类思维带来的危害呢?我们建议采取四步流程:

1.提高警觉。大家都习惯分类思维,这么做也有充分理由。但是任何决策者都应警惕,分类思维引发的简化或扭曲问题,理解浮于表面以及隐形偏见。能够尽量避开这些陷阱的企业,可以帮助员工更好应对不确定性、微妙变化和复杂性。在决策过程中,我们该常常扪心自问,这个类别是否真实存在?是否有用?

2.培养持续分析数据的能力。为避免分类思维带来的决策隐患,关键要有出色的持续性分析,但很多公司缺乏相关知识。例如,在研究细分市场方面,公司将其外包给专业公司,之后错误解读他们得到的信息。这点相对好解决。可以通过一些培训,让大家懂得如何使用成熟指标评估细分市场。用细分市场研究作为营销研究或战略规划重要部分的企业,都应进行这类培训,使用这类指标。这是明智企业培养内部知识专长,获得竞争优势的黄金机会。

3.检视决策标准。很多企业在持续性动态中随意设立了某个阈值,决定只在超过该值后采取行动,这会产生两个问题。

首先,增加风险。假设一家公司希望通过市场研究判断某新品是否能成功。如果在一次大规模调研中,消费者评估达到了预先决定的阈值,或某个实验结果产生的假设概率小于“神奇数字”0.05,公司也许会决定推出该产品。但是,由于刚刚达到和刚刚错过阈值几乎没有区别,公司可能仅因为样品随机变化或数据收集方式的小偏差,得到了这个结果。一个微小且本质上毫无意义的差异,导致了截然不同的决策结果。

第二,随意选择的阈值会阻碍学习。举例来说,一家公司决定,如果未能实现某个营收目标,就进行机构变革。如果公司差一点实现目标,会假设公司出了问题,要进行改革。但如果公司刚刚达到目标,就会假设一切正常,业务照旧。而在这两个案例中,营收的数据可能几乎相同。

第三,为避免这种情况,我们推荐你检视全公司的决策标准。你可能会惊讶于公司有多少决定是基于非此即彼的标准。有些时候这点难以避免,但大部分时候是有其他选择的,这也是企业获得竞争优势的另一个机会。

第四,定期安排“消除僵化”会议。即便你按照前三个步骤进行,仍然会面临僵化危险。为解决这个问题,你需要定期组织头脑风暴会,认真审视公司对行业动态最根本的认知。你的顾客分布模型是否还有效?顾客需求和欲望是否有所改变?

分类帮助我们理解世界,和他人沟通。但我们已经发展成为分类机器,以至于在没有类别的地方也看到类别,这会扭曲我们的世界观,给决策带来不良影响。过去,这样的影响也许不至于使公司陷入危机。但今天,随着数据革命的发展,成功的关键就是降低分类思维带来的不良后果。

巴特·德朗格(Bart de Langhe)菲利普·菲恩巴赫(Philip Fernbach) | 文

巴特·德朗格是位于巴塞罗那的拉曼鲁尔大学的ESADE商学院营销学教授。菲利普·菲恩巴赫是科罗拉多大学波德分校利兹商学院营销学教授,合著有《知识错觉:为什么我们从未独自思考》(The Knowledge Illusion: Why We Never Think Alone)(河源出版社,2017年出版)。

牛文静 | 译时青靖 | 校刘铮筝 | 编辑

本文有删节,原文参见《哈佛商业评论》中文版2019年10月刊。

+1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

聪明人太多了。

2019-10-14

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业