comments 5

关于打分这件事

中国人似乎很“宽容”,一遇到打分评价,评价时可能不是很高,但一到打分这个事情时,就会给很高分。

这是为什么?

我觉得,有一种可能是,中国人喜欢这种“打分”的感觉。

大多数的中国人,几乎从小学开始,就一直被别人打分。上学时,你被老师打分,各种老师会给你打分,特别是九年义务教育之后,为了分数,你会玩命的学习,只因为这个分数是个跳板。到了大学,你继续被别人打分,考证、考试、过级等等,你都被别人打分,这时,你是只求及格,如果被打了60分以下,那这就是个很残忍的事情。毕业后,你继续被别人打分:被银行打分,被公司行政打分,被上司打分,被户口打分、被交警打负分,等等之类,总之你这一辈子的大部分时间都在被别人打分。

当然,你也有机会给别人打分,这时,位置好像交换了一下,一下子,你拥有了可以给别人打分这样的权力,比如,接受度测试这样的事情,当然,这时你是给产品打分。

中国一直是一个官本位的国家,人们对权力的追逐也是由来已久的,从禅让到世袭,从宫廷政变到革命起义,权力的角逐一直在进行。财富从是都是不够的,美女情谊也都是浮云,只有权力是诱人的。有权就可以弄权,就可以顺着自己的意思来,哪怕这个权力很小。所以,你看到,在中国办事难,有权就好办事,找关系就是找那些有权的人。大家天天骂政府骂制度,不是因为政府腐败制度不公平,而是因为自己没进入那个阶级没有成为当权者。

何满子在《剃光头发微》中,讲了一个理发师拒绝给一个乡下人剃平头的事情,他说:

问题不在于什么标准,也不在于这位城里人的理发师为什么瞧不起“乡下佬”(那里面当然大有文章的),而在于为什么他可以任意决定谁该剃平头,谁只能剃光头,可以这样为所欲为?原因简单之至:剃头刀在他手里。这就是权。虽然仅仅是一把剃刀,但掌握在手里,就有那么一点剃头权,在这点权限里,谁撞在他手里,就得看他的嘴脸,听他的发落。

打分这件事,其实和这个剃刀有那么一点点的类似。当你想知道一个用户对产品的接受度时,你请用户给这个产品打分,实际上就赋予了他一个量裁权。虽然你会一开始告诉他,1分代表什么,7分代表什么,他也听懂了,但一到他开始打分时,那些东西就被忘记了,因为那只是一个上下限,有时他们还想越过这个上下限,比如,他们会问,“我能打8分么”。

量裁权这个东西,其实是一个很大的权力,因为在这上下限之间是一个无极的,没有刻度的,可以有无限选择的。使用这个权力的人总会做一些所谓的“综合考虑”,而这些“综合考虑”往往是没有标准没有参照没有对比的。有这个权力在手中,难免就会让用户可以纠结的爽一把。

“这个东西要给他多少分呢?7分?7分是不是太高?6分呢?是不是低了点?那就6.5分吧。”

“这个地方打多少分呢?4分?是不是太低了?会不会让他们(主持人、产品方)觉得不爽?给5分吧?

“这个该给多少分呢?3分?3分太低了吧,会不会有点残忍?其实它也没那么差,那就4分吧。”

但是,这样的结果显然并不是“打分”的初衷。我们不是要让用户去打分的,我们最终是想知道用户自己对产品的一个感受程度。由于这种感受本身是抽象的,那么对这种感受的梯度描述也就是抽象的,只是最后在做数据处理时,将其赋值转换成了等距量表。比如,对一个功能的需求程度的描述,将其分成7个等级的话,其描述可能是这样的:

这个功能对我来说:
A. 完全是多余的,我一点都不需要
B.去掉比较好
C.一般吧,没有的话估计没什么影响
D.可有可无,对我无所谓
E.还可以,有的话或许会有用
F.加上会比较好
G.是必须要有的,我完全需要

如果每问一个问题,都向用户描述一遍,不仅自己说着累,用户听着也累。于是,用1-7这样的数字去代替这个七点量表在操作上会带来不少方便:自己描述方便,用户执行方便,做记录的人记录方便,处理数据的人更方便,于是何乐而不为?

然而,之所以会使用心理量表,主要是为了将主观的感受进行量化,一般来说,心理量表会使用2点、3点、5点、7点量表. 这种评价,和我们一般所谓的“打分”是不同的。比如2点量表,多是表示“是”“非”;3点量表,常见的就是好中差评;7点量表,只是用1-7表示7个等级的主观感受程度,1和7分别表示两个极端的感受,4表示一种模棱两可的感受。所以,你也可以用A-G这样的字母来表示,它只是一个序号,而不是数值。于是,压根就不存在所谓的0分、8分或几点几分的情况,如果这种感受可以很细致,那就增加量表的级数,比如用9点量表、11点量表。

所以,量表本质上是给用户做选择用的,级数只决定了刻度的细密程度。主观感受也不太可能像钢尺那样一毫米一毫米的进行区分,只能使用一种可以得到共识的、表述程度的抽象描述,然后将其呈现给用户让用户选择,选择其中最接近自己心理感受的那个描述。换句话说,我们只需给用户选择权。

选择权是一个被限制的权力,做这种感受程度的评价时,你让用户对一个东西打分和让用户对一系列选项进行选择,这两种行为用户在操作时感觉是不一样的。

心理感受确实是一个很主观的东西,但是,这个在对这个很主观的东西进行量化时,还是需要尽可能的排除其他的干扰因素。我觉得打分是一个干扰性比较大的方式,因为这是在中国。

哦,对了,打分形式的量表,这东西应该是西方的舶来品吧,我还没求证。

5 Comments

  1. 你猜不着

    比如我自己打分的情况,没有什么很吸引我的东西就会折中,这就是中庸吧。。。。
    我关注的点要是让我不爽的就不及格了,做的还不错的甚至有点小惊喜的分蹭就上去了。。。
    虽然说是整体评价,但往往会被一个点或局部就干扰了决定。

    • dongyuan

      所以,一开始就不应该是“打分”,而是“选择”。打分只是容易操作而已。另外,打分的话太容易“及格”了,这样可能会使结果偏高(当然,我没做过这样的对比测试,我准备找机会做一下)。

  2. 你猜不着

    我不是一个合格的用户。。。。
    话说如何定义一个用户是否合格?
    即使有条件的筛选也不够吧~O(∩_∩)O

    • dongyuan

      你“用”一个产品,基本就算这个产品的用户了。当然,设计开发推广这个产品的人是不算的。
      只是,有时候会去确定一些条件,主要是为了控制变量,比如年龄、性别、收入之类的。

  3. 圈圈

    这样来说,评分的结果是相对的,同时评价多个类似的功能点或产品,比较着看可能更有意义一些,(这里对标准化更有要求);如果仅对一个功能点进行评价,那么我们需要的是常模,需要这个分数更常模进行比较~~~(但常模通常很难做到)

Leave a Reply

电子邮件地址不会被公开。 必填项已用*标注