什么叫信度和效度?

信度和效度到底是什么?——那些我们常听说却未必懂的测量核心

在测评、调研或实验中,“信度”和“效度”总是被反复提及,但它们究竟代表什么?其实,这两个词是判断一个测量工具是否靠谱的底层标准,缺了任何一个,结果都可能失去意义。

信度,指的是测量结果的稳定性与一致性。比如你用同一把卷尺测自己的腰围,连续测三次结果都在68-69厘米之间,这卷尺的信度就高;如果第一次68、第二次75、第三次72,信度就低——因为结果飘忽不定,法相信。再比如一场数学考试,同一批学生隔两周做难度相似的同类型试题,得分差异很小,说明这场考试的信度合格,它能稳定反映学生的知识掌握程度,而非依赖运气或临时状态。

效度,则是测量结果的准确性,即工具是否真的测出了你想测的东西。比如用体重秤测身高,就算每次显示的数一致信度高,但它测的不是身高,效度就为零;一把刻度准确的卷尺测身高,效度才高。再比如,一份号称“沟通能力测试”的问卷,如果全是选择题而非情景模拟题,它可能测出的是记忆能力而非实际沟通技巧,效度就差。

两者的关系是:信度是效度的前提——如果结果都不稳定,谈何准确?但信度高不等于效度高。比如一把刻度偏了3厘米的尺子,每次量身高都多3厘米信度高,却没测出真实身高效度低。反过来,效度高的工具,信度一定高,因为能准确测出目标的结果,必然是稳定的。

在教育测评中,信度低的考试法公正评价学生;效度低的试卷则会误导教学方向。在市场调研里,信度差的问卷会让数据杂乱章;效度不足的问题则抓不住真实需求。即便是日常的小测试,比如健身时用体脂秤,若信度或效度不够,你看到的数不过是自欺欺人的摆设。

说到底,信度和效度就是测量的“靠谱双标”:信度保证结果“不变”,效度保证结果“对路”。只有两者兼备,测量才有价值。

延伸阅读: