研究中的信度类型：实例与方法解析

内森·奧勇

安永的高级会计师

获得会计学学士学位，完成会计研究生文凭

可靠的测量在每次使用时都会给您带来相同的答案。把它想象成一个体重秤：踩上去两次，它应该显示相同的体重。

本指南将通过实际研究中直截了当的例子，解释在您的研究中检查这种一致性的不同方法。

想学习如何应用这些检查并加强您的研究工作吗？让我们深入了解细节。

什么是研究中的信度

信度是指获得一致的分数，而不一定是正确的分数。浴室体重秤可能总是显示你比实际体重重五磅，这是信度高的表现，但它并不准确（或者说效度不高）——要深入了解研究中不同类型的效度，请参阅本配套指南。

正如在信度效度概念中所解释的，良好的信度可以减少随机噪声，这对于从医学到社会学的任何研究都至关重要。

信度与效度：核心区别 人们总是把这两者混淆。以下是它们的区别：

你可以只有其中一个而没有另一个。一个总是快十分钟的时钟是可靠的（信度高），你可以依赖这个误差。但它在告诉你正确时间方面是无效的（效度低）。

这种区别在理解研究方法中得到了清晰的解释，其中一致性和准确性被视为独立的概念。

信度与效度（快速对比）

为什么要关注信度？

很简单：如果你的测量值随机跳动，你的研究发现就是建立在沙滩上的。其他研究人员将无法重复你的工作，你也不能信任自己的数据。信度是可信研究的基本底线。

每种类型的信度测试都用于检查特定情况下一致性。您需要选择适合您研究设计的那一种。

重测信度：检查随时间推移的稳定性 这是最简单的检查。您将同一测试对同一组人进行两次，然后看看分数是否相关。高于 0.7 的相关性通常意味着它是稳定的。

评分者间信度：当多个人进行评判时 这检查不同的观察者在对同一事物进行评分时是否达成一致。这在行为研究或对访谈草稿进行编码时至关重要。

定性研究的障碍 在定性研究中获取可靠的数据非常棘手。不同的编码员经常在同一次访谈中看出不同的主题。

评分者内信度：一个人的 consistency 这测量单一观察者随时间推移的一致性。它回答了：如果您对相同的数据进行两次判断，您会给出相同的分数吗？

内部一致性：你所有的问题测量的是同一件事吗？ 这检查问卷或测试中的所有项目是否指向同一个方向。最常用的统计数据是 Cronbach’s Alpha（克隆巴赫系数）。

复本信度：用不同的版本进行测试 此方法使用设计为同等的两个不同版本的测试。它检查它们是否产生相似的结果。

合成信度：适用于复杂模型 这是一种用于统计建模（例如结构方程模型）的更高级测量方法。它类似于 Cronbach’s Alpha，但因能够体现每个问题与其整体概念关联的紧密程度，而被认为在复杂分析中更加精确。

并非所有的信度检查都承担相同的工作。此表显示了在何时使用哪一种方法。理解每种类型如何契合您的研究设计也与更广泛的研究范式相关，因为不同的研究方法会优先考虑不同形式的一致性和测量。