Внутренняя согласованность

Степень, в которой пункты теста измеряют один и тот же конструкт.

Внутренняя согласованность

Когда вы проходите тест депрессии, вам задают девять вопросов — о настроении, сне, аппетите, концентрации. Логично ожидать, что все они «тянут» в одну сторону: человек с депрессией даст похожие ответы на большинство пунктов. Внутренняя согласованность — это математическое подтверждение того, что так и происходит. Высокая согласованность означает: пункты взаимосвязаны, они измеряют нечто общее, а не случайный набор характеристик.

На практике согласованность выражают через альфа Кронбаха. Значение α ≥ 0.70 считается приемлемым для исследовательских целей, α ≥ 0.80 — хорошим для клинического использования. Для PHQ-9 сообщаются значения около 0.86–0.89 в разных выборках, для GAD-7 — около 0.92. Это значит, что все пункты внутри шкалы работают согласованно: если человек говорит, что испытывает тревогу постоянно, он, скорее всего, также отметит трудности с концентрацией и беспокойство о разных вещах.

Частая ошибка — думать, что чем выше согласованность, тем лучше тест. Значение α выше 0.95 нередко сигнализирует о проблеме: пункты настолько похожи, что измеряют буквально одно и то же, а значит, тест избыточен — несколько вопросов можно выбросить без потери информации. Другой нюанс: внутренняя согласованность ничего не говорит о том, правильный ли конструкт измеряет тест. Все пункты могут отлично коррелировать друг с другом, но при этом измерять не депрессию, а нечто совсем иное. Это уже вопрос конструктной, а не внутренней валидности.

Глоссарий Психометрики — справочник терминов психометрики. Пройдите PHQ-9 для примера.

психометрика psychometric-basics