Критериальная валидность

Степень соответствия результатов теста внешнему критерию — диагнозу, экспертной оценке или другому тесту.

Критериальная валидность

Критериальная валидность отвечает на самый практичный вопрос: «Совпадает ли результат теста с тем, что нас реально интересует?» Для клинических опросников внешним критерием обычно служит структурированное диагностическое интервью — наиболее точный доступный метод установления диагноза. Если тест говорит «депрессия», а интервью подтверждает — критериальная валидность высокая.

Критериальная валидность бывает двух видов. Конкурентная: тест и критерий измеряются одновременно. Именно так валидировался PHQ-9: его результаты сравнивали с диагнозами, поставленными по структурированному интервью SCID в той же выборке пациентов. AUC для большой депрессии составила 0.95 — отличный результат. Прогностическая валидность: тест предсказывает будущий критерий. Например, AUDIT оценивался на способность предсказывать проблемы с алкоголем через год.

Принципиальный нюанс: качество критериальной валидности определяется качеством самого критерия. Если «золотой стандарт» — структурированное интервью с одним психиатром, оно само несовершенно. Это создаёт парадокс: тест не может быть более валидным, чем критерий, с которым его сравнивают. Поэтому когда говорят, что PHQ-9 уступает диагностическому интервью по точности — это не недостаток теста, это математическая неизбежность любого скрининга.

Глоссарий Психометрики — справочник терминов психометрики. Пройдите AUDIT для примера.

психометрика validity