Площадь под ROC-кривой (AUC)

Интегральный показатель диагностической способности теста, от 0.5 (случайность) до 1.0 (идеал).

Площадь под ROC-кривой (AUC)

AUC сжимает всю ROC-кривую — со всеми её компромиссами между чувствительностью и специфичностью — в одно число. Интерпретация красивая: AUC равна вероятности того, что случайно выбранный человек с расстройством получит более высокий балл, чем случайно выбранный здоровый. AUC = 0.95 означает: в 95% случаев пациент с депрессией наберёт больше, чем человек без депрессии. AUC = 0.5 — тест не лучше монетки.

Практические ориентиры: 0.70–0.80 — приемлемая точность, 0.80–0.90 — хорошая, > 0.90 — отличная. PHQ-9 для большой депрессии достигает AUC ≈ 0.95, GAD-7 для тревожного расстройства — около 0.91. Для AUDIT в зависимости от целевого расстройства (вредное употребление vs. зависимость) AUC варьирует от 0.84 до 0.93. Именно AUC используется, когда нужно сравнить два конкурирующих инструмента для одной клинической задачи — тест с более высоким AUC объективно лучше при всех возможных пороговых баллах.

Часто возникает вопрос: чем AUC отличается от точности (accuracy)? Точность зависит от выбранного порога и распространённости расстройства, AUC — нет. При дисбалансе классов (например, 90% здоровых) тест может иметь точность 90%, просто предсказывая «здоров» всегда, — но AUC при этом будет 0.5. AUC — более честная мера, потому что оценивает тест при всех порогах одновременно и не зависит от распространённости в выборке.

Глоссарий Психометрики — справочник терминов психометрики. Пройдите PHQ-9 для примера.

психометрика diagnostic-accuracy