Размер эффекта
Стандартизированная мера величины различий или изменений, не зависящая от размера выборки.
Размер эффекта
p-значение 0.001 говорит: «различие есть». Размер эффекта говорит: «и вот насколько оно большое». Это критически разные вопросы. При выборке в 10 000 человек статистически значимым может оказаться различие в 0.1 балла по PHQ-9 — клинически ничтожное. Размер эффекта стандартизирует величину изменений, позволяя сравнивать результаты разных исследований, инструментов и выборок.
Наиболее распространённый показатель — d Коэна: разность средних, делённая на стандартное отклонение. Шкала Коэна: d = 0.2 — малый эффект, d = 0.5 — средний, d = 0.8 и выше — большой. Метаанализы антидепрессантов показывают d ≈ 0.30–0.40 для снижения баллов PHQ-9 по сравнению с плацебо — это малый-средний эффект. Когнитивно-поведенческая терапия в контролируемых испытаниях даёт d ≈ 0.80–1.20 для депрессивных симптомов — большой эффект. Для MBI программы профилактики выгорания в исследованиях демонстрируют d ≈ 0.45–0.60 по шкале эмоционального истощения.
Главное заблуждение: большой размер эффекта всегда означает практически важное изменение. Это не так. «Большой» по Коэну — это статистическая классификация, откалиброванная по психологическим исследованиям 1960-х годов. В высокоточной медицине d = 0.2 может означать спасённые жизни. В социальной психологии d = 1.0 может оказаться совершенно нерелевантным для реальной практики. Размер эффекта нужно всегда интерпретировать в контексте клинической значимости, стоимости вмешательства и альтернатив.
Глоссарий Психометрики — справочник терминов психометрики. Пройдите MBI для примера.