Как устроена экспресс-диагностика Psychometrica

Один врач, код и AI

Psychometrica — проект одного человека. Я практикующий психиатр и психотерапевт, я же пишу код платформы. На этапе проектирования клинической логики — подбора тестовых связок, формулировки дифференциальных вопросов, написания инструкций для AI-интерпретатора — я использую AI как инструмент: не как соавтора, а как собеседника, на котором проверяю гипотезы и которому возражаю. Итоговые решения — мои.

Ниже — история того, как проектировались экспресс-диагностики: от первой идеи до текущей реализации.

Проблема: тесты измеряют, но не различают

Стандартные психометрические инструменты — PHQ-9, GAD-7, ASRS — великолепно валидированы. За каждым стоят десятилетия исследований. Но у них есть конструктивное ограничение.

Каждый тест проектировался для измерения одного конструкта: депрессии, тревоги, бессонницы. Он отвечает на вопрос «есть ли это и насколько выражено». Он не отвечает на вопрос «это или то?» — а именно этот вопрос стоит перед человеком, который пришёл разобраться.

Человек устал, потерял интерес к работе, плохо спит. PHQ-9 — 14 баллов, «умеренная депрессия». CBI — высокое выгорание. Два числа, оба правдивы, оба не помогают. Потому что тесты не проектировались для дифференциации. Они проектировались для измерения.

Решение: связки тестов с кросс-анализом ответов

Отправной точкой стала гипотеза: если объединить два теста, измеряющих разные, но пересекающиеся конструкты, и дать AI-интерпретатору доступ не к итоговым баллам, а ко всем ответам на все вопросы — можно получить дифференциальный сигнал.

Связка оправдана, только если тесты дают что-то вместе, чего не дают по отдельности. Три критерия отбора:

Дифференциальная компенсация — один тест закрывает слепую зону другого. GAD-7 ловит когнитивную тревогу, но пропускает соматическую. Другой инструмент — наоборот. Вместе — полный спектр. А расхождение между ними — это и есть диагностический сигнал.

Item-level перекрытие — в разных тестах есть вопросы об одном и том же. Расхождение ответов на них — дифференциальная информация. PHQ-9 спрашивает про концентрацию, ASRS тоже. Но если при этом по PHQ-9 высокие ангедония и подавленность — скорее всего, концентрация снижена депрессией, а не СДВГ.

Каскадная модель — тесты измеряют разные звенья одной цепочки. Стресс → выгорание → депрессия: три теста, три точки на одной оси. Профиль показывает, где именно человек находится.

Если связка не давала ничего сверх прохождения тестов по отдельности — она не становилась продуктом.

Первая итерация и критика

Первые десять связок работали, но инструкции для AI-интерпретатора содержали системную ошибку: детерминированные правила на уровне отдельных вопросов. «PHQ-9 item 1 — ключевой дифференциатор ангедонии». «Отдельный пункт = 0 → значит, симптома нет».

Критический разбор показал: один вопрос с надёжностью ~0.3–0.5 не может быть «ключевым дифференциатором». Ангедония встречается и при тяжёлом выгорании — overlap между конструктами ≈ 0.70–0.80. А страх смерти при панике не обязателен — DSM-5 перечисляет его как один из тринадцати симптомов.

Вся логика была переписана из «X означает Y» в «X в контексте Z увеличивает вероятность Y». Это не стилистика — это принципиальный сдвиг, который изменил и промпты, и тон отчётов, и юридическую позицию: детерминированные формулировки создают ложное впечатление диагноза.

Слепые зоны тестов

Вторая проблема оказалась глубже. Стандартные тесты конструктивно не закрывают некоторые зоны, критичные именно для дифференциации.

PHQ-9 спрашивает «нарушения сна» — но не уточняет, в какую сторону. А гиперсомния vs инсомния — принципиально разный сигнал. ASRS оценивает последние полгода — но СДВГ по определению присутствует с детства, и вопрос «это всегда или появилось недавно» может быть мощнее всего теста. MDQ спрашивает о «приподнятом настроении» — но гипомания часто не ощущается как «приподнятое настроение», и чувствительность MDQ для биполярного-II падает до ~50%.

Тесты — необходимая база, но недостаточная.

Дополнительные вопросы: микро-интейк

Решение: к каждой связке — два-три коротких вопроса, разработанных специально для закрытия конкретных слепых зон. Не вместо тестов, а поверх.

Принцип: каждый вопрос существует только потому, что разрешает конкретную неопределённость в конкретной связке. Если вопрос просто «собирает больше информации» — он не нужен.

Критически важное архитектурное ограничение: дополнительные вопросы — это context modifiers, а не diagnostic rules. Они калибруют интерпретацию тестов, но не переопределяют её. Если PHQ-9 показывает подпороговый результат, а пользователь описывает тяжёлую ангедонию — AI не повышает интерпретацию. Он пишет: результат в подпороговой зоне, но субъективное описание может указывать на начальные проявления — рекомендуется повторный скрининг.

Иерархия жёсткая: тестовые данные первичны, дополнительные вопросы вторичны. Ни при каких обстоятельствах второй уровень не переопределяет первый.

Forced-choice: выбор вместо шкалы

Для главного дифференциального вопроса каждой связки — отдельный формат. Вместо шкалы «от 0 до 3» человек выбирает между двумя клиническими описаниями.

Forced-choice снимает response bias (нельзя ответить «всё на максимум»), ломает halo effect и буквально реализует дифференциальную задачу: «это больше похоже на A или на B».

Ограничение: forced-choice предполагает, что A и B взаимоисключающие, а клиническая реальность — коморбидность. Поэтому чистый бинарный выбор не используется. Четыре варианта: A, B, «подходят оба», «ни одно». Третий — сигнал коморбидности. Четвёртый — сигнал атипичности.

Итоговая структура

Каждая экспресс-диагностика:

  1. Валидированные тесты (2–3) — основа с известной психометрикой
  2. Forced-choice (1 вопрос) — главный дифференциальный выбор
  3. Контекстные вопросы (2 шт.) — слепые зоны тестов

Три пункта сверх тестов, одна-две минуты. AI-интерпретатор получает все ответы на все вопросы всех тестов — не итоговые баллы — и строит кросс-анализ с учётом дифференциального контекста.

Что AI делает и чего не делает

AI не ставит диагноз. Каждый отчёт содержит дисклеймер: скрининг, не диагностика. Окончательный диагноз — работа врача.

AI не использует детерминированные правила. Работает с вероятностями и паттернами.

AI не скрывает неопределённость. Если профиль неоднозначный — прямо об этом говорит и рекомендует более глубокую оценку. Ответ «картина неоднозначна» — не ошибка, а полноценный результат.

Что AI делает хорошо: анализирует десятки ответов на пересечении нескольких тестов, находит паттерны, которые невидимы при взгляде на итоговые баллы, и переводит их на язык, понятный человеку без медицинского образования. Это не замена клиницисту — это подготовка к встрече с ним.


Psychometrica.pro — платформа первичной психодиагностики.

Автор: Денис Хоряев
врач-психиатр, психотерапевт
экспресс-диагностика AI проектирование методология дифференциальная диагностика