Методология

Психометрика строится вокруг простого принципа: результат теста должен быть полезным, но не должен притворяться более точным, чем он есть.

Психометрический инструмент может помочь увидеть сигнал, оценить выраженность состояния, заметить связи между симптомами и подготовиться к разговору со специалистом. Но он не заменяет клиническое интервью, не ставит диагноз и не знает человека лучше, чем человек и специалист могут понять его в живом контексте.

Методология платформы держится на трёх опорах:

  1. психометрическое измерение — баллы, шкалы, подшкалы, индексы и ограничения;
  2. экспертная интерпретация — клинически аккуратный язык и понимание контекста;
  3. AI-инструменты — как способ сделать результат понятнее, но не как источник диагноза или измерения.

На какие рамки опирается Психометрика

Психометрика не строится "с нуля" и не пытается изобрести психометрию заново. Авторские модули проектируются с опорой на несколько современных рамок: HiTOP, RDoC, COSMIN и unified validity framework AERA/APA/NCME.

Эти рамки нужны не как украшение и не как способ звучать научнее. Они задают разные уровни методологической дисциплины: как думать о психических состояниях, как проектировать измерение, как проверять инструмент и как честно говорить о его валидности.

HiTOP и RDoC

Современная психопатология всё чаще описывает психические состояния не как изолированные категории "есть / нет", а как пересекающиеся, размерные и механистически неоднородные профили.

HiTOP — Hierarchical Taxonomy of Psychopathology. Эта рамка предлагает смотреть на психопатологические проявления не только через отдельные диагнозы, а через иерархию размерных признаков и спектров. Она помогает понимать, почему тревога, депрессивные симптомы, соматический дистресс, нарушения сна и другие состояния часто пересекаются.

RDoC — Research Domain Criteria. Эта рамка смещает внимание с диагностических категорий на процессы и системы: угрозу, вознаграждение, когнитивный контроль, регуляцию, социальное функционирование, возбуждение и сон. Для Психометрики это важно, потому что один и тот же уровень симптомов может поддерживаться разными механизмами.

Психометрика не копирует HiTOP или RDoC напрямую и не утверждает, что полностью реализует эти модели. Эти подходы используются как научная ориентация: не сводить состояние к ярлыку, учитывать пересечения между симптомами и смотреть на механизмы, которые могут поддерживать состояние.

COSMIN

COSMIN — международная методологическая рамка для разработки и оценки patient-reported outcome measures, то есть инструментов, основанных на самоотчёте пользователя.

Для Психометрики COSMIN важен как дисциплина разработки. Нельзя просто написать вопросы, собрать баллы и объявить инструмент "валидным".

При создании авторских модулей важно последовательно проверять:

  • содержательную валидность: действительно ли вопросы покрывают нужный конструкт;
  • понятность формулировок для пользователя;
  • структурную валидность: соответствует ли фактическая структура ответов задуманной модели;
  • надёжность;
  • измерительную ошибку;
  • связь с близкими и отличными конструкциями;
  • чувствительность к изменениям, если инструмент используется повторно;
  • различия между группами и возможные источники смещения.

На раннем этапе не все эти проверки могут быть завершены. Поэтому Психометрика различает статус инструмента: предварительная версия, пилотная версия, калиброванная версия, валидированная версия, реплицированная версия.

Unified validity framework AERA/APA/NCME

Валидность — это не свойство теста "вообще".

Корректнее говорить о доказательствах в пользу конкретной интерпретации результата для конкретной задачи, в конкретной популяции и при конкретном способе применения.

Эта позиция лежит в основе unified validity framework AERA/APA/NCME. Для Психометрики это означает, что вопрос звучит не "валиден ли тест?", а точнее:

  • для какой задачи используется инструмент;
  • какую интерпретацию результата он поддерживает;
  • в какой группе пользователей это проверено;
  • какие данные уже есть;
  • какие ограничения остаются;
  • какие выводы делать нельзя.

Поэтому формулировка "наш тест валиден" сама по себе недостаточна. Вместо неё важнее говорить конкретнее: какой именно claim подтверждён, на каком уровне данных и для какого применения.

Измерение, паттерны и интерпретация — разные уровни

Главное архитектурное правило Психометрики: AI не заменяет измерительное ядро.

Скоринг, индексы, пороги, маршрутизация, safety-флаги и уровни выраженности считаются по заранее заданным правилам. Это детерминированная часть системы.

Но психометрический результат — это не только итоговый балл. Важен и сам рисунок ответов: какие пункты выбраны резко, какие зоны расходятся между собой, где среднее значение скрывает локальный пик, как ответы в одном модуле соотносятся с ответами в другом.

Поэтому AI используется как интерпретационный аналитик. Он получает рассчитанный профиль и полный набор ответов, чтобы помочь увидеть паттерны, противоречия, выбросы и связи, которые могут быть важны для понимания результата.

Это не означает, что AI "открывает диагноз" или произвольно создаёт новые шкалы. Его задача — помочь аккуратно прочитать данные, а не заменить психометрическую методику.

Если измерительное ядро отвечает на вопрос "что посчитано", то AI помогает ответить на вопрос "как это связно понять и где не потерять важные детали".

Классические психометрические тесты

На платформе есть классические скрининговые и самоотчётные инструменты: шкалы тревоги, депрессии, стресса, сна, выгорания, личностных особенностей и других состояний.

Они нужны для первичной оценки: получить сигнал, увидеть уровень выраженности, сравнить результат с известными диапазонами и понять, где стоит смотреть внимательнее.

Для каждого теста важны вопросы:

  • что именно он измеряет;
  • для какой задачи был создан;
  • в какой популяции проверялся;
  • какие у него есть пороги и ограничения;
  • есть ли русскоязычная адаптация;
  • есть ли нормативные данные;
  • можно ли использовать его свободно или он защищён лицензией.

Психометрика не относится к классическим шкалам как к "устаревшим". Многие из них остаются полезными и незаменимыми в своих задачах. Но важно помнить: хороший скрининг не равен полной картине состояния.

Один тест обычно отвечает на один ограниченный вопрос. Например: насколько выражены симптомы тревоги или депрессии за определённый период. Он не всегда объясняет, почему это происходит, чем поддерживается, как связано со сном, телом, отношениями, работой или избеганием.

Поэтому классические тесты на платформе дают базовую оценку и интерпретацию, а более сложные продукты строятся на собственных модулях.

Авторские модули

Авторские модули Психометрики создаются на ядре Synmetrica Core.

Модуль — это не просто набор вопросов с итоговым баллом. Это структура, которая пытается описать состояние через несколько слоёв:

  • сигнал — что заметно в ответах;
  • выраженность — насколько это проявлено;
  • механизмы — за счёт чего состояние может удерживаться;
  • контекст — когда и где оно усиливается;
  • функциональная цена — во что это обходится человеку;
  • развилки — на что это может быть похоже и что важно уточнить;
  • следующий шаг — что разумно сделать дальше.

Например, тревога может выглядеть одинаково по общей выраженности, но быть устроена по-разному. У одного человека ведущим механизмом будет избегание, у другого — непереносимость неопределённости, у третьего — постоянный поиск заверений, у четвёртого — телесная настороженность.

Один балл не показывает эту разницу. Модуль должен помогать её увидеть.

Почему важны связанные модули

Психологические состояния редко существуют изолированно.

Тревога может усиливать нарушения сна. Плохой сон может повышать эмоциональную уязвимость. Сниженное настроение может маскироваться под усталость, раздражительность или потерю энергии. Функциональная цена может проявляться не в "симптомах", а в работе, отношениях, избегании и снижении устойчивости.

Поэтому первый продукт Психометрики строится не как один отдельный тест, а как связанный профиль состояния по нескольким модулям.

Задача такого профиля — не просто показать отдельные результаты, а собрать конфигурацию:

  • что выражено сильнее;
  • какие зоны связаны между собой;
  • где основной источник функциональной цены;
  • какие гипотезы выглядят более вероятными;
  • что стоит уточнить на следующем шаге.

Как разрабатывается авторский модуль

Каждый авторский модуль Психометрики создаётся по воспроизводимому плейбуку. Он опирается на HiTOP и RDoC как на концептуальные рамки, COSMIN как на методологию разработки самоотчётных инструментов и unified validity framework AERA/APA/NCME как на основу для честного разговора о валидности.

Упрощённо процесс выглядит так:

  1. Исследование области.
    Изучаются существующие шкалы, публикации, факторные модели, ограничения, слепые зоны и пересечения с соседними состояниями.

  2. Описание конструкта.
    Формулируется, что именно измеряет модуль: выраженность, механизмы, функциональная цена, контекст, safety-сигналы и связи с другими модулями.

  3. Blueprint модуля.
    Задаётся структура: какие блоки вопросов нужны, какие подшкалы планируются, какие ответы участвуют в скоринге, какие — в интерпретации, какие активируют маршрутизацию или safety-логику.

  4. Генерация и отбор вопросов.
    AI помогает создавать варианты пунктов, но эксперт отбирает и редактирует их по клинической точности, понятности, чувствительности и пригодности для самоотчёта.

  5. Правила скоринга и интерпретации.
    Определяются индексы, уровни выраженности, предварительные пороги, связи между блоками, ограничения и запреты для AI-интерпретации.

  6. Экспертное ревью.
    Проверяется, не делает ли модуль слишком сильных выводов, не смешивает ли разные конструкты, не звучит ли как диагноз, корректно ли обрабатывает риски и понятен ли пользователю.

  7. Пилотная проверка.
    Анализируются первые данные: распределения ответов, работа отдельных пунктов, внутренняя согласованность, предполагаемая структура, неожиданные паттерны и проблемные формулировки.

  8. Эмпирическая валидация.
    По мере накопления данных проверяются структурная валидность, надёжность, измерительная ошибка, конвергентные и дискриминантные связи, чувствительность к изменениям и возможные смещения.

  9. Калибровка и пересмотр.
    Пороги, веса, формулировки, индексы и интерпретационные правила уточняются не по вкусу, а по данным.

  10. Публикационный журнал.
    Для каждого модуля важно фиксировать, что уже проверено, что остаётся гипотезой, где использовался AI и какие claims допустимы на текущем уровне доказательности.

Уровни уверенности

Не все выводы одинаково надёжны. Одно дело — экспертная гипотеза на этапе пилота. Другое — результат, подтверждённый на большой выборке и воспроизведённый независимо.

Поэтому для собственных модулей используется градация статуса утверждений:

C1
Описательный уровень

Структура модуля и логика интерпретации описаны, но эмпирических данных ещё мало.

C2
Пилотный уровень

Есть первые данные и первичная проверка работы вопросов.

C3
Калиброванный уровень

Уточнены пороги, веса, структура шкал и индексов.

C4
Валидированный уровень

Накоплены доказательства связи с внешними критериями и соседними конструкциями.

C5
Реплицированный уровень

Результаты подтверждены на независимых выборках.

Платформа не должна говорить сильнее, чем позволяет текущий уровень данных.

Самоотчёт и его ограничения

Большая часть психометрических инструментов на платформе — это самоотчёт.

Самоотчёт полезен: только сам человек может описать многие внутренние состояния, мысли, страхи, сомнения, напряжение, избегание или субъективную цену симптомов.

Но у самоотчёта есть ограничения:

  • человек может недооценивать или переоценивать своё состояние;
  • ответы зависят от настроения в момент прохождения;
  • формулировки могут пониматься по-разному;
  • часть людей склонна соглашаться с утверждениями чаще других;
  • часть людей выбирает средние варианты;
  • часть отвечает так, как "должно быть", а не так, как есть;
  • уровень рефлексии влияет на результат.

Хороший отчёт должен помнить об этом. Поэтому результаты Психометрики формулируются как ориентиры и гипотезы, а не как окончательные заключения.

Safety-блок

Некоторые ответы требуют особой осторожности.

Если в профиле появляются признаки возможного риска — например, выраженное ухудшение функционирования, опасные импульсы, самоповреждающие мысли, психотические симптомы или другие red flags, — система должна не "анализировать красивее", а переключаться в режим безопасности.

Safety-блок нужен для того, чтобы:

  • не нормализовать потенциально опасные сигналы;
  • не давать ложного успокоения;
  • не подменять помощь текстовой интерпретацией;
  • мягко указать на необходимость обратиться за поддержкой;
  • при необходимости показать кризисные рекомендации.

AI не должен отменять safety-правила. Если правило безопасности сработало, оно имеет приоритет над обычной интерпретацией.

Что получает AI для интерпретации

AI в Психометрике работает не только с итоговыми баллами.

Для интерпретации он получает два уровня данных.

Первый уровень — рассчитанный профиль.
Это индексы, уровни выраженности, подшкалы, сработавшие механизмы, функциональные зоны, safety-флаги, маршрутизация и другие структурированные результаты, которые уже посчитаны измерительным ядром.

Второй уровень — полный паттерн ответов.
AI видит ответы пользователя на все вопросы модуля или нескольких связанных модулей. Это нужно не для того, чтобы "поставить диагноз", а чтобы заметить структуру ответа, которую нельзя свести к одному итоговому баллу.

Например, AI может помочь увидеть:

  • противоречивые или неоднородные ответы;
  • выбросы, когда один очень высокий ответ теряется на фоне низких средних значений;
  • локальные пики внутри подшкал;
  • необычные сочетания признаков;
  • расхождение между общей выраженностью и функциональной ценой;
  • связи между ответами внутри одного модуля;
  • связи между несколькими модулями;
  • возможные паттерны между доменами, если данные позволяют их осторожно рассматривать;
  • возможные связи, которые ещё не формализованы в методике как отдельные индексы.

Это важная часть интерпретации. Итоговый балл может быть умеренным или низким, но отдельный ответ, сочетание ответов или межмодульный паттерн могут указывать на то, что результат стоит читать осторожнее.

При этом AI не заменяет скоринг. Он не пересчитывает баллы, не меняет пороги и не объявляет скрытые связи доказанными. Если связь не заложена в методике и не прошла эмпирическую проверку, она формулируется как наблюдение или гипотеза, а не как установленный вывод.

Чего AI не делает

AI в Психометрике не должен:

  • ставить диагнозы;
  • назначать лечение;
  • отменять консультацию специалиста;
  • самостоятельно менять скоринг, пороги или уровни выраженности;
  • выдавать неформализованные паттерны за валидированные шкалы;
  • делать выводы из связей, которые пока являются только гипотезами;
  • игнорировать одиночные критически важные ответы, даже если общий балл невысокий;
  • сравнивать человека с нормами, которых нет;
  • придумывать психометрические свойства инструмента;
  • усиливать тревогу драматичными формулировками;
  • давать ложную уверенность;
  • игнорировать safety-сигналы.

Если результат можно сформулировать только как гипотезу, он должен быть сформулирован как гипотеза.

Что считается хорошим результатом

Хороший результат в Психометрике — это не самый длинный отчёт и не самый уверенный вывод.

Хороший результат должен быть:

  • понятным;
  • спокойным;
  • клинически осторожным;
  • связанным с ответами пользователя;
  • честным в ограничениях;
  • полезным для следующего шага;
  • пригодным для обсуждения со специалистом.

Он должен помогать человеку сказать: "Теперь я лучше понимаю, что со мной может происходить и о чём стоит поговорить дальше."

Но он не должен заставлять человека думать: "Теперь у меня есть диагноз."

Принципы методологии

Коротко методологию Психометрики можно описать так:

1
Не один балл, а профиль.

Важна не только выраженность, но и структура состояния.

2
Не ярлык, а конфигурация.

Результат должен показывать связи, механизмы и функциональную цену.

3
Не AI вместо измерения, а AI поверх измерения.

Модель объясняет рассчитанный профиль и полный рисунок ответов, но не создаёт результат произвольно.

4
Не диагноз, а ориентир.

Онлайн-инструмент может помочь подготовиться к разговору, но не заменить его.

5
Не ложная точность, а честный статус данных.

Предварительные пороги и гипотезы должны называться предварительными.

6
Не изолированные тесты, а связанные модули.

Состояния часто пересекаются, и продукт должен учитывать эти связи.

7
Не закрытая магия, а проверяемая архитектура.

Инструмент должен быть устроен так, чтобы его можно было валидировать, критиковать и улучшать.

8
Не категории вместо человека, а размерный профиль.

HiTOP и RDoC помогают смотреть на состояние как на пересекающуюся конфигурацию признаков и процессов, а не как на один ярлык.

9
Не «валидный тест» как лозунг, а проверяемые claims.

COSMIN и AERA/APA/NCME нужны, чтобы каждый вывод имел понятный статус: что уже проверено, на какой выборке, для какой задачи и с какими ограничениями.

Читать дальше

  • О проекте — что такое Психометрика и зачем она появилась
  • Миссия — куда движется платформа и зачем ей AI-native архитектура
  • Команда — кто отвечает за проект
  • Каталог тестов — бесплатные психометрические инструменты
  • Блог — клинические и методологические материалы