Psychometrica задумывалась как платформа с валидированными тестами. Логика казалась безупречной: берёшь инструменты, за которыми стоят десятилетия исследований, — PHQ-9, GAD-7, ASRS, шкала Бека, — оцифровываешь, делаешь доступными. Банк валидированных вопросов — это актив. Каждый вопрос проверен, каждая шкала откалибрована, за каждой нормой — выборка в тысячи человек. Зачем изобретать, когда можно взять лучшее?
Я так и сделал. Собрал больше ста тестов. И довольно быстро понял, что один тест — это одна линза. PHQ-9 видит депрессию, GAD-7 — тревогу, CBI — выгорание. Каждый отвечает на вопрос «есть ли это и насколько выражено». Ни один не отвечает на вопрос, с которым человек на самом деле приходит: «что со мной?»
Человек устал, потерял интерес к работе, плохо спит. PHQ-9 — четырнадцать баллов, умеренная депрессия. CBI — высокое выгорание. Два числа, оба правдивы, оба не помогают. Потому что тесты проектировались для измерения, а не для дифференциации.
Когда ответы заговорили между собой
Тогда появились чекапы — связки из двух-трёх тестов, объединённых клинической логикой. Не просто «пройдите ещё один тест», а осмысленная пара, где каждый инструмент закрывает слепую зону другого. GAD-7 ловит когнитивную тревогу, но пропускает соматическую. Другой инструмент — наоборот. Вместе — полный спектр. А расхождение между ними — диагностический сигнал.
Связка оправдана, только если она даёт что-то сверх прохождения тестов по отдельности. Если не даёт — это не продукт, а просто два теста рядом.
Результаты были хорошие. Но по-настоящему интересное произошло, когда я перестал смотреть на итоговые баллы и начал анализировать отдельные ответы.
В разных тестах встречаются вопросы об одном и том же. PHQ-9 спрашивает про концентрацию — ASRS тоже. Если по PHQ-9 высокие ангедония и подавленность, а концентрация снижена — скорее депрессия, а не СДВГ. Но если концентрация снижена при нормальном настроении — совсем другая картина. Этого не увидишь, если сравниваешь только суммарные баллы. Это видно только на уровне отдельных ответов, на пересечении шкал.
Я начал передавать AI-интерпретатору не итоговые баллы, а все ответы на все вопросы всех тестов в связке. И результат стал качественно другим. Нейросеть — топовая модель, не тонкая настройка — видела паттерны, которые невидимы при взгляде на суммы шкал. Расхождения между ответами на похожие вопросы в разных тестах. Комбинации, которые указывали не просто на «высокую тревогу», а на конкретный тип тревоги, на конкретный механизм.
Тогда я добавил к каждой связке два-три дополнительных вопроса — не из стандартных тестов, а разработанных специально для закрытия конкретных слепых зон. PHQ-9 спрашивает «нарушения сна» — но не уточняет, в какую сторону, а гиперсомния и инсомния — принципиально разный клинический сигнал. ASRS оценивает последние полгода — но СДВГ по определению присутствует с детства, и один вопрос «это у вас всегда или появилось недавно?» может быть информативнее всего теста.
Отдельная находка — forced-choice: вместо шкалы «от нуля до трёх» человек выбирает между двумя клиническими описаниями. Это буквально реализует дифференциальную задачу: «это больше похоже на A или на B?» Снимается response bias — нельзя ответить «всё на максимум». Четыре варианта: A, B, «подходят оба», «ни одно». Третий — сигнал коморбидности. Четвёртый — сигнал атипичности.
А потом — открытые вопросы. Короткий персональный нарратив: как человек сам описывает то, что с ним происходит, своими словами. Грамотно составленный промпт, валидированные данные как основа, нарратив как контекст — и результат получался такой, что я впервые подумал: это может быть настоящим коммерческим продуктом.
Стена, о которую не хочется говорить
Я засучил рукава. И довольно быстро обнаружил то, о чём в русскоязычном психометрическом сообществе почти не говорят.
У всех валидированных тестов есть правообладатели. Не в абстрактном смысле — в юридическом. PHQ-9, который кажется «общедоступным», распространяется через Pfizer и имеет условия использования. BDI-II (шкала Бека второй редакции) — собственность Pearson Clinical, коммерческое использование без лицензии запрещено. Опросник Янга, ASRS, MDQ — у каждого свои ограничения, свои правообладатели, свои условия.
Более того, даже тесты, опубликованные под открытыми лицензиями вроде Creative Commons, часто содержат ограничение NonCommercial. Для исследований — пожалуйста. Для клинической практики в государственной больнице — скорее всего да. Для коммерческого цифрового продукта — нет.
Можно было забить. Особенно в текущих геополитических условиях, когда правоприменение размыто, а многие российские платформы используют эти тесты без каких-либо лицензий. Я знаю, что так делают. Я понимаю, почему так делают.
Но для меня это было бы воровством. Не юридически — этически. Я использую чужую работу, чужие формулировки, результат чужих исследований и клинических испытаний — и зарабатываю на этом деньги, не заплатив авторам. Можно называть это пиратством, нарушением авторских прав, издержками рынка. Суть одна: я беру то, что мне не принадлежит.
Я деактивировал на платформе коммерческое использование тестов с жёсткими лицензионными ограничениями. Сами тесты остались в бесплатной части — там, где их использование легально. И полностью отказался от идеи строить коммерческие продукты на лицензированных инструментах.
Ограничения как двигатель
Отказываться от идеи я не хотел. Всё, что я увидел — кросс-анализ ответов, дифференциальные связки, AI-интерпретация, персональный нарратив — работало. Работало хорошо. Проблема была не в методе, а в материале.
И тогда я подумал вещь, которая в тот момент показалась мне дерзкой, а теперь кажется единственно логичной: нужно делать свои инструменты.
Не адаптировать чужие. Не «модифицировать» (что часто эвфемизм для «скопировать с изменениями»). А проектировать с нуля — свои конструкты, свои формулировки, свою шкалу, свою структуру. Инструменты, которые принадлежат мне, потому что созданы мной.
Это казалось пугающим: двадцать лет я работал с валидированными инструментами и привык доверять именно их валидированности. Создать свой тест — значит начать без норм, без факторного анализа, без опубликованных данных о надёжности. Начать с нуля.
Но «с нуля» — не значит «в пустоте». За спиной — клинический опыт. Тысячи пациентов, тысячи интервью, тысячи наблюдений за тем, какие вопросы работают, а какие — нет. Не каждый клиницист программирует, но каждый клиницист знает, какие вопросы вскрывают суть, а какие уводят в общие места. Это знание, которое нельзя заменить факторным анализом, — и которое факторный анализ потом подтвердит или опровергнет.
Ограничения сделали то, что не сделало бы никакое количество свободных ресурсов: заставили думать не «какой готовый тест взять», а «какой вопрос задать». Это принципиально другой масштаб ответственности — и другой масштаб свободы.
Так появились авторские инструменты Психометрики. Первый домен — тревога, пятьдесят пять вопросов, каждый — мой. Без лицензионных ограничений, без юридических рисков, без этического компромисса.
Тест пока линейный, данных пока нет, валидация впереди. Но впервые за всё время работы над проектом я чувствую, что стою на своей земле. Не арендованной, не спорной — своей. И то, что на ней вырастет, будет зависеть только от того, хорошие ли вопросы я задал.
Через двадцать лет практики выясняется: самый трудный вопрос — не тот, который задаёшь пациенту. А тот, который задаёшь себе. Готов ли я отвечать за каждое слово в каждом пункте? Готов ли к тому, что данные покажут: половина моих «интуитивно точных» формулировок не работает?
Готов. Потому что лучше свои вопросы, которые можно улучшить, чем чужие, которые нельзя менять.
Как устроен первый модуль — Профиль тревоги. Как бот превратился в адаптивную систему — от бота к адаптивному тестированию. Как клиническая практика привела к трансдоменной архитектуре — когда всё связано. Методология ядра — psychometrica.pro/methodology/core.