Богданов Я.В.
ГБУЗ Кузбасская клиническая психиатрическая больница, Кемерово, Россия
Резюме
Данное исследование посвящено применению методов компьютерного зрения и многопараметрического анализа для оценки симптоматики шизофрении. В ходе работы был проведен количественный анализ графической и текстовой продукции пациентов с шизофренией и здоровых испытуемых. Исследование включало сравнение результатов с оценками по шкале PANSS и сопоставление данных пациентов со здоровым контролем. Результаты показали значимые различия между группами в выполнении графических и текстовых заданий, а также выявили корреляции между характеристиками выполнения заданий и выраженностью симптомов шизофрении. Особенно информативными оказались задания на рисование лиц, демонстрирующие наиболее сильные корреляции с негативными симптомами. Полученные данные могут быть использованы для разработки новых методов оценки и мониторинга состояния пациентов с шизофренией.
Ключевые слова: Шизофрения, Компьютерное зрение, Многопараметрический анализ, PANSS (Шкала позитивных и негативных синдромов), Количественный анализ, Корреляционный анализ, Рисунок лица, Несуществующее животное.
Информация об авторе:
Богданов Ярослав Вячеславович – e-mail: yarik@yabogdanov.ru; https://orcid.org/0009-0002-3880-7152
Как цитировать: Богданов Я.В., Интеграция компьютерного зрения и многопараметрического анализа в оценку симптоматики шизофрении: количественный анализ графической и текстовой продукции, корреляции с шкалой PANSS и сравнение со здоровым контролем
Автор, ответственный за переписку: Богданов Ярослав Вячеславович – e-mail: yarik@yabogdanov.ru
Введение
Актуальность
Шизофрения является психическим расстройством, диагностика и оценка которого часто представляют значительные трудности для клиницистов. Существующие методы оценки, такие как шкала PANSS, в значительной степени основаны на субъективном мнении специалиста. В связи с этим разработка объективных, количественных методов оценки симптоматики шизофрении представляется крайне актуальной задачей (1). Применение методов компьютерного зрения и многопараметрического анализа открывает новые возможности для объективизации оценки состояния пациентов (2). Кроме того, анализ графической и текстовой продукции может предоставить дополнительную информацию о когнитивных и эмоциональных аспектах заболевания, что может способствовать более глубокому пониманию природы шизофрении и разработке новых подходов к ее диагностике и лечению (1).
Цель исследования
Целью данного исследования является разработка и оценка эффективности метода количественного анализа графической и текстовой продукции пациентов с шизофренией с использованием компьютерного зрения и многопараметрического анализа для объективной оценки симптоматики заболевания.
Задачи исследования
1. Провести количественный анализ созданной пациентами и здоровыми испытуемыми графической продукции с использованием методов компьютерного зрения, включая оценку размера файлов и количества пикселей в изображениях.
2. Сравнить количественные характеристики графической и текстовой продукции пациентов с шизофренией и здоровых испытуемых.
3. Исследовать корреляции между количественными характеристиками продукции и оценками по шкале PANSS у пациентов с шизофренией.
4. Оценить информативность различных типов заданий (рисование лиц, рисование несуществующих животных, написание текстов) для оценки симптоматики шизофрении.
5. Проанализировать связь между негативными, позитивными симптомами и общей психопатологией по шкале PANSS и характеристиками выполнения различных заданий.
6. На основе полученных данных разработать рекомендации по использованию количественного анализа графической и текстовой продукции для оценки и мониторинга состояния пациентов с шизофренией.
Материал и методы исследования: исследование проведено в соответствии с разработанным протоколом. Это сравнительное когортное исследование с использованием методов компьютерного зрения для анализа данных. В ходе исследования были отобраны две группы участников - контрольная группа здоровых и основная группа пациентов с шизофренией. В группе здоровых 126 волонтёров, в группе пациенты 113 человек. В группе здоровых мужчин было 46,03%, а женщин 53,97%. В группе пациентов 51,33% были женского пола, а 48,67% - мужского. В обоих группах образовательный уровень различался несущественно. Различия в социальном статусе были обусловлены инвалидизирующим характером течения психического расстройства у пациентов. Оценивался ряд социальных показателей и клинические характеристики психического расстройства у пациентов – форма заболевания, тип течения, ведущий синдром, аддиктивное поведение, общественно опасное поведение, комплаэнс и ряд других характеристик, некоторые из этих характеристик в рамках данной статьи не рассматриваются, хотя и были исследованы. В группу пациентов вошли граждане, получавшие амбулаторное, либо стационарное лечение в ККПБ, а также проживающие в Кедровском психоневрологическом интернате. Группу здоровых составили сотрудники ККПБ, студенты ряда ВУЗов, колледжей г. Кемерово, родственники сотрудников ККПБ, пожелавшие принять участие в исследовании и выразившие добровольное информированное согласие.
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Здоровые |
126 |
33.00 |
34.70 |
13.10 |
171.49 |
1.17 |
23.00 |
47.00 |
Пациенты |
113 |
45.00 |
45.88 |
11.91 |
141.91 |
1.12 |
38.00 |
54.00 |
Пациенты оказались в среднем старше (среднее 45.88 против 34.70 у здоровых), а также имеют меньшую дисперсию и стандартное отклонение.



Тест Манна-Уитни: U-статистика: 3985.5, значение p-value: 4.25х10-9 Этот результат указывает на значительное различие между возрастами здоровых и пациентов (p-value значительно меньше 0.05). Т-тест: статистика: -6.87. Значение p-value: 5.48х10-11 Тест также указывает на статистически значимые различия между двумя группами. Гистограммы и ящики с усами показали различия в распределении возрастов для здоровых и пациентов.
Критерии включения в группу пациентов были следующими: пациенты с установленным, не вызывающим сомнение диагнозом шизофрения (любые формы), с длительностью наблюдения более года, психическое состояние которых позволяет принять участие в клиническом интервью и в выполнении рисуночных тестов в возрасте старше 18 лет. Критерии исключения: пациенты, диагноз которых вызывает сомнение, имеющаяся клиническая картина по-разному интерпретируется разными психиатрами. Период наблюдения менее года. Психическое состояние пациентов не позволяет принять участие в клиническом интервью и в выполнении рисуночных тестов. Выраженная коморбидная психическая патология (диагноз другого психического расстройства). Выраженные сопутствующие органические поражения ЦНС, включая эпилептические синдромы, психоорганический синдром. Каждому из испытуемых данной группы присваивался номер, например «Ш001, Ш002», персональные данные в обработке результатов исследования не использовались.
Критерии включения в группу здоровых испытуемых: здоровые граждане, пожелавшие принять участие в интервью и в выполнении рисуночных тестов. Критерии исключения: здоровые граждане, пожелавшие принять участие в исследовании, заявившие о том, что, возможно, имеют какое-то психическое расстройство, наблюдающиеся у врача-психиатра, либо медицинского (клинического) психолога, в отношении которых возникает сомнение в полном психическом здоровье. Каждому из испытуемых данной группы присваивался номер, например «З001, З002», персональные данные в обработке результатов исследования не использовались.
Были разработаны тестовый бланк «Лицо человека», тестовый бланк «Несуществующее животное», тестовый бланк «Написание текста», инструкция по проведению исследования, стандартизированные опросники для пациентов и здоровых лиц, бланки добровольных информированных согласий на участие в исследовании.
Каждый испытуемый рисовал по два изображения лица человека на бланке «Лицо человека» и 2 изображения несуществующего животного на бланке «Несуществующее животное», три текста на бланке «Написание текста». Все записи и рисунки проводились стандартной авторучкой STAFF артикул 143868 с чернилами синего цвета на бумаге Svetocopy формат А4. Для обработки изображений и перевода их в электронную форму использовалось МФУ Pantum M6506NW разрешение 300 dpi, цветной, прилагающееся к нему ПО. Шариковая авторучка одного артикула и одного цвета чернил была выбрана для выполнения тестовых заданий по двум причинам: для унификации задании, выполненных всеми участниками исследования, в отличие от карандашного рисунка, авторучка даёт линию примерно одинаковой толщины и насыщенности, что упрощает последующую оценку и цифровую обработку.
Полученные результаты заносились в базу данных КГУ, Microsoft Exel. Графический анализ проводился с помощью оригинального программного продукта разработанного специально для данного исследования Pixelcounter, написанного на языке Pyton, использующего библиотеку компьютерного зрения OpenCV. Данный программный продукт подсчитывает количество пикселей, занятых изображением.
Количественный анализ изображений проводился также по абсолютному размеру файла в байтах. Нами выявлена зависимость детализованности изображений от абсолютного размера файла, в котором изображение храниться (формат jpeg).
Исследована зависимость размера файла и количеством пикселей занятых изображением с помощью метода корреляционного анализа. Корреляции между байтами и пикселями оказались следующими: a) Сумма байт/сумма пикс.: 0,823706004 б) Лицо байт/лицо пикс.: 0,780290148 в) Животное байт/животное пикс.: 0,816002537 г) Текст байт/текст пикс.: 0,855008006. Все корреляции сильные положительные (>0,7). Наиболее сильная корреляция для текстов, наименьшая - для лиц. Это указывает на высокую согласованность между размером файла в байтах и количеством занимаемых пикселей. Различия могут быть связаны с особенностями сжатия разных типов изображений и текстов.
Статистическая обработка результатов проводилась с помощью программ на языке Pyton с использованием библиотек SciPy (библиотека для языка программирования Python с открытым исходным кодом, предназначенная для выполнения научных и инженерных расчётов) и NumPy (библиотека с открытым исходным кодом для языка программирования Python. поддержка многомерных массивов (включая матрицы), поддержка высокоуровневых математических функций, предназначенных для работы с многомерными массивами). Проводились вычисления средних величин, среднеквадратического отклонения, ошибки средней, медианы, квартилей, дисперсии, статистический анализ вариационных рядов, выявление коррелятивных связей, Т-анализ, проведение теста Манна-Уитни, графический анализ box plot (ящики с усами), гистограммы рядов. Для построения гистограмм и ящиков с усами использован MS Exel 2016 . Для T-теста использовалась функция scipy.stats.ttest_ind(). Для теста Манна-Уитни — scipy.stats.mannwhitneyu().Эти функции применялись к рядам данных, и на их основе вычислялись статистические параметры и значения P.
Результаты исследования
Пациенты рисовали лица, рисовали несуществующее животное, писали тексты на заданные темы в стандартных условиях. Затем проводилось измерение размеров файлов нарисованных ими лиц, несуществующих животных, написанных текстов, а также с помощью специальной программы измерялось количество пикселей, занятых рисунками и текстами, затем искались корреляции между числами в байтах и пикселях, а также корреляции между величинами рисунков в рядах и различных показателей по шкале PANSS в этих же рядах, кроме того вычислялась доля отдельных тестов в общем объеме задания, то есть выяснялись отношения частного к целому. Ниже приведены примеры выполнения тестов пациентами и здоровыми испытуемыми, в левом столбце изображения, выполненные пациентами, а в правом – здоровыми испытуемыми:






Результаты вычислений
1. Ряды «Сумма в байтах в трёх тестах»
Вычислялся общий объём выполненных заданий во всех тестах (рисование лица, несуществующего животного, написание текста) в байтах для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 2: «Ряд 1, сумма (байт), в трёх тестах, здоровые. Ряд 2, сумма (байт), в трёх тестах, пациенты»
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд1(з) |
126 |
1949228.5 |
2044170.07 |
615846.66 |
379267106578.76 |
55 082,99 |
1584062.75 |
2469981.25 |
Ряд2 (п) |
113 |
1432423.0 |
1463824.33 |
367256.78 |
134877539962.38 |
34702,51 |
1178624.0 |
2469981.25 |
(з) –здоровые, (п) – пациенты: во всех последующих таблицах понимать так же
Гистограммы и ящики с усами (box plots) для каждого ряда.



Гистограмма для ряда 1 показывает распределение значений, большинство из которых сосредоточены в интервале от 1,5 до 3 млн. Значения выше 3 млн. являются редкими. Гистограмма для ряда 2 показывает более равномерное распределение с пиком в диапазоне от 1 до 1,5 млн. Ящики с усами (box plots): Ящик с усами для ряда 1 показывает, что большая часть данных сосредоточена между Q1 и Q3 (от 1,58 до 2,47 млн). Есть несколько выбросов выше 3 млн. Ящик с усами для ряда 2 показывает, что данные более равномерно распределены и также содержат несколько выбросов выше 2,5 млн. T-тест для сравнения средних значений: Т-статистика: 8.686, P-значение: 6.22×10−16. Тест Манна-Уитни для сравнения распределений: U-Статистика: 11219.0, P-значение: 1.56×10−14. Ряд 1 имеет большее среднее значение, медиану и дисперсию по сравнению с рядом 2. Размах в ряде 1 также больше, что указывает на более широкое распределение значений. Гистограмма и ящик с усами для ряда 1 показывают более значительные выбросы и больший размах данных. Ряд 2 имеет более равномерное распределение с пиком в диапазоне от 1 до 1,5 млн. Результаты t-теста и теста Манна-Уитни показывают, что различия между рядами статистически значимы (p-значения значительно меньше 0.05), что указывает на то, что ряды имеют различное среднее значение и распределение. В целом, ряды существенно отличаются по своим характеристикам, что подтверждается как основными статистическими параметрами, так и результатами тестов гипотез.
2. Ряды «Лицо в байтах»
Вычислялся объём выполненного задания по рисованию лиц в байтах для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 3: "Лицо в байтах, здоровые", "Лицо в байтах, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд3 (з) |
126 |
597298 |
623468.73 |
234187.39 |
54843732528.96 |
20853.73 |
443877.75 |
754019.25 |
Ряд4 (п) |
113 |
415775 |
417532.05 |
367256.78 |
9950993043.98 |
34614.61 |
344154 |
473446 |
Гистограммы и ящики с усами (box plots) для каждого ряда.



На гистограмме видно, что значения в первом ряду более распределены, с большим числом высоких значений, чем во втором ряду. На "ящике с усами" заметно, что у первого ряда больший разброс данных, в то время как данные второго ряда более сконцентрированы.
Т-тест для сравнения средних значений: Статистика: 8.63, p-значение: 8.87х10-16. Тест Манна-Уитни для сравнения распределений: U-Статистика: 11242, p-значение: 1.11х10-14. Средние значения между рядами значительно различаются, что подтверждается результатами Т-теста (p-значение < 0.05). Распределения данных также различаются, что подтверждается результатами теста Манна-Уитни (p-значение < 0.05). Графический анализ подтверждает более широкое распределение данных в первом ряду.
3. Ряды «Животное в байтах».
Вычислялся объём выполненного задания по рисованию несуществующих животных в байтах для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 4: "Животное в байтах, здоровые", "Животное в байтах, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд5 (з) |
126 |
580521 |
607259.17 |
201381.96 |
40554693004.42 |
50074,73 |
451472.25 |
724810.25 |
Ряд6 (п) |
113 |
435222.0 |
438247.08 |
102439.09 |
9950993043.98 |
41305.1 |
369954 |
495784 |
Гистограммы и ящики с усами (box plots) для каждого ряда.



Гистограммы показывают распределение значений: у здоровых людей значения более равномерно распределены и имеют более широкое распределение, с некоторым смещением в правую сторону. У пациентов распределение более сконцентрировано около центральных значений, с меньшим диапазоном и без выраженного смещения. Ящики с усами (Box Plot) показывают распределение данных по квартилям: у здоровых людей наблюдается больший размах значений (более длинные "усы"), что говорит о большей вариативности в данных. У пациентов значения более компактны, что указывает на меньшую вариативность. Т-тест для сравнения средних значений: Статистика t-теста: 8.036, значение p-value: 4.37х10 -14. Этот результат указывает на то, что разница в средних значениях между двумя группами статистически значима (p-value значительно меньше 0.05). Тест Манна-Уитни для сравнения распределений: Статистика Манна-Уитни: 10878.0, Значение p-value: 1.88х10 -122. Тест Манна-Уитни также показывает, что распределения значений между двумя группами существенно различаются (p-value также меньше 0.05). Иными словами, обе группы (здоровые и пациенты) имеют значимые различия как в средних значениях, так и в распределении значений.
4. Ряды "Здоровые, текст, в байтах. Пациенты, текст, в байтах"
Вычислялся объём выполненного задания по написанию текстов в байтах для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 5: " Здоровые, текст, в байтах ", " Пациенты, текст, в байтах ":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд7 (з) |
126 |
814624.5 |
813442.17 |
291619.89 |
85042158825.17 |
72434.74 |
574755.75 |
1005445 |
Ряд8 (п) |
113 |
562945.0 |
608045.19 |
225091.04 |
9950993043.98 |
57308.7 |
439598 |
706402 |
Гистограммы и ящики с усами (box plots) для каждого ряда.



На графиках выше представлены гистограммы и ящики с усами для обеих групп. По гистограммам видно, что распределение значений у здоровых имеет более высокий пик в районе среднего значения, а у пациентов распределение смещено влево и имеет большее количество низких значений. Ящики с усами также показывают, что у здоровых медиана и квартильные значения выше, чем у пациентов. Т-тест для сравнения средних значений: Статистика: 6.02, P-значение: 6.62 х10 -9. Различия между средними значениями статистически значимы (p<0.05).Тест Манна-Уитни для сравнения распределений: Статистика: 10194.0, P-значение: 8.34х10 -9. Различия между распределениями статистически значимы (p<0.05). Таким образом, результаты анализа показывают, что между двумя группами существуют значимые различия как в средних значениях, так и в распределении данных.
5. Доли отдельных тестов в общем объёме выполненных работ в группе пациентов и здоровых испытуемых
Вычислялась доля рисуночного теста «Лицо человека» в общем объёме выполненного задания (сравнивались отношения чисел в байтах) для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 6: " Лицо/сумма, здоровые ", " Лицо/сумма, пациенты ":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд9 (з) |
126 |
0.305 |
0.305 |
0.060 |
0.0036 |
0.0271 |
0.266 |
0.341 |
Ряд10 (п) |
113 |
0.286 |
0.289 |
0.038 |
0.0014 |
0.0272 |
0.2628 |
0.315 |
Т-тест: Т-статистика: 2.43, P-значение: 0.016. Есть статистически значимая разница между двумя группами на уровне значимости 0.05. Тест Манна-Уитни: статистика: 8269.0, P-значение: 0.031. Существует незначительная разница между распределениями двух групп. Эти результаты показывают, что между группой здоровых участников и группой пациентов существуют незначительные различия в их данных, что подтверждается как параметрическим, так и непараметрическим тестами.
Вычислялась доля рисуночного теста «Несуществующее животное» в общем объёме выполненного задания (сравнивались отношения чисел в байтах) для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 7: " Животное/сумма, здоровые ", " Животное/сумма, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд11 (з) |
126 |
0.2982 |
0.2986 |
0.0488 |
0.0024 |
0.0043 |
0.2591 |
0.3284 |
Ряд12 (п) |
113 |
0.3037 |
0.3030 |
0.0359 |
0.0013 |
0.0033 |
0.2890 |
0.3298 |
Разница в среднем значении и разбросе данных между группами относительно небольшая, но заметна: у пациентов более низкая дисперсия и стандартное отклонение, что говорит о меньшей вариативности данных. Т-тест для двух независимых выборок: t-статистика: 0.903, p-значение: 0.367. Поскольку p-значение (0.367) значительно выше уровня значимости (например, 0.05), то различия между группами "пациенты" и "здоровые" статистически незначимы. Тест Манна-Уитни: U-статистика: 7716.0, p-значение: 0.218. Здесь также p-значение (0.218) превышает стандартный порог (0.05), что говорит о том, что разница между распределениями значений в выборках "пациенты" и "здоровые" не является статистически значимой.
Вычислялась доля теста «Написание текста» в общем объёме выполненного задания (сравнивались отношения чисел в байтах) для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 8: " Текст/сумма, здоровые ", "Текст/сумма, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд13 (з) |
126 |
0.396 |
0.393 |
0.053 |
0.0028 |
0.0047 |
0.357 |
0.446 |
Ряд14 (п) |
113 |
0.396 |
0.399 |
0.055 |
0.0030 |
0.0051 |
0.358 |
0.447 |
Т-тест: статистика: -0.838, p-значение: 0.403. p-значение больше стандартного уровня значимости (0.05), что указывает на отсутствие статистически значимых различий между средними значениями двух групп. Тест Манна-Уитни: статистика: 6662.0, p-значение: 0.993. p-значение также значительно больше 0.05, что указывает на отсутствие значимых различий в распределениях двух групп.
Эти результаты указывают на то, что доля отдельных тестов в объёме всего задания и у здоровых испытуемых и у пациентов примерно одинакова, существенных различий не выявлено.
6. "Лицо, пиксели, здоровые", "Лицо, пиксели, пациенты".
Вычислялся объём выполненного задания по рисованию лиц в пикселях для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 9: "Лицо, пиксели, здоровые" "Лицо, пиксели, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд15 (з) |
126 |
260314.0 |
291376.4 |
177407.1 |
31473279140.16 |
15797.6 |
170079.25 |
365547.25 |
Ряд16 (п) |
113 |
108390.0 |
123497.3 |
52550.6 |
2761569914.05 |
4943.6 |
92794.0 |
137554.0 |
Среднее значение и медиана значительно выше у здоровых людей. Стандартное отклонение и дисперсия у здоровых значительно выше, что указывает на более широкий разброс значений.
Гистограммы и ящики с усами (box plots) для каждого ряда.



Результаты статистических тестов: T-тест: Т-статистика = 9.68, p-значение = 6.71×10-19. Это указывает на значимые различия между двумя рядами. Тест Манна-Уитни: U-статистика = 12472.0, p-значение = 1.12×10-23, что также говорит о существенных различиях. Гистограммы распределений и ящики с усами (boxplots) наглядно показывают различия в распределениях значений для двух групп ("здоровые" и "пациенты").
7. «Животное, пиксели, здоровые», «Животное, пиксели, пациенты»
Вычислялся объём выполненного задания по рисованию несуществующих животных в пикселях для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 10: "Животное, пиксели, здоровые" "Животное, пиксели, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд 17 |
126 |
191194.50 |
246499.13 |
133641.76 |
17860115686.51 |
11900.42 |
143461.00 |
316349.00 |
Ряд 18 |
113 |
117819.00 |
134233.96 |
57909.31 |
3353488547.25 |
5447.72 |
96743.00 |
147880.00 |
Гистограммы и ящики с усами (box plots) для каждого ряда.



Среднее для здоровых значительно выше, чем для пациентов. Это может указывать на то, что рисунки животных, выполненные здоровыми волонтёрами в среднем занимают большую площадь на изображениях или изображены с более высокой детализацией. Медианное значение для здоровых также существенно выше, чем для пациентов. Это подтверждает тенденцию, наблюдаемую в средних значениях, и указывает на то, что различие не вызвано выбросами. Стандартное отклонение для здоровых животных более чем в два раза превышает значение для пациентов. Это говорит о большей вариативности у здоровых испытуемых. Данные по дисперсии согласуется с наблюдением о большей вариативности данных для здоровых животных. Все квартильные значения для здоровых выше соответствующих значений для пациентов. Это указывает на систематическое различие в распределении данных между двумя группами. t-статистика: 8.7869, p-значение: 1.1825х10 -16; p-значение намного меньше уровня значимости 0.05, что позволяет нам отвергнуть нулевую гипотезу. Это означает, что существует статистически значимое различие между средними значениями количества пикселей в изображениях несуществующих животных в двух рядах. Тест Манна-Уитни (U-тест): U-статистика: 3325.0, p-значение: 1.1243х10 -14; p-значение намного меньше уровня значимости 0.05, что позволяет нам отвергнуть нулевую гипотезу. Это указывает на статистически значимое различие в распределении внутри рядов.
8. «Текст, пиксели, здоровые», «Текст, пиксели, пациенты»
Вычислялся объём выполненного задания по написанию текстов в пикселях для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 11: "Текст, пиксели, здоровые" "Текст, пиксели, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд 19 (з) |
126 |
338847.50 |
360641.48 |
176936.66 |
31306571852.67 |
15755.71 |
207219.00 |
495089.00 |
Ряд 20 (п) |
113 |
197868.50 |
217233.81 |
114355.04 |
13077075950.12 |
10757.76 |
132275.00 |
269452.00 |
Гистограммы и ящики с усами (box plots) для каждого ряда.



Среднее количество пикселей для здоровых значительно выше, чем для пациентов. Это явно указывает на то, что тексты здоровых в среднем длиннее. Медианное значение для текстов здоровых испытуемых также существенно выше, чем для пациентов. Это подтверждает тенденцию, наблюдаемую в средних значениях, и указывает на то, что различие не вызвано выбросами. Стандартное отклонение для здоровых текстов выше, чем для пациентов. Это говорит о большей вариативности в количестве пикселей для здоровых испытуемых. Дисперсия подтверждает это предположение. Все квартильные значения для текстов здоровых выше соответствующих значений для пациентов. Это указывает на систематическое различие в распределении данных между двумя группами. T-тест: t-статистика: 7.3488, p-значение: 9.7631х10 -13; p-значение намного меньше стандартного уровня значимости 0.05, что позволяет нам утверждать, что существует статистически значимое различие между средними значениями количества пикселей в текстах здоровых и пациентов. Тест Манна-Уитни (U-тест): U-статистика: 3397.0, p-значение: 1.0234х10 -11; p-значение намного меньше стандартного уровня значимости 0.05, что указывает на статистически значимое различие в распределении количества пикселей между группами здоровых и пациентов.
9. "Сумма, пиксели, здоровые" "Сумма, пиксели, пациенты"
Вычислялся общий объём выполненных заданий во всех тестах (рисование лица, несуществующего животного, написание текста) в пикселях для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Таблица 12: "Сумма, пиксели, здоровые" "Сумма, пиксели, пациенты":
Ряд |
N |
Медиана |
Ср. арифм. |
Ст. отклон. |
Дисп. |
Ошибка средней |
1кварт. |
3 кварт. |
Ряд 21 (з) |
126 |
883372.5 |
915062.07 |
395009.52 |
156032519158.65 |
35174.489 |
577428.5 |
1186675.5 |
Ряд 22 (п) |
113 |
439020.0 |
478778.11 |
180918.25 |
32731414172.29 |
45040.27 |
363675 |
554123 |
У ряда "здоровых" данные больше по среднему и имеют более высокое стандартное отклонение, что указывает на больший разброс значений. Ряд "пациентов" характеризуется меньшими значениями во всех основных статистических параметрах, что может свидетельствовать о более узком диапазоне изменений.
Гистограммы и ящики с усами (box plots) для каждого ряда.



Тест Манна-Уитни: U-статистика: 12338.0. Р-значение: 1.38×10⁻²². T-тест: t-статистика: 10.73, p-значение: 3.88×10⁻²². p-значения в обоих тестах очень малы, что свидетельствует о значительных различиях между двумя рядами данных. Тест Манна-Уитни показывает, что распределения данных в рядах "здоровые" и "пациенты" статистически значимо различаются. T-тест подтверждает это различие, с учётом предположения о нормальности данных. Гистограммы показывают, что распределение данных у здоровых шире и имеет больший разброс, чем у пациентов. Boxplot демонстрирует больший размах и медиану значений у здоровых по сравнению с пациентами.
10. Исследование зависимостей между параметрами изображений и клинико-психопатологической симптоматикой по шкале PANSS в группе пациентов
Исследование проводилось методом корреляционного анализа. Сравнивались количественные показатели по рядам у каждого пациента с значениями по шкале PANSS.
Таблица 13. Корреляции PANSS и результатов тестов в байтах
|
Сумма PANSS |
PANNS P |
PANSS N |
PANSS O |
Лицо байт |
-0,272380418 |
-0,120009666 |
-0,295565258 |
-0,211423651 |
Животное байт |
-0,040311604 |
-0,058279949 |
-0,081499683 |
0,028882351 |
Текст байт |
-0,228735631 |
-0,140040933 |
-0,218962456 |
O -0,192120006 |
Сумма байт |
-0,225370191 |
-0,102244032 |
-0,23711538 |
-0,167156687 |
В строке «Лицо байт» все корреляции отрицательные, что указывает на обратную связь между размером файла и оценками PANSS. Корреляции варьируются от слабых до умеренно слабых. Чем выше общий балл PANSS, тем меньше размер файла рисунка. Лицо байт/PANSS P: наименее выраженная связь среди всех субшкал. Лицо байт/PANSS N (Негативные симптомы): наиболее сильная корреляция среди всех субшкал. Приближается к умеренной отрицательной корреляции. Лицо байт/PANSS O (Общая психопатология): слабая отрицательная корреляция. Сильнее, чем с позитивными симптомами, но слабее, чем с негативными. Негативные симптомы имеют наиболее сильную связь с размером файла рисунка. Это может указывать на то, что пациенты с более выраженными негативными симптомами (например, эмоциональная уплощенность, абулия) создают менее детализированные или менее сложные рисунки. Вероятно такие симптомы, как галлюцинации или бред, меньше влияют на сложность или детализацию рисунка. Негативные симптомы могут иметь наибольшее влияние на способность или склонность пациентов создавать сложные или детализированные рисунки лиц. Общая тенденция указывает на то, что более тяжелая симптоматика (особенно негативная) связана с созданием менее "тяжелых" (в байтах) файлов рисунков.
Зависимость суммы в байтах от шкал PANSS. Все корреляции отрицательные, в целом ниже, чем для одного лица. Сумма байт/сумма PANSS: слабая отрицательная корреляция. Немного слабее, чем корреляция для одного лица. Сумма байт/PANSS P - очень слабая отрицательная корреляция. Схожа с результатом для одного лица. Сумма байт/PANSS N: наиболее сильная корреляция среди всех субшкал, но слабее, чем для одного лица. Сумма байт/PANSS O: слабая отрицательная корреляция. Слабее, чем для одного лица. Сохраняется тенденция: негативные симптомы имеют наиболее сильную связь, позитивные - наиболее слабую. Сохранение общей тенденции указывает на устойчивость наблюдаемой связи между симптомами и характеристиками рисунков. Анализ отдельных рисунков лиц может быть более информативным, чем общая сумма. Использование суммы байт всех рисунков может несколько "размывать" наблюдаемые эффекты по сравнению с анализом отдельных рисунков лиц. Для клинической оценки может быть более информативным анализ отдельных рисунков лиц. Фокус на негативных симптомах при анализе рисунков может быть наиболее продуктивным направлением для дальнейших исследований.
Анализ данных по рисункам животных: корреляции очень слабые, близкие к нулю. Есть небольшие положительные корреляции с позитивными симптомами и общей психопатологией, что отличается от предыдущих результатов. Негативные симптомы по-прежнему имеют отрицательную корреляцию, но очень слабую.
Анализ данных по текстовым файлам: корреляции слабые, но более выраженные, чем для рисунков животных. Все корреляции отрицательные, что согласуется с результатами для рисунков лиц. Наиболее сильная корреляция с общим баллом PANSS и негативными симптомами.
Сравнение корреляций: рисунки животных показывают наименьшую связь с симптомами PANSS. Текстовые файлы демонстрируют корреляции, сходные с рисунками лиц, но немного слабее. Рисунки лиц показывают наиболее сильные корреляции, особенно с негативными симптомами. Рисование лиц, похоже, является наиболее чувствительным заданием для отражения симптоматики PANSS. Рисование несуществующих животных наименее связано с симптомами, возможно, из-за большей вариативности и меньшей структурированности задания. Негативные симптомы последовательно показывают наиболее сильную связь с характеристиками выполнения заданий (кроме рисунков животных). Текстовые задания показывают схожие тенденции с рисунками лиц, что может указывать на общие механизмы влияния симптомов на выполнение структурированных заданий. Итак, для клинической оценки наиболее информативным может быть анализ рисунков лиц и текстовых заданий.
Таблица 14: Корреляции PANSS и результатов тестов в пикселях
|
Сумма PANSS |
PANNS P |
PANSS N |
PANSS O |
Лицо пикс. |
-0,314881602 |
-0,114253313 |
-0,37808238 |
-0,270226357 |
Животное пикс. |
-0,054246015 |
-0,077081351 |
-0,124347621 |
-0,016749861 |
Текст пикс. |
-0,17860783 |
-0,08160568 |
-0,204565945 |
-0,142493953 |
Сумма пикс. |
-0,217243033 |
-0,061157315 |
-0,271898958 |
-0,161410095 |
Корреляции между суммарными показателями пикселей и PANSS: все корреляции отрицательные и слабые. Наиболее сильная связь с негативными симптомами. Результаты схожи с корреляциями для суммы байт, что подтверждает согласованность измерений. Корреляции для рисунков лиц (пиксели): корреляции отрицательные, от слабых до умеренных. Наиболее сильная связь с негативными симптомами. Эти корреляции сильнее, чем для суммарных показателей и других типов заданий. Корреляции для рисунков животных (пиксели): корреляции очень слабые, близкие к нулю. Есть слабая положительная корреляция с позитивными симптомами. Результаты согласуются с данными для байтов, подтверждая низкую информативность этого задания. Корреляции для текстов (пиксели): корреляции отрицательные и слабые. Наиболее сильная связь с негативными симптомами. Результаты схожи с данными для байтов, но немного слабее.
Таблица 15: Корреляции PANSS и долей тестовых заданий в их общем объёме (измерены в пикселях)
|
Сумма PANSS |
PANNS P |
PANSS N |
PANSS O |
Лицо пикс/сумма пикс. |
-0,146618254 |
-0,068117896 |
-0,182331448 |
-0,148728374 |
Животное пикс. /сумма пикс. |
-0,305204255 |
-0,24473152 |
-0,302457925 |
-0,312291732 |
Текст пикс. /сумма пикс. |
-0,076881868 |
-0,095646644 |
-0,050729142 |
-0,079557341 |
Корреляции для отношения пикселей лица к общей сумме: Все корреляции отрицательные и слабые. Наиболее сильная связь с негативными симптомами, хотя она все еще слабая. Это может указывать на тенденцию: чем выше выраженность симптомов (особенно негативных), тем меньшую долю от общего объема работы занимает рисование лица. Корреляции для отношения пикселей животного к общей сумме: все корреляции положительные и умеренные. Наиболее сильная связь с общей психопатологией, но разница между подшкалами невелика. Это интересный результат, так как предыдущие данные показывали слабые корреляции для рисунков животных. Здесь мы видим, что доля рисунка животного в общем объеме работы увеличивается с ростом выраженности симптомов. Корреляции для отношения пикселей текста к общей сумме: все корреляции отрицательные и очень слабые, близкие к нулю. Наиболее сильная связь с позитивными симптомами, но разница незначительна. Это указывает на то, что доля текста в общем объеме работы практически не связана с выраженностью симптомов.
Обсуждение и выводы
Исследование показало согласованность измерений – на это указывают высокие корреляции между измерениями в байтах и пикселях, что подтверждает надежность измерений. Рисунки лиц наиболее информативны для оценки симптоматики PANSS. Рисунки несуществующих животных наименее информативны в этом аспекте. Текстовые задания занимают промежуточное положение. Негативные симптомы показывают наиболее сильную связь с характеристиками выполнения заданий во всех типах, кроме рисунков животных. Это может указывать на то, что негативные симптомы (например, абулия, ангедония) наиболее сильно влияют на способность и мотивацию к выполнению структурированных заданий. Рисование лиц может быть наиболее чувствительным к проявлениям психопатологии, возможно, из-за социальной природы задания. Рисование несуществующих животных может быть менее структурированным заданием, что объясняет слабые корреляции. Текстовые задания показывают промежуточные результаты, возможно, отражая как когнитивные, так и мотивационные аспекты симптоматики. Эти результаты предоставляют ценную информацию о связи между симптомами шизофрении и выполнением творческих заданий, что может быть полезно для разработки новых методов оценки и мониторинга состояния пациентов. Интересным результатом стало изменение паттерна для рисунков животных - в отличие от предыдущих данных, где рисунки животных показывали слабые корреляции, мы увидели умеренные положительные корреляции между долей рисунка животного и выраженностью позитивной симптоматики у пациентов с шизофренией. Это может означать, что пациенты с более выраженными симптомами уделяют большую долю своих усилий рисованию несуществующего животного. Отмечена стабильность результатов для рисунков лиц - хотя корреляции слабее, чем в предыдущих анализах, сохраняется тенденция к отрицательной связи, особенно с негативными симптомами. Низкая информативность доли текстовых заданий: доля текста в общем объеме работы показывает очень слабые корреляции со всеми показателями PANSS. Результаты исследования могут указывать на то, что с усилением симптоматики пациенты перераспределяют свои усилия, уделяя больше внимания рисованию несуществующего животного и меньше - рисованию лица и написанию текста. Рисование несуществующего животного может быть менее структурированным заданием, позволяющим пациентам с более выраженными симптомами выражать свои внутренние переживания. Рисование лица и написание текста могут требовать больше когнитивных ресурсов и структурированного мышления, что может быть затруднено при усилении симптоматики. Увеличение доли рисунка несуществующего животного может быть потенциальным маркером усиления симптоматики. Эти результаты подчеркивают важность рассмотрения не только отдельных заданий, но и их соотношения в общем объеме работы пациента.
Полученные результаты указывают на потенциал использования анализа графической и текстовой продукции для объективной оценки симптоматики шизофрении. Особенно перспективным представляется анализ рисунков лиц, который может быть использован как дополнительный инструмент в клинической практике. Несмотря на полученные значимые результаты, следует отметить некоторые ограничения исследования. Во-первых, выборка пациентов может не в полной мере отражать все варианты течения шизофрении. Во-вторых, не учитывались такие факторы, как длительность заболевания и текущая медикаментозная терапия, которые могут влиять на выполнение заданий.
Результаты исследования могут быть использованы для разработки новых методов оценки и мониторинга состояния пациентов с шизофренией. Например, анализ рисунков лиц может быть включен в рутинное обследование пациентов как дополнительный объективный показатель. Полученные данные вносят вклад в понимание влияния шизофрении на когнитивные и творческие процессы. Они также поднимают вопросы о связи между различными симптомами шизофрении и специфическими аспектами когнитивного функционирования.
Заключение
Проведенное исследование продемонстрировало потенциал интеграции методов компьютерного зрения и многопараметрического анализа в оценку симптоматики шизофрении. Количественный анализ графической и текстовой продукции пациентов с шизофренией и здоровых испытуемых выявил значимые различия между группами и корреляции с оценками по шкале PANSS. Полученные результаты открывают возможности для создания новых, объективных методов оценки и мониторинга состояния пациентов с шизофренией, основанных на анализе их графической и текстовой продукции. В целом, данное исследование демонстрирует перспективность применения методов компьютерного зрения и многопараметрического анализа в психиатрической диагностике. Полученные результаты могут послужить основой для разработки новых, лучше измеряемых, менее субъективных и, вероятно, более чувствительных инструментов оценки симптоматики шизофрении, что потенциально может улучшить диагностику и мониторинг течения заболевания. Такой подход подчёркивает глобальный характер психических нарушений при шизофрении, они затрагивают все её сферы и отражаются на всех аспектах психической деятельности и жизни, включая вербализацию в целом, а также на любой деятельности. Эти инструменты позволят выделить симптоматику, ранее не входившую в классический перечень симптомов при шизофрении. Эти инструменты в перспективе, при дальнейшем своём развитии, позволят оценить во всей полноте всю продукцию пациентов – текстовую, поведенческую, вербальную, графическую, в узком смысле психопатологическую и позволяет дать им количественную оценку, не зависящую, или мало зависящую от субъективных факторов.
Исследовательское поле в этой области очень велико, а вот в рамках развития данного исследования было бы интересно изучить, почему анализ отдельных лиц даёт более сильные корреляции. Рассмотреть возможность создания более сложного индекса на основе характеристик рисунков, который мог бы лучше коррелировать с оценками PANSS. Изучить качественные аспекты рисунков и текстов, помимо количественных показателей. Изучить содержательную сторону текстов, а также их лингвистические особенности, провести количественный и сравнительный анализ на основе уже существующих библиотек, к примеру, spaCy, NLTK. Автоматизация этих измерений возможна как с помощью специализированного ПО с жёстким алгоритмом, так и, что представляется куда более перспективным направлением – с помощью методов машинного обучения, из которых для данной задачи могут использоваться свёрточные и трансформерные нейросети.
Благодарности: исследование проведено без спонсорской поддержки. Автор выражает благодарность за помощь в сборе материалов, в их обработке врачам-психиатрам ГБУЗ ККПБ Геебу М.В, Сидорюк Л.В., врачу-стажёру Беляловой К.Д. проректору по цифровизации Кем ГУ к.мат.наук Котову Р.М., заведующему кафедрой информационной безопасности, к. мат. наук Карабцеву С.Н., Богданову А.Я., студенту ТГУ.
Конфликт интересов: автор заявляет об отсутствии конфликта интересов
Сведения об авторе: Богданов Ярослав Вячеславович, врач психиатр высшей категории, стаж работы 27 лет, заведующий приёмным отделением ГБУЗ Кузбасской клинической психиатрической больницы; 650036, Кемеровская область, город Кемерово, Волгоградская ул., д.41, e-mail: 05-guz-kokpb@kuzdrav.ru
Литература
1. Васильченко К.Ф., Чумаков Е.М. Современное положение, вызовы и перспективы развития вычислительной психиатрии: нарративный обзор. Consortium Psychiatricum. 2023;4(3):CP11244.
Vasilchenko K, Chumakov E. Current status, challenges and future prospects in computational psychiatry: a narrative review. Consortium Psychiatricum. 2023;4(3):CP11244. (In Russ.). https://doi.org/10.17816/CP11244
2. Гашкаримов В.Р., Султанова Р.И., Ефремов И.С., Асадуллин А.Р. Использование методов машинного обучения в диагностике и прогнозировании клинических особенностей шизофрении: нарративный обзор литературы. Consortium Psychiatricum. 2023;4(3):CP11030.
Gashkarimov VR, Sultanova RI, Efremov IS, Asadullin AR. Machine learning techniques in diagnostics and prediction of the clinical features of schizophrenia: a narrative review. Consortium Psychiatricum. 2023;4(3):CP11030. (In Russ.). https://doi.org/10.17816/CP11030
Комментарии (16)
RoasterToaster
03.10.2025 04:16Это что же получается, сейчас диагноз серьезного заболевания ставится на такой несерьезной базе как уровень рисунка (я наверное нарисовал бы именно упрощённые варианты)?
YAROSLAVBOGDANOV Автор
03.10.2025 04:16Нет. Это не так. Речь идёт об исследовании, пилотном, одном из многих. Думаю, что Вы это понимаете.Есть критерии диагностики в МКБ-10 и МКБ-11. Руководствуются ими.
wl2776
03.10.2025 04:16Любопытно, какие характеристики будут у картин кубистов, Пикассо, например.
YAROSLAVBOGDANOV Автор
03.10.2025 04:16Никакие, они не рассматриваются, это творчество,это художники, самовыражение. Здесь же анализ многопараметрический, тесты стандартизированные, к ним выдаются инструкции, они проводятся в специально созданных условиях. Но и здесь масса нюансов, и поле для исследования широкое, до реального рутинного метода исследования, поверьте, очень и очень далеко. Автор этой статьи это прекрасно понимает. И да, не переживайте, пока что реальная диагностика проводится и клинические диагнозы устанавливаются в соответствии с клиническими рекомендациями, МКБ и клиническим опытов врача. А это - научное исследование, от клинической практики оно пока что далеко, но без таких шажков не будет и новой клинической практики и новых методов исследования психической деятельности. И вопрос Ваш мне понятен, я примерно такой сам себе задавал и от многих слышал, но если Вы почитаете внимательно статью, то сами ответите на свой вопрос, хотя, думаю, неспециалисту сложно. Тем не менее я намеренно не стал упрощать.
wl2776
03.10.2025 04:16Я вспомнил, как лет 30 назад мой отец (нейрохирург высшей категории, зав. отделением) послушал со мной песни Цоя и сказал, что у него маниакально-депрессивный психоз :)
wl2776
03.10.2025 04:16Количественный анализ изображений проводился также по абсолютному размеру файла в байтах. Нами выявлена зависимость детализованности изображений от абсолютного размера файла, в котором изображение хранится (формат jpeg).
Исследована зависимость размера файла и количеством пикселей занятых изображением с помощью метода корреляционного анализа. Корреляции между байтами и пикселями оказались следующими: a) Сумма байт/сумма пикс.: 0,823706004 б) Лицо байт/лицо пикс.: 0,780290148 в) Животное байт/животное пикс.: 0,816002537 г) Текст байт/текст пикс.: 0,855008006.
Это справедливо для очень многих алгоритмов сжатия изображений и ничего не говорит о состоянии здоровья.
Ценность результата весьма сомнительная. Если вы поменяете формат на PNG или TIFF, или PCX, результат может поменяться на противоположный.
Вычислялся объём выполненного задания по рисованию лиц в пикселях для каждого испытуемого в каждой группе, результаты сводились в вариационные ряды, проводился их статистический анализ, результаты сравнивались.
Т.е. вы просто подсчитывали количество закрашенных пикселей? Без учета их пространственного положения? Без учета взаимного расположения? Без какого-то анализа содержимого рисунка?
Если да, то равномерно заштрихованный лист будет победителем.
Можно было бы моменты посмотреть, например, они в OpenCV есть.
Я бы векторизовал картинки и анализировал отрезки кривых линий. Все-таки, вы людей заставляли не пиксели закрашивать, а линии рисовать.
YAROSLAVBOGDANOV Автор
03.10.2025 04:16Я думал по разному, я не программист, поэтому мне было сложно сделать что-то более продвинутое, чем просто подсчёт пикселей, для этого нужен был программист, но пришлось писать код самому, его потом отладил специалист. Я так и хотел, оценивать кривые, отрезки, но это оказалось слишком сложно для меня. Я все таки врач, а не программист. Но работа поглотила меня с головой. Сейчас я занимаюсь сходным направлением, только развиваю тему психолингвистики. материал есть, его нужно обрабатывать. Я обязательно изучу то, что Вы написали и вникну. В принципе, я буду только рад заинтересованному квалифицированному программисту, который захотел бы стать соавтором в научных публикациях, в части, касающейся его. Никто не заштриховывал лист полностью, там же инструкция выдается, условия стандартизированные, тематики стандартные, но и здесь был "шум", были критерии исключения. Всё вообще очень сложно учесть. Спасибо за комментарий!
wl2776
03.10.2025 04:16С векторными изображениями в OpenCV трудновато, но можно также попробовать 2D image features.
Это алгоритмы, которые позволяют найти на картинке пиксели, как-то выделяющиеся из своего окружения (ключевые точки), и составить их описания (дескрипторы), которые можно сравнить между собой.
Основная цель изобретения этих алгоритмов была склеить несколько фотографий одного и того же объекта в одну, т.е. найти на нескольких фотографиях пиксели, изображающие одни и те же фрагменты, и совместить их. Либо сделать 3-мерную модель из нескольких двумерных фоток.
Однако, те же алгоритмы можно и для других задач применять. Например, тут попробовать.
Думаю, что уголки Харриса наиболее просто будет интерпретировать и как-то объяснить с медицинской точки зрения.
Следующее логичное продолжение - Bag of Visual Words. Т.е. можно построить классификатор болен-здоров. Но я не знаю, хватит ли пары сотен человек на датасет для него.
А еще есть модель CLIP, которая сопоставляет изображения и их текстовое описание, но это уже совсем другая сказка :)
YAROSLAVBOGDANOV Автор
03.10.2025 04:16Любопытные мысли. Понимаете, я публикуюсь в профильных сборниках, но там ведь мне этого коллеги не подскажут, там другой взгляд и отношение кипопыткам что-то обсчитать весьма скептическое. И мне это понятно. И поэтому, поскольку сегодня это работы на стыке, нужно закинуть свои мысли на другую территорию, где люди мыслят в других плоскостях, но именно из этих плоскостей придут идеи. Я, в этом уверен.
wl2776
03.10.2025 04:16Ну да... Вы зачем людей заставляли картинки рисовать? Чтобы их содержание проанализировать, верно? Пиксели про содержание ничего не скажут.
Изучение компьютерного зрения может Вам помочь.
https://szeliski.org/Book/ - это университетский учебник, там обо всём понемногу, что-то полезное наверняка найдётся.
Можно ещё лекции Конушина посмотреть: https://teach-in.ru/lecturer/konushin
Ещё гугл по запросу PANSS computer vision или schizophrenia computer vision много разных статей выдаёт, откуда можно идей почерпнуть.
WhiteCoat
03.10.2025 04:16Любопытно! То есть вы полагаете, что некая скудность изображения (мало деталей) связана с эмоциональным уплощением, верно понимаю? Ещё не очень понятно, почему использовали корреляции для поиска связи между размером изображения и количеством пикселей - это ведь вроде как очевидно, что чем детальнее изображение, тем больше потребуется памяти для хранения. И второе - если данные явно распределены ненормально, то можно было спокойно остановиться только на непараметрических тестах. Или так надёжнее результат?
Рискую надоесть, но почему Хабр, а не ваковский журнал какой нибудь?
YAROSLAVBOGDANOV Автор
03.10.2025 04:16Я публикуюсь в специальной литературе. Но мне нужно, поскольку работа на стыке, чтобы о ней знали и люди с техническим складом ума. Это первое. А второе - ну да, общее обеднение психической деятельности. Оно много в чем проявляется, в обеднении мыслей, речи, упрощении походки, мимики, как часть негативного симптомокомплекса. Это не мои выдумки, это ежедневно наблюдаемая классика. А то что я делаю, продолжаю делать - это небольшие шажки, с использованием доступных ресурсов человеческих и временных пытаться изучать возможности современных течений в области нейросетей, компьютерного зрения, машинного обучения. В данный момент у меня есть программный продукт, позволяющий заниматься количественной психолингвистикой. Так что насколько могу занимаюсь интересным мне делом, ну и любимой судебной и общей психиатрией
LinkToOS
03.10.2025 04:16Затем проводилось измерение размеров файлов нарисованных ими лиц, несуществующих животных, написанных текстов, а также с помощью специальной программы измерялось количество пикселей, занятых рисунками и текстами, затем искались корреляции между числами в байтах и пикселях
Шизофрения явно у исследователей. Как им вообще такое в голову пришло. Получится очередной "эффективный психотест", который у любого человека обнаружит признаки отклонения.
В принципе это задача для ИИ. Создаете датасет, и ИИ найдет закономерности.
Тесты какие угодно можно придумывать - от подбора шнурков к галстуку, до исполнения караоке. Во всем можно поискать статистические "признаки шизофрении".YAROSLAVBOGDANOV Автор
03.10.2025 04:16Комментариев , я вижу, много, а контента кот наплакал. Видимо каждому своё .
nefintosik
Ооо, 42 братуха, я с Кемерово)
YAROSLAVBOGDANOV Автор
Земеля!)))Уважуха!)))