
Авторы статьи:
Marco Di Fraia1, Lorenzo Tieghi2, Francesca Magri1, Gemma Caro1, Simone Michelini1, Giovanni Pellacani1, Alfredo Rossi1
1 Dermatology Clinic, Department of Clinical Internal, Anesthesiologic and Cardiovascular Sciences, Sapienza University of Rome, Roma, Italy
2 Department of Mechanical and Aerospace Engineering, Sapienza University of Rome, Roma, Italy
Содержание
Введение. Определение стадии андрогенетической алопеции (АГА) до сих пор основано на использовании макроскопических шкал, но внедрение трихоскопии постепенно привносит в диагностику важные изменения, несмотря на то что она также относится к методам обследования невооруженным взглядом. Появившиеся в последнее время программы на основе искусственного интеллекта выполняют автоматический количественный анализ трихоскопических параметров. При этом интерпретация данных, выдаваемых этими программами, бывает затруднительна. Инновационным решением этой проблемы могут стать алгоритмы машинного обучения. В частности, одним из лучших в решении задач классификации считается метод опорных векторов (support vector machine (SVM)).
Цели. Нашей целью была разработка алгоритма SVM, основанного на трех трихоскопических параметрах, который позволил бы проводить классификацию пациентов, страдающих андрогенетической алопецией, и подсчитывать индекс тяжести заболевания.
Методы. Мы проводили ретроспективный анализ трихоскопических изображений 200 пациентов, страдающих андрогенетической алопецией, с использованием программы Trichoscale Pro®, подсчитывавшей количество пушковых волос, пустых фолликулов и фолликулярных единиц с единичным волосом. Затем мы применяли алгоритм SVM, который, учитывая эти трихоскопические параметры и пол пациента, проводил классификацию степени АГА на легкую или умеренно тяжелую, а также рассчитывал процент вероятности того, что классификация выполнена корректно (от 50 до 100 %). Такая оценка вероятности выше у пациентов с большим количеством трихоскопических признаков АГА, поэтому она может служить индексом тяжести.
Результаты. Для обучающего и тестового наборов данных общая точность составляла 94,3 % и 90,0 %, а область под ROC-кривой 0,99 и 0,95 соответственно.
Выводы. Мы полагаем, что наша модель SVM может оказывать дерматологам большую поддержку при лечении АГА, особенно в связи с тем, что позволяет лучше оценивать тяжесть заболевания и назначать более подходящую терапию.
Ключевые слова: андрогенетическая алопеция, машинное обучение, метод опорных векторов, определение стадии.
Андрогенетическая алопеция (АГА) является наиболее распространенной формой облысения, поражающей около 80 % мужчин и 50 % женщин в течение жизни [1]. Известно, что в патогенезе этого заболевания фундаментальную роль играют андрогены и генетическая предрасположенность [2]. В настоящее время определение стадии АГА основывается на оценке макроскопических показателей, в частности, с использованием шкалы Гамильтона – Норвуда у мужчин и коэффициента Синклера у женщин [3, 4], но внедрение трихоскопии в обследование скальпа постепенно привносит в диагностику важные изменения.
Анализ трихоскопических параметров, таких как пушковые волосы или одиночные фолликулярные единицы, помогает дерматологам лучше оценивать активность заболевания, независимо от степени распространённости АГА [5]. При этом трихоскопия остается методом обследования невооруженным взглядом. В действительности, практически невозможно провести точный количественный анализ параметров, наблюдаемых простым глазом. Эту задачу можно решить за счет недавно появившихся программ для анализа волос на основе искусственного интеллекта, которые могут выполнять автоматический подсчет плотности волос, их диаметра и прочих параметров [6, 7].
Тем не менее интерпретация данных, генерируемых этими программами, может быть затруднительной и занимать много времени. Алгоритмы машинного обучения могут представлять инновационное решение проблемы. Эти алгоритмы генерируются из наборов данных, и их цель заключается в том, чтобы прогнозировать последствия или предлагать решение, не будучи напрямую запрограммированными на это.
Одним из лучших в решении задач классификации считается метод опорных векторов (support vector machine, SVM) [8]. Говоря простым языком, имея в распоряжении набор субъектов, отмеченных как относящиеся к одной из двух категорий (набор данных для обучения), алгоритмы SVM способны относить новых субъектов (тестовый набор данных) к одной из них.
Нашей целью была разработка алгоритма SVM на основе трех трихоскопических параметров, который позволял бы классифицировать пациентов на страдающих легкой или умеренно тяжелой андрогенетической алопецией, и мог бы выдавать индекс тяжести применительно к конкретному пациенту.
В этом одноцентровом обсервационном ретроспективном исследовании мы анализировали трихоскопические изображения 200 пациентов (100 мужчин и 100 женщин), страдающих андрогенетической алопецией. Клинически (макроскопически) тяжесть заболевания оценивали с применением шкалы Гамильтона – Норвуда у мужчин и коэффициента Синклера у женщин.
Пятьдесят мужчин имели легкую степень заболевания (20 пациентов – стадия I и 30 – стадия II), а 50 – умеренно тяжелую АГА (30 присвоена стадия IV и 20 – стадия V). Как и мужчины, женщины страдали легкой (50 пациенток – стадия II) и умеренно тяжелой степенью (50 стадия IV). К моменту исследования пациенты ничем не лечили андрогенетическую алопецию и не имели иных заболеваний волосистой части головы.
В нашей амбулаторной клинике мы отобрали изображения пациентов, созданные в период с сентября 2019 года по декабрь 2021 года. Волосы на скальпе каждого пациента были разделены на прямой пробор и зачесаны в стороны, съемку проводили с применением видеодерматоскопа Medicam 1000® (FotoFinder Systems GmbH). Цифровые стандартизированные дерматоскопические снимки были созданы на участках скальпа, выбранных в зависимости от пола пациентов. У женщин этот участок располагался в точке пересечения линии, соединяющей уши, и линии, соединяющей кончик носа и vertex. У мужчин этот участок был расположен двумя сантиметрами выше, чем описано применительно к женщинам.
Анализируемый участок составлял 0,903 см2. Фотографии создавали с 20-кратным увеличением. Каждое трихоскопическое изображение анализировали в программе Trichoscale Pro® (FotoFinder Systems GmbH), позволяющей проводить точный автоматический анализ структур скальпа, затем результат проверяли вручную.
Таблица 1. Сравнение значений трихоскопических параметров пациентов с андрогенетической алопецией легкой и умеренно тяжелой степени (медианные значения и интерквартильный диапазон)
| Параметр | Легкая | Умеренно тяжелая | p |
|---|---|---|---|
| Мужчины (N = 100) | |||
| Пушковые волосы (%) | 27 (21–32) | 46,5 (38–63) | < 0,0001 |
| Фолликулярные единицы с одиночным волосом (%) | 37 (32–42) | 46 (39–35) | < 0,0001 |
| Пустые фолликулы (кол-во) | 0 (0–0) | 1 (0–2) | < 0,0001 |
| Женщины (N = 100) | |||
| Пушковые волосы (%) | 33 (27–40) | 62 (58–69) | < 0,0001 |
| Фолликулярные единицы с одиночным волосом (%) | 45,5 (39–51) | 54 (49–59) | < 0,0001 |
| Пустые фолликулы (кол-во) | 0 (0–0) | 1 (0–3) | = 0,0002 |
В исследовании мы рассматривали следующие трихоскопические параметры (паттерны):
Мы применяли модель SVM, учитывавшую эти три параметра и пол пациента. Такая модель способна классифицировать степень тяжести заболевания пациента как легкую и умеренно тяжелую. Для каждого участника алгоритм также рассчитывал вероятность корректности классификации (далее «оценка вероятности») в процентах, от 50 % (ненадежная классификация) до 100 % (точная классификация).
Как принято для подобных моделей [8], популяцию исследования разделяли на группы в пропорции 70 % (n = 140) в качестве «обучающего набора данных» к 30 % (n = 60) в качестве «тестового набора данных». Для каждого набора мы рассчитывали следующие метрики: чувствительность (соответствующая полноте «recall»), специфичность, положительная прогностическая ценность (соответствующая прецизионности – надежности прогноза «precision»), отрицательная прогностическая ценность, общая точность «accuracy» , анализ ROC-кривой.
Код модели SVM доступен по запросу, направленному автору, ответственному за переписку.
Для межгруппового сравнения различий трихоскопических параметров использовали U-критерий Манна – Уитни. Модель SVM основана на кодах из открытых источников. Код был разработан в фреймворке Python 3,8. Оценку вероятности математически получают путем нормализации функции алгоритма весами гиперплоскости. Искусственный интеллект обучали с использованием библиотеки sklearn.

Рисунок 1. Трехмерный точечный график, показывающий значения трех трихоскопических параметров каждого пациента. Гиперплоскость, разделяющая пациентов с легкой степенью андрогенетической алопеции (красные точки) и пациентов с умеренно тяжелой АГА (синие точки), окрашена в серый цвет
Медианные значения и интерквартильные диапазоны для каждого трихоскопического параметра в каждой группе исследования приведены в Таблице 1. Все параметры были значительно выше у мужчин и женщин, страдающих умеренно тяжелой АГА, чем у имевших легкую степень заболевания (Таблица 1).
Значение трихоскопических параметров каждого пациента и функция гиперплоскости, разделяющей пациентов на имеющих легкую или умеренно тяжелую степени тяжести АГА, приведены в виде трехмерного точечного графика (Рисунок 1). Оценки корректности классификации, как функция удаленности образца от границ решения задачи, для каждого субъекта из обучающего набора приведены на Рисунке 2.

Рисунок 2. Оценка вероятности корректной классификации как функция расстояния образца от границы принятия решения в отношении каждого из обучающего набора данных
Значения метрик производительности модели для обучающего и тестового наборов данных приведены в Таблице 2. Анализ ROC-кривой для обучающего и тестового наборов данных показан на Рисунке 3.
В последнее время трихоскопия стала основным инструментом диагностики расстройств, сопровождающихся выпадением волос [5]. Анализ специфических паттернов позволяет дерматологам проводить точную оценку тяжести и активности заболевания. Тем не менее эта процедура остается субъективной и проводится невооруженным взглядом. Разработка новых программ на основе искусственного интеллекта [6, 7], способных давать точную количественную оценку этих параметров, открывает новые возможности в области трихоскопии.
В нашем исследовании мы анализировали трихоскопические изображения в программе Trichoscale Pro® и вручную проводили тщательную проверку полученных значений. У популяции нашего исследования процент пушковых волос, процент фолликулярных единиц с одиночным волосом и количество пустых фолликулов были значительно выше у пациентов, страдающих клинически диагностированной (с использованием классифицирующих макроскопических шкал) умеренно тяжелой андрогенетической алопецией, чем у пациентов с легкой степенью заболевания, что ожидаемо согласно имеющимся в научной литературе данным (Таблица 1) [8].

Рисунок 3. Анализ ROC-кривой для обучающего (слева) и тестового (справа) наборов данных
Тем не менее 8 % пациентов с клинически диагностированной легкой степенью АГА были отнесены нашей моделью, основанной на анализе трихоскопических параметров, к группе с умеренно тяжелой степенью. Мы предполагаем, что это может быть связано с тем, что самого по себе клинического макроскопического наблюдения недостаточно для определения действительной тяжести и активности АГА. В соответствии с нашей моделью фактически увеличение значений трихоскопических параметров коррелирует с высокой вероятностью (в %) умеренно тяжелого заболевания.
Оценка вероятности может служить индексом тяжести, учитывая, что у пациентов, классифицированных как страдающие умеренно тяжелой андрогенетической алопецией, чем ближе это значение к 100 %, тем больше количество трихоскопических признаков АГА. С другой стороны, для пациентов, отнесенных к имеющим легкую степень андрогенетической алопеции, чем больше оценка вероятности приближена к 100 %, тем меньше количество трихоскопически выявленных признаков АГА.
Наша модель SVM может служить важным сигналом для дерматолога о том, что пациенты с невыраженной алопецией, в соответствии с традиционными макроскопическими шкалами, в действительности страдают умеренно тяжелой степенью АГА согласно результатам трихоскопического анализа. Например, у пациента с диагностированной, согласно шкале Гамильтона – Норвуда, андрогенетической алопецией II стадии, анализ в Trichoscale Pro® показал 42 % пушковых волос, 45 % одиночных волос в фолликулярных единицах и 1 пустой фолликул. Наш алгоритм классифицировал этого пациента как имеющего умеренно тяжелую АГА, с вероятностью примерно 77 % (Рисунок 4).

Рисунок 4. Пример применения модели. После макроскопического обследования создан трихоскопический снимок с 20-кратным увеличением, трихоскопические параметры проанализированы в программе Trichoscale Pro®. Затем полученные значения помещены в алгоритм SVM, классифицирующий пациентов на имеющих легкую или умеренно тяжелую степень андрогенетической алопеции с вероятностью корректности решения 77 %.
Индекс тяжести, который выдает наша модель машинного обучения, может также помогать дерматологам в выборе правильного режима терапии для каждого пациента, поскольку субъекты с высокой вероятностью умеренно тяжелой АГА могут нуждаться в более агрессивном лечении. Кроме того, индекс может быть полезен в мониторинге ответа на терапию: пониженная оценка вероятности после окончания лечения, может означать, что тяжесть АГА также снижается.
Высокие значения метрик производительности, таких как прецизионность, точность и общая полнота (precision, accuracy, recall), показывают что алгоритм в нашей популяции исследования в большинстве случаев крайне хорошо работает при решении задач классификации тяжести андрогенетической алопеции. Очевидно, что метрики производительности у тестового набора данных ниже, чем у обучающего, что характерно для этого рода моделей машинного обучения во избежание переобучения («overfitting»), когда модель слишком хорошо запоминает обучающий набор и неспособна надлежащим образом обобщать новые данные [8].
Наклон кривых оценки вероятности (Рисунок 2) относительно велик, и для большинства пациентов (81,5 %), значения превышают 80 %. Наше исследование, несомненно, имеет ряд ограничений. Во-первых, анализ в программе Trichoscale Pro® в большинстве случаев требовал небольшой ручной коррекции (78 %). Это может быть связано с тем, что на анализируемых участках скальпа волосы не были коротко пострижены, хотя и были тщательно расчесаны, чтобы получить наилучший результат.
Таблица 2. Метрики производительности модели
| Обучающий | Тестовый | |
|---|---|---|
| Чувствительность (Sensitivity) | 94,2 % | 93,6 % |
| Специфичность (Specificity) | 94,4 % | 86,2 % |
| Положительная прогностическая ценность (PPV) | 94,2 % | 87,8 % |
| Отрицательная прогностическая ценность (NPV) | 94,4 % | 92,6 % |
| Общая точность (Accuracy) | 94,3 % | 90,0 % |
| Площадь под ROC-кривой (AUC) | 0,99 | 0,95 |
Главное же ограничение алгоритма заключается в том, что для пациентов с оценкой вероятности около 50 % (а это меньшинство в популяции нашего исследования), классификация может быть ненадежной и требовать тщательной интерпретация данных дерматологом. В связи с этим мы предпочли не включать в исследование пациентов с андрогенетической алопецией III стадии (согласно классификации Гамильтона – Норвуда или коэффициенту Синклера), поскольку эти субъекты были бы помещены ближе к границам решения алгоритмом и, вероятно, негативно повлияли бы на производительность модели. Тем не менее алгоритм подходит для всех стадий АГА, несмотря на то что, по нашему мнению, он более применим к легкой и умеренной стадиям заболевания.
На самом деле, главная цель нашей модели заключается в способности выявлять пациентов с макроскопически диагностированной легкой степенью алопеции при трихоскопически активном заболевании, которое может быстро перейти в более тяжелые стадии. Конечно, необходимо тестировать возможность модели распространяться на большую выборку, вовлекая в исследование пациентов учреждений, применяющих программы анализа трихоскопических параметров, такие как Trichoscale Pro®.
В последнее время наблюдается большой прогресс искусственного интеллекта применительно к изучению заболеваний волос, и появляется множество программ для автоматического подсчета количества, диаметра волос и иных трихоскопических параметров [6, 7]. Тем не менее, насколько нам известно, пока не существует алгоритма классификации пациентов, страдающих андрогенетической алопецией, или оценки ее тяжести.
В связи с этим мы уверены, что наша модель может служить большой поддержкой для дерматологов при лечении АГА, особенно в наиболее достоверном определении стадии заболевания и, соответственно, назначении наиболее подходящей терапии.

