МедицинаmedRxivScience Morning3 мин чтенияpreprint

Интеграция данных о генетике, окружающей среде, когнитивных способностях и темпераменте для прогнозирования СДВГ с использованием объяснимых моделей глубокого обучения

Integrating Genetic, Environmental, Cognitive, and Temperament Data for ADHD Prediction in Explainable Deep Learning Models

Рубрика
Медицина
Источник
medRxiv
DOI
10.64898/2026.06.29.26356796
Дата
01.07.2026
Автор
Science Morning
Время чтения
3 мин

Это предварительная публикация, она не прошла научное рецензирование.

Медицина

Аннотация

Цель: Расстройство дефицита внимания и гиперактивности (СДВГ) является клинически и этиологически гетерогенным, и диагностические решения могут выиграть от интеграции нескольких источников информации. Мы разработали подход объяснимого глубокого обучения, чтобы проверить, могут ли генетические, экологические, когнитивные, демографические и темпераментные данные классифицировать диагностику СДВГ и выявить факторы, способствующие принятию решений модели. Метод: Мы проанализировали участников когорты Oregon ADHD-1000, разделенных на тренировочные, валидационные и тестовые подмножества. Мы обучили модульные нейронные сети для классификации статуса случая-контроля СДВГ с использованием данных генотипа на уровне SNP с биологическими аннотациями, полигенных баллов, демографических данных, конфликтов в родительско-семейной среде, стресса и травмы, геокодированных мер, когнитивных задач, баллов темперамента и индикаторов отсутствия данных. Оптимизация гиперпараметров выбрала архитектуру модели и включение блоков признаков. Мы оценили производительность модели, используя AUC, кривые точности и полноты, анализы калибровки и предсказательной определенности, а также анализ кривой решений. Мы использовали интегрированные градиенты для количественной оценки важности на уровне блока, признака и индивидуальной важности признаков. Результаты: Лучшая модель, использующая черты темперамента, показала AUC 0.97 в удержанном тестовом подмножестве, с высокой точностью, чувствительностью и специфичностью и Brier score 0.06. Лучшая модель, исключающая темперамент, имела AUC 0.75. Анализы важности признаков подчеркнули важность темперамента, демографических и когнитивных доменов в модели, включающей темперамент. Индивидуализированные объяснения показали, что факторы предсказания варьировались между участниками и могли помочь выявить противоречивые или поддерживающие доказательства в различных доменах. Заключение: Объяснимые многомодальные классификационные модели могут интегрировать гетерогенную информацию, релевантную СДВГ, и выявлять признаки, которые способствуют индивидуальным прогнозам. Такие модели могут продвинуть исследования риск-моделирования СДВГ и поддерживать принятие решений клиницистами, особенно в сложных или диагностически неопределенных случаях.

Краткое резюме

В ходе исследования была разработана объяснимая модель глубокого обучения для прогнозирования расстройства дефицита внимания и гиперактивности (СДВГ) с использованием интегрированных данных о генетике, окружающей среде, когнитивных способностях и темпераменте. Модель показала высокую точность классификации и выявила ключевые факторы, влияющие на прогнозы.

Практический вывод

Исследование демонстрирует, что интеграция различных источников данных может улучшить диагностику СДВГ и предоставить ценные направления для поддержки принятия решений врачами.

Ограничения

Это предварительная публикация, она не прошла научное рецензирование. В исследовании используются данные только одной когорты, что может ограничить обобщаемость результатов. Требуются дополнительные исследования для проверки подхода на более широких и разнообразных популяциях.

Похожие исследования

Подборка учитывает рубрику, ключевые слова, аннотацию, резюме, практические выводы и источник.

Медицина
Медицина
87%

MARVEL: Обучение экспертов на основе маржинальной устойчивости для обнаружения выбросов с длинным хвостом

Для клинического применения крайне важно, чтобы автоматизированные диагностические системы оставались надежными при столкновении с ранее не виденными случаями. Однако глубокие модели регулярно неверно классифицируют данные вне распределения (OOD) с высокой уверенностью, подчеркивая необходимость более надежных методов детекции OOD. Хотя значительные усилия были направлены на улучшение устойчивости моделей, большинство существующих исследований предполагает сбалансированные наборы данных, оценивает детекцию OOD на грубых или неклинических источниках OOD или недостаточно всесторонне анализирует различные сценарии OOD. Чтобы восполнить эти пробелы, мы предлагаем новую методологию, обученную на разнообразных и несбалансированных медицинских наборах данных и оцененную на клинически репрезентативном спектре OOD. Наша структура включает три ключевых компонента: (1) нелинейный классификатор von Mises-Fisher (NvMF), способный изучать нелинейные границы решений, с теоретическим доказательством его асимптотической связи с косинусными классификаторами; (2) многопрофильная структура, в которой классификаторы NvMF, учитывающие границу, специализируются на разных областях распределения меток для лучшей обработки несбалансированности; и (3) эксперт по выбросам, специально обученный для различения инлайеров и аутлайеров, тем самым укрепляя детекцию OOD. Оценка на наборах данных RFMiD, ISIC2019 и NCTCRC демонстрирует постоянные улучшения по сравнению с передовыми методами, достигая средних уменьшений FPR95 на 8,45%, 13,02% и 36,90% соответственно. Эти достижения дополнительно поддерживаются всесторонними абляциями, которые подтвердили вклад каждого компонента. Это позволяет надежно идентифицировать незнакомые случаи для передачи клиницистам, поддерживая более безопасную диагностику с использованием искусственного интеллекта в реальных рабочих процессах. Наш код доступен по адресу https://github.com/redboxup/MARVEL.

Медицина
Медицина
85%

Анализ стоимости информации для внешней валидации моделей прогнозирования рисков в многокцентровых исследованиях и систематических обзорах

Исследования внешней валидации имеют конечный размер выборки, что создает неопределенность относительно того, превышает ли чистая выгода (ЧВ) модели прогнозирования ЧВ базовых стратегий. Ожидаемая цена идеальной информации (ОПИ) quantifies последствия неопределенности. Текущие методы ОПИ фокусируются на одиночных исследованиях, игнорируя гетерогенность между центрами. Мы расширяем ОПИ и ожидаемую цену частичной идеальной информации (ОПЧИ), чтобы учесть гетерогенность между кластерами в многокцентровых исследованиях и метаанализах. Мы различаем глобальную и локальную оптимальную стратегию, а также наблюдаемые и ненаблюдаемые кластеры. Мы определяем ОПИглобальная, ОПИкластер_j, ОПИкластер и ОПЧИкластер,преобладание, реализованные в R-пакете MetaNB, и иллюстрируем их с помощью систематического обзора, проведенного в 36 центрах, по модели ADNEX для диагностики рака яичников. Предполагая одно глобальное решение по принятию ADNEX, нет необходимости в дополнительных данных для подтверждения, что ADNEX является превосходящим в целом (ОПИглобальная 0). Метаанализ заимствует информацию из наблюдаемых кластеров, что приводит к последовательному локальному превосходству ADNEX и ненулевому, но обычно более низкому ОПИкластер_j, чем при учете только локальных данных. Вероятность того, что базовые стратегии превосходят в ненаблюдаемых центрах, составляет 0.03. Устранение неопределенности в производительности и преобладании в каждом кластерном (ОПИкластер) дало бы 1134 чистых избегнутых ложноположительных результатов (ЛП) в год, предполагая 350000 опухолей ежегодно с 20% злокачественностей. Определение только локального преобладания с уверенностью (ОПЧИкластер, преобладание) дало бы 158 чистых избегнутых ЛП в год. Расширения ОПИ распутывают источники неопределенности и количественно оценивают необходимость дальнейшей валидации для определения глобальной или локально оптимальной стратегии. Учет неопределенности и гетерогенности в клинической полезности между кластерами имеет решающее значение для принятия решения о необходимости дополнительных валидационных исследований.

Медицина
Медицина
85%

Полное байесовское обучение с подкреплением с помощью LF-IBIS

Обучение с подкреплением (RL) — это метод принятия решений в последовательных задачах, при котором агент обучается оптимальным политикам через взаимодействие с окружающей средой, максимизируя кумулятивные вознаграждения. Среди методов RL байесовское обучение с подкреплением (BRL) решает распространенные практические задачи, связанные с нехваткой данных, используя предварительные знания об окружении и последовательные обновления убеждений. Тем не менее, большинство подходов BRL требуют явной функции правдоподобия, которая часто недоступна или сложна для решения в реальных условиях. Мы предлагаем алгоритм, не требующий вычисления правдоподобия, — Итеративная Выборка Параметров Важности без Явного Правдоподобия (LF-IBIS), который обновляет убеждения агента в режиме онлайн по мере появления новых взаимодействий. Сочетая приближенные байесовские вычисления с итеративной выборкой параметров важности, LF-IBIS позволяет проводить полное байесовское вывод в условиях, когда динамика окружения не описана явным или управляемым правдоподобием. Метод предоставляет приближенные постериорные распределения как для параметров окружения, так и для оптимальных политик, обеспечивая количественную оценку неопределенности политики, что полезно для байесовского анализа компромисса между исследованием и эксплуатацией. Мы тестируем метод на симуляционном исследовании адаптивной рандомизации в клинических испытаниях, где закрытые формы постериоров позволяют провести валидацию. Дополнительные эксперименты рассматривают ситуации, когда постериор не имеет закрытой формы, и демонстрируют онлайн-обновление политики на основе постериорного распределения оптимальной политики.

Медицина
Медицина
77%

Негативные оценки и когнитивная переработка травматических событий среди мигрантов, прошедших аккультурацию.

Аккультурация является динамическим стрессовым процессом для тех, кто подвергается миграции. На сегодняшний день связь между аккультурацией и переработкой травматических событий не была эмпирически исследована, хотя эти понятия связаны со стрессом. Мы исследуем взаимосвязь между аккультурацией, когнитивной переработкой травматических событий и психическим здоровьем. В выборку вошли 161 мигрант, проживающий в Великобритании. Для классификации участников по уровню аккультурации был использован кластерный анализ. Анализы ковариации (ANCOVAs) и регрессионные анализы использовались для анализа кросс-секционных данных. Из данных были выделены три кластера: высокая и легкая аккультурация (HEA); высокая и трудная аккультурация (HHA); и низкая аккультурация (LA). Пол и воздействие травмы были выявлены как значимые ковариаты. Были обнаружены значительные эффекты аккультурации на показатели негативной оценки как на личном, так и на общественном уровне после травматических событий, а также на симптомы депрессии. Индивиды из кластера LA продемонстрировали значительно более высокие показатели по этим меркам по сравнению с двумя другими кластерами. Исследовательский анализ посредничества показал, что симптомы посттравматического стресса, депрессии и тревожности могут быть предсказаны аккультурацией через посредническую роль негативных оценок после травмы, при этом были выявлены значительные различия между кластером HEA и кластером LA, а также между кластером HHA и кластером LA. В целом, эти результаты проливают свет на роль аккультурации в переработке травматических событий и последующих симптомах психического здоровья как на внутреннем, так и на межличностном уровне. Поскольку индивиды с низким уровнем аккультурации демонстрируют клинические уровни симптомов психического здоровья и более негативные оценки, это подчеркивает необходимость исследования аккультурационного процесса в терапии.

Медицина
Медицина
77%

Геномный ландшафт и филогенетические аспекты более чем двух десятилетий в Южном Китае и его глобальный мониторинг.

Мелиоидоз, вызванный Burkholderia pseudomallei, является эндемичным инфекционным заболеванием с высокой летальностью в тропических и субтропических регионах. В Китае недостаточно обширных эпидемиологических данных, в то время как комплексные данные с интеграцией геномной эпидемиологии встречаются редко во всем мире. В данном исследовании был проведен ретроспективный анализ 554 случаев мелиоидоза с подтвержденной культурой в Южном Китае с 2003 по 2022 год. Были проанализированы геномные характеристики и их связь с антимикробной чувствительностью и клиническими характеристиками с помощью секвенирования всего генома. Филогении на основе SNP основного генома были построены из выровненных данных с маской рекомбинации и сравнены с 3573 общественно доступными глобальными геномами для определения их популяционной структуры и филогеографических паттернов. Мелиоидоз в основном поражал мужчин (86,8%, 481/554) и людей в возрасте от 45 до 64 лет (57,7%). Бактериемия (OR=5,91, <0,001), сахарный диабет (OR=2,27, =0,008) и легочная инфекция (OR=2,26, =0,005) были определены как факторы риска для летальности. Тестирование антимикробной чувствительности показало высокую чувствительность к имипенему (100%) и цефтазидиму (99,6%). Анализ пангенома подтвердил хромосомную функциональную разделенность двучастного генома, а геномное исследование ассоциаций выявило высоконадежные генетические маркеры (OR >3 или <0,33), существенно связанные с летальностью и бактериемией. Более того, глобальный филогеномный анализ выявил 10 эволюционных кластеров; изоляты из Китая были значительно обогащены в Кластере 1, который образует клад, общую с тайскими штаммами, и были филогенетически отличны от Кластера 5, в который в основном входили австралийские изоляты. В заключение, данное крупномасштабное геномное и клиническое исследование предоставляет самый полный обзор мелиоидоза в Южном Китае. Геномный анализ подчеркнул значительное региональное и глобальное генетическое разнообразие и филогеографическую структуру, подчеркивая важность продолжения геномного мониторинга.

Медицина
Медицина
77%

Сравнение языковых моделей на основе рубрик в задачах клинического мышления, созданных экспертами

Медицинские тесты с выбором ответов становятся все более переполненными, и недавние оценки на основе рубрик, такие как HealthBench, показали, что открытая клиническая оценка далека от решения: максимальный балл в ее "Сложной" подгруппе составляет всего 32%. Мы представляем небольшой, специально сложный набор оценочных данных из пяти клинических сценариев, составленных врачами, охватывающих четыре специальности (анестезиология, внутренние/семейная медицина, неотложная медицина и акушерство), каждый из которых сопровождается атомарной, взвешенной, MECE рубрикой (от 25 до 62 критериев на задачу, всего 184 критерия), составленной на основании золотого ответа, подготовленного врачом. Мы оценили три передовые модели: GPT 5.4, Claude Opus 4.7 и Gemini 3.1 Pro. Средние показатели прохождения рубрики составили 0.47 (Claude), 0.39 (GPT) и 0.37 (Gemini). Центральный вывод заключается в инверсии клинического приоритета: наиболее важные (вес-5, критически важные) критерии были выполнены всего на 32.4-41.7%, в то время как менее значимые критерии с весом-1 прошли с результатом 80-90%. 56 из 108 критически важных (вес-5) критериев (52%) не были выполнены ни одной моделью. Три авторегистраторы LLM воспроизвели метки экспертов (выполнено/не выполнено) в 92.8-94.7% из 552 оцененных критериев. Мы рассматриваем это как вклад в методы и предварительные результаты: пять задач демонстрируют масштабируемый, обоснованный процесс, готовый к развитию в крупномасштабный эталон.