SABER: Фреймворк анализа семантически согласованной структуры мозга с помощью многомасштабных гиперграфов
SABER: A Semantic-Aligned Brain Network Analysis Framework via Multi-scale Hypergraphs
Карточка статьи
Рубрика
Медицина
Источник
arXiv
Дата
02.07.2026
Автор
Science Morning
Время чтения
3 мин
Это предварительная публикация, она не прошла научное рецензирование.
Аннотация
Эффективная диагностика заболеваний мозга требует синергии паттернов подключения мозга и высокоуровневых семантических знаний. Однако существующие методы в значительной степени рассматривают семантику из крупных языковых моделей (LLMs) как вспомогательные признаки или руководство, что ограничивает их прямую роль в принятии решений и сужает стабильность и надежность классификации. Чтобы преодолеть это, мы предлагаем фреймворк семантически согласованной нейросети мозга, который активно интегрирует семантику, полученную от LLM, в процесс предсказания. В частности, семантика на уровне ROI сначала включается через глобальное самообращение для обогащения представлений узлов и предоставления контекста всего мозга. Затем строятся многомасштабные гиперграфы для явного моделирования функциональных подсетей и взаимодействий между несколькими ROI, что решает локальные ограничения традиционных ГНН и захватывает высокопорядковые зависимости. Наконец, механизм семантической согласованности на уровне принятия решений избирательно вводит текстовые вложения, специфичные для пациента, в графовые представления, позволяя семантике напрямую управлять предсказаниями без нарушения глубинной структуры сети. Эксперименты на публичных наборах данных сети мозга ABIDE и ADHD-200 демонстрируют состояние искусства, повышенную стабильность и улучшенную интерпретируемость, особенно в условиях небольших выборок.
Краткое резюме
Исследование представляет новый подход к диагностике заболеваний мозга, комбинируя нейросетевые схемы и семантические знания из языковых моделей, что обеспечивает более точные и стабильные предсказания.
Практический вывод
Предложенный фреймворк может значительно улучшить диагностику заболеваний мозга, обеспечивая более надежные и интерпретируемые результаты, особенно в условиях ограниченных данных.
Ограничения
Это предварительная публикация, она не прошла научное рецензирование. Данное исследование фокусируется только на определенных наборах данных и может не учитывать все возможные клинические условия. Кроме того, эффективность предложенного подхода может варьироваться в зависимости от качества семантической информации, полученной из LLM.
Острые вирусные респираторные инфекции (ОВРИ) являются одной из основных причин госпитализации и смертности во всем мире, однако рандомизированные клинические испытания в этой области сталкиваются с серьезными трудностями в выборе эффективных и клинически значимых первичных конечных точек. Смертность часто слишком редка, чтобы служить осуществимой первичной конечной точкой. Было предложено несколько альтернативных подходов, включая.ordinal шкалы, конечные точки «время до события», составные исходы на основе выздоровления и продольныеOrdinal модели. Однако их сравнительные операционные характеристики в условиях реалистичных курсов ОВРИ пока недостаточно изучены. Мы описываем симуляционное исследование для сравнения уровня I ошибки и мощности широко используемых и недавно предложенных конечных точек и стратегий анализа для двухгрупповых рандомизированных испытаний среди госпитализированных участников с ОВРИ. Данные будут генерироваться по нескольким механизмам, направленным на имитацию правдоподобных траекторий участников, включая латентный процесс Брауна, процесс первого порядка ординальной марки, латентный процесс повторных событий с ослаблением и повторную выборку индивидуальных данных участников из испытания ACTT-2. Смоделированные результаты будут использовать ординальные шкалы тяжести с 4-, 6- и 8 уровнями и будут отражать популяции умеренно и тяжело больных, сроки наблюдения в 28 или 60 дней, различные эффекты лечения и размеры выборки. Сравниваемые методы включают модели перехода ординальных состояний Маркова, модели пропорциональных шансов в фиксированную точку времени, анализы по шкале дней до выздоровления, модели Кокса для конечных точек «время до события», логистическую регрессию для бинарных конечных точек, обобщенные парные сравнения для иерархических составных исходов и t-тесты для дней жизни и выписки из больницы. Это исследование предоставит систематическое сравнение определений конечных точек и методов анализа для испытаний на ОВРИ при клинически обоснованных механизмах генерации данных. Результаты направлены на информирование выбора осуществимых, интерпретируемых и статистически эффективных стратегий первичного анализа для будущих клинических испытаний при вирусных респираторных заболеваниях.
Диагностика традиционной китайской медицины (ТКМ), особенно через осмотр языка, сталкивается с постоянными проблемами субъективности и воспроизводимости. Применение многомодального искусственного интеллекта для клинических задач ТКМ, таких как дифференциация синдромов и генерация рецептов, значительно затруднено семантическим разрывом между визуальными характеристиками языка и текстовым обоснованием, а также отсутствием масштабных, стандартизированных наборов данных. Для решения этих проблем мы представляем MMIR-TCM, новую структуру, которая эмулирует процесс диагностики экспертов ТКМ, интегрируя многомодальную языковую модель с сегментацией, дополненной памятью и генерацией, основанной на извлечении. Используя архитектуру, состоящую из трех этапов, MMIR-TCM интегрирует модуль Memory-SAM, не требующий обучения, для надежного извлечения языка, уточненную модель Qwen3-VL для генерации структурированной диагностики языка и компонент RAG на основе Qwen3 для генерации обоснованной клинической поддержки принятия решений. Структура была разработана и валидирована с использованием MedTCM, нового крупномасштабного многомодального набора данных, который мы представляем специально для углубленных исследований ТКМ. Для правильной оценки клинической точности нашей структуры, которую существующие метрики не могут отразить, мы также разработали TDEU, доменно-специфическую оценочную метрику, учитывающую семантическое понимание и диагностическую важность. Наши комплексные эксперименты демонстрируют, что MMIR-TCM значительно превосходит ведущие модели.
Исследования внешней валидации имеют конечный размер выборки, что создает неопределенность относительно того, превышает ли чистая выгода (ЧВ) модели прогнозирования ЧВ базовых стратегий. Ожидаемая цена идеальной информации (ОПИ) quantifies последствия неопределенности. Текущие методы ОПИ фокусируются на одиночных исследованиях, игнорируя гетерогенность между центрами. Мы расширяем ОПИ и ожидаемую цену частичной идеальной информации (ОПЧИ), чтобы учесть гетерогенность между кластерами в многокцентровых исследованиях и метаанализах. Мы различаем глобальную и локальную оптимальную стратегию, а также наблюдаемые и ненаблюдаемые кластеры. Мы определяем ОПИглобальная, ОПИкластер_j, ОПИкластер и ОПЧИкластер,преобладание, реализованные в R-пакете MetaNB, и иллюстрируем их с помощью систематического обзора, проведенного в 36 центрах, по модели ADNEX для диагностики рака яичников. Предполагая одно глобальное решение по принятию ADNEX, нет необходимости в дополнительных данных для подтверждения, что ADNEX является превосходящим в целом (ОПИглобальная 0). Метаанализ заимствует информацию из наблюдаемых кластеров, что приводит к последовательному локальному превосходству ADNEX и ненулевому, но обычно более низкому ОПИкластер_j, чем при учете только локальных данных. Вероятность того, что базовые стратегии превосходят в ненаблюдаемых центрах, составляет 0.03. Устранение неопределенности в производительности и преобладании в каждом кластерном (ОПИкластер) дало бы 1134 чистых избегнутых ложноположительных результатов (ЛП) в год, предполагая 350000 опухолей ежегодно с 20% злокачественностей. Определение только локального преобладания с уверенностью (ОПЧИкластер, преобладание) дало бы 158 чистых избегнутых ЛП в год. Расширения ОПИ распутывают источники неопределенности и количественно оценивают необходимость дальнейшей валидации для определения глобальной или локально оптимальной стратегии. Учет неопределенности и гетерогенности в клинической полезности между кластерами имеет решающее значение для принятия решения о необходимости дополнительных валидационных исследований.
Фиброаденома груди (ФА) и опухоль Филлоидов (ОФ) — это фиброэпителиальные поражения груди с высоко перекрывающимися проявлениями на ультразвуковых изображениях, что делает доброкачественные и пограничные ОФ подверженными ошибочной классификации как ФА, осложняя предоперационное принятие решений. Существующие методы компьютерной помощи в диагностике обычно основываются на однородных изображениях и недостаточно используют дополнительные клинические и текстовые данные. Чтобы решить эту проблему, мы разработали набор данных FAPT-M, состоящий из 910 пациентов с строго проверенными ультразвуковыми изображениями, структурированными клиническими атрибутами и описаниями ультразвуковой диагностики. На основе этого набора данных мы предлагаем клинически ориентированную мультимодальную структуру, которая объединяет визуальное кодирование на основе DenseNet, текстовое кодирование, вдохновленное CLIP, и легковесное клиническое кодирование, а также вводит адаптивную модуляцию с учетом клинических данных, фузию между модальностями с помощью Transformers и обучение представления с двойным путем для улучшения согласования признаков и взаимодействия между модальностями. В рамках пятирубцовой перекрестной проверки на уровне пациентов предлагаемый метод достигает точности 77,64%, F1-оценки 73,38% и AUC 89,74%, что превосходит представительные эталонные методы на базе CNN, Transformers и визуально-языковых моделей. Исследования по абляции и оценки с учетом классов дополнительно подтверждают вклад фузии трех модальностей и ключевые архитектурные компоненты. В целом, эта работа предоставляет эффективный мультимодальный подход для детальной классификации ФА и ОФ и устанавливает высококачественный эталон для мультимодального анализа ультразвука молочной железы.
Обучение с подкреплением (RL) — это метод принятия решений в последовательных задачах, при котором агент обучается оптимальным политикам через взаимодействие с окружающей средой, максимизируя кумулятивные вознаграждения. Среди методов RL байесовское обучение с подкреплением (BRL) решает распространенные практические задачи, связанные с нехваткой данных, используя предварительные знания об окружении и последовательные обновления убеждений. Тем не менее, большинство подходов BRL требуют явной функции правдоподобия, которая часто недоступна или сложна для решения в реальных условиях. Мы предлагаем алгоритм, не требующий вычисления правдоподобия, — Итеративная Выборка Параметров Важности без Явного Правдоподобия (LF-IBIS), который обновляет убеждения агента в режиме онлайн по мере появления новых взаимодействий. Сочетая приближенные байесовские вычисления с итеративной выборкой параметров важности, LF-IBIS позволяет проводить полное байесовское вывод в условиях, когда динамика окружения не описана явным или управляемым правдоподобием. Метод предоставляет приближенные постериорные распределения как для параметров окружения, так и для оптимальных политик, обеспечивая количественную оценку неопределенности политики, что полезно для байесовского анализа компромисса между исследованием и эксплуатацией. Мы тестируем метод на симуляционном исследовании адаптивной рандомизации в клинических испытаниях, где закрытые формы постериоров позволяют провести валидацию. Дополнительные эксперименты рассматривают ситуации, когда постериор не имеет закрытой формы, и демонстрируют онлайн-обновление политики на основе постериорного распределения оптимальной политики.
Доменные агенты часто сталкиваются с шумными бизнес-данными, неопределёнными приростами после обучения, несоответствием между оффлайн и приложением, а также риском выпуска адаптера. В данной работе представлен метод CLAP (Closed-Loop Agent Post-training) — замкнутого цикла, который преобразует бизнес-данные в структурированные образцы SFT, образцы предпочтений решений, контрольные наборы, диагностику рисков и записи о воротах выпуска. CLAP сочетает в себе проверку данных, нормализацию целей и доказательств, диагностику награды и KL, оффлайн-ворота и воспроизведение цепочки приложений, чтобы определить, подходит ли адаптер для целевой цепочки приложений. На пяти анонимизированных партиях производственных сценариев метод LoRA-SFT в стиле QLoRA демонстрирует умеренные средние приросты: общий балл увеличивается на 0.0098, процент прохождения на 0.0240 и точность доказательств на 0.0280, в то время как случаи галлюцинаций и неверных фактов уменьшаются. Тем не менее, только 3 из 5 партий показали улучшение, а в некоторых случаях наблюдался регресс, при этом GRPO выявляет высокие риски KL. Воспроизведение цепочки приложений дополнительно указывает на то, что RAG необходим для фактической экстракции; при том же базовом уровне 3B и 100 случаях воспроизведения адаптер LoRA-SFT, ориентированный на приложения RAG, улучшает ценность, ключевые поля и совпадения ответов-доказательств по сравнению с базовым+RAG, но увеличивает задержку. Эти результаты поддерживают управление постобучением доменного агента через интегрированный цикл данных, обучения, оценки и выпуска, а не полагаясь на завершение обучения или единичный оффлайн-бал.