Отслеживаемая диагностика неисправностей для систем накопления энергии на базе батарей с помощью вспомогательного многоагентного O&M ассистента
Traceable Fault Diagnosis for Battery Energy Storage Systems via Retrieval-Augmented Multi-Agent O&M Assistant
Карточка статьи
Рубрика
Медицина
Источник
arXiv
Дата
02.07.2026
Автор
Science Morning
Время чтения
3 мин
Это предварительная публикация, она не прошла научное рецензирование.
Аннотация
Системы накопления энергии на базе батарей (BESS) крупного масштаба требуют решений по эксплуатации и обслуживанию (O&M), которые объединяют тревожные сигналы, измерения на уровне ячеек, топологию устройств, диагностические таблицы, исторические случаи и документы по техническому обслуживанию. Платформы мониторинга могут выявлять нарушения пороговых значений, но они часто не могут объяснить, требует ли вмешательства несоответствие напряжения, дрейф сопротивления, риск короткого замыкания, расхождение в емкости или термическая аномалия. В этом материале представлен отслеживаемый помощник по диагностике неисправностей BESS, который использует многократное рассуждение с использованием поиска для соединения операционных данных, знаний в области, визуальных доказательств и генерации отчетов. Надежность повышается за счет специфической маршрутизации задач для BESS, доступа к базе данных естественного языка с ограничениями схемы, гибридного поиска текста и изображений, а также синтеза ответов на основе доказательств. Приведены предварительные внутренние оценки для маршрутизации, доступа к базе данных и диагностического рассуждения.
Краткое резюме
Статья посвящена разработке помощника по диагностике неисправностей для систем накопления энергии на базе батарей, который объединяет различные источники данных и применяет многоагентные подходы для повышения эффективности O&M.
Практический вывод
Представленный помощник может значительно улучшить процесс диагностики и принятия решений в системах накопления энергии, обеспечивая более точные и быстрые рекомендации для их обслуживания.
Ограничения
Это предварительная публикация, она не прошла научное рецензирование. Исследование признает, что предварительные результаты требуют дальнейшей проверки и валидации, так как полное развертывание системы может столкнуться с проблемами интеграции различных источников данных.
Доменные агенты часто сталкиваются с шумными бизнес-данными, неопределёнными приростами после обучения, несоответствием между оффлайн и приложением, а также риском выпуска адаптера. В данной работе представлен метод CLAP (Closed-Loop Agent Post-training) — замкнутого цикла, который преобразует бизнес-данные в структурированные образцы SFT, образцы предпочтений решений, контрольные наборы, диагностику рисков и записи о воротах выпуска. CLAP сочетает в себе проверку данных, нормализацию целей и доказательств, диагностику награды и KL, оффлайн-ворота и воспроизведение цепочки приложений, чтобы определить, подходит ли адаптер для целевой цепочки приложений. На пяти анонимизированных партиях производственных сценариев метод LoRA-SFT в стиле QLoRA демонстрирует умеренные средние приросты: общий балл увеличивается на 0.0098, процент прохождения на 0.0240 и точность доказательств на 0.0280, в то время как случаи галлюцинаций и неверных фактов уменьшаются. Тем не менее, только 3 из 5 партий показали улучшение, а в некоторых случаях наблюдался регресс, при этом GRPO выявляет высокие риски KL. Воспроизведение цепочки приложений дополнительно указывает на то, что RAG необходим для фактической экстракции; при том же базовом уровне 3B и 100 случаях воспроизведения адаптер LoRA-SFT, ориентированный на приложения RAG, улучшает ценность, ключевые поля и совпадения ответов-доказательств по сравнению с базовым+RAG, но увеличивает задержку. Эти результаты поддерживают управление постобучением доменного агента через интегрированный цикл данных, обучения, оценки и выпуска, а не полагаясь на завершение обучения или единичный оффлайн-бал.
Исследования внешней валидации имеют конечный размер выборки, что создает неопределенность относительно того, превышает ли чистая выгода (ЧВ) модели прогнозирования ЧВ базовых стратегий. Ожидаемая цена идеальной информации (ОПИ) quantifies последствия неопределенности. Текущие методы ОПИ фокусируются на одиночных исследованиях, игнорируя гетерогенность между центрами. Мы расширяем ОПИ и ожидаемую цену частичной идеальной информации (ОПЧИ), чтобы учесть гетерогенность между кластерами в многокцентровых исследованиях и метаанализах. Мы различаем глобальную и локальную оптимальную стратегию, а также наблюдаемые и ненаблюдаемые кластеры. Мы определяем ОПИглобальная, ОПИкластер_j, ОПИкластер и ОПЧИкластер,преобладание, реализованные в R-пакете MetaNB, и иллюстрируем их с помощью систематического обзора, проведенного в 36 центрах, по модели ADNEX для диагностики рака яичников. Предполагая одно глобальное решение по принятию ADNEX, нет необходимости в дополнительных данных для подтверждения, что ADNEX является превосходящим в целом (ОПИглобальная 0). Метаанализ заимствует информацию из наблюдаемых кластеров, что приводит к последовательному локальному превосходству ADNEX и ненулевому, но обычно более низкому ОПИкластер_j, чем при учете только локальных данных. Вероятность того, что базовые стратегии превосходят в ненаблюдаемых центрах, составляет 0.03. Устранение неопределенности в производительности и преобладании в каждом кластерном (ОПИкластер) дало бы 1134 чистых избегнутых ложноположительных результатов (ЛП) в год, предполагая 350000 опухолей ежегодно с 20% злокачественностей. Определение только локального преобладания с уверенностью (ОПЧИкластер, преобладание) дало бы 158 чистых избегнутых ЛП в год. Расширения ОПИ распутывают источники неопределенности и количественно оценивают необходимость дальнейшей валидации для определения глобальной или локально оптимальной стратегии. Учет неопределенности и гетерогенности в клинической полезности между кластерами имеет решающее значение для принятия решения о необходимости дополнительных валидационных исследований.
Фиброаденома груди (ФА) и опухоль Филлоидов (ОФ) — это фиброэпителиальные поражения груди с высоко перекрывающимися проявлениями на ультразвуковых изображениях, что делает доброкачественные и пограничные ОФ подверженными ошибочной классификации как ФА, осложняя предоперационное принятие решений. Существующие методы компьютерной помощи в диагностике обычно основываются на однородных изображениях и недостаточно используют дополнительные клинические и текстовые данные. Чтобы решить эту проблему, мы разработали набор данных FAPT-M, состоящий из 910 пациентов с строго проверенными ультразвуковыми изображениями, структурированными клиническими атрибутами и описаниями ультразвуковой диагностики. На основе этого набора данных мы предлагаем клинически ориентированную мультимодальную структуру, которая объединяет визуальное кодирование на основе DenseNet, текстовое кодирование, вдохновленное CLIP, и легковесное клиническое кодирование, а также вводит адаптивную модуляцию с учетом клинических данных, фузию между модальностями с помощью Transformers и обучение представления с двойным путем для улучшения согласования признаков и взаимодействия между модальностями. В рамках пятирубцовой перекрестной проверки на уровне пациентов предлагаемый метод достигает точности 77,64%, F1-оценки 73,38% и AUC 89,74%, что превосходит представительные эталонные методы на базе CNN, Transformers и визуально-языковых моделей. Исследования по абляции и оценки с учетом классов дополнительно подтверждают вклад фузии трех модальностей и ключевые архитектурные компоненты. В целом, эта работа предоставляет эффективный мультимодальный подход для детальной классификации ФА и ОФ и устанавливает высококачественный эталон для мультимодального анализа ультразвука молочной железы.
Эффективная диагностика заболеваний мозга требует синергии паттернов подключения мозга и высокоуровневых семантических знаний. Однако существующие методы в значительной степени рассматривают семантику из крупных языковых моделей (LLMs) как вспомогательные признаки или руководство, что ограничивает их прямую роль в принятии решений и сужает стабильность и надежность классификации. Чтобы преодолеть это, мы предлагаем фреймворк семантически согласованной нейросети мозга, который активно интегрирует семантику, полученную от LLM, в процесс предсказания. В частности, семантика на уровне ROI сначала включается через глобальное самообращение для обогащения представлений узлов и предоставления контекста всего мозга. Затем строятся многомасштабные гиперграфы для явного моделирования функциональных подсетей и взаимодействий между несколькими ROI, что решает локальные ограничения традиционных ГНН и захватывает высокопорядковые зависимости. Наконец, механизм семантической согласованности на уровне принятия решений избирательно вводит текстовые вложения, специфичные для пациента, в графовые представления, позволяя семантике напрямую управлять предсказаниями без нарушения глубинной структуры сети. Эксперименты на публичных наборах данных сети мозга ABIDE и ADHD-200 демонстрируют состояние искусства, повышенную стабильность и улучшенную интерпретируемость, особенно в условиях небольших выборок.
Диагностика традиционной китайской медицины (ТКМ), особенно через осмотр языка, сталкивается с постоянными проблемами субъективности и воспроизводимости. Применение многомодального искусственного интеллекта для клинических задач ТКМ, таких как дифференциация синдромов и генерация рецептов, значительно затруднено семантическим разрывом между визуальными характеристиками языка и текстовым обоснованием, а также отсутствием масштабных, стандартизированных наборов данных. Для решения этих проблем мы представляем MMIR-TCM, новую структуру, которая эмулирует процесс диагностики экспертов ТКМ, интегрируя многомодальную языковую модель с сегментацией, дополненной памятью и генерацией, основанной на извлечении. Используя архитектуру, состоящую из трех этапов, MMIR-TCM интегрирует модуль Memory-SAM, не требующий обучения, для надежного извлечения языка, уточненную модель Qwen3-VL для генерации структурированной диагностики языка и компонент RAG на основе Qwen3 для генерации обоснованной клинической поддержки принятия решений. Структура была разработана и валидирована с использованием MedTCM, нового крупномасштабного многомодального набора данных, который мы представляем специально для углубленных исследований ТКМ. Для правильной оценки клинической точности нашей структуры, которую существующие метрики не могут отразить, мы также разработали TDEU, доменно-специфическую оценочную метрику, учитывающую семантическое понимание и диагностическую важность. Наши комплексные эксперименты демонстрируют, что MMIR-TCM значительно превосходит ведущие модели.
Обучение с подкреплением (RL) — это метод принятия решений в последовательных задачах, при котором агент обучается оптимальным политикам через взаимодействие с окружающей средой, максимизируя кумулятивные вознаграждения. Среди методов RL байесовское обучение с подкреплением (BRL) решает распространенные практические задачи, связанные с нехваткой данных, используя предварительные знания об окружении и последовательные обновления убеждений. Тем не менее, большинство подходов BRL требуют явной функции правдоподобия, которая часто недоступна или сложна для решения в реальных условиях. Мы предлагаем алгоритм, не требующий вычисления правдоподобия, — Итеративная Выборка Параметров Важности без Явного Правдоподобия (LF-IBIS), который обновляет убеждения агента в режиме онлайн по мере появления новых взаимодействий. Сочетая приближенные байесовские вычисления с итеративной выборкой параметров важности, LF-IBIS позволяет проводить полное байесовское вывод в условиях, когда динамика окружения не описана явным или управляемым правдоподобием. Метод предоставляет приближенные постериорные распределения как для параметров окружения, так и для оптимальных политик, обеспечивая количественную оценку неопределенности политики, что полезно для байесовского анализа компромисса между исследованием и эксплуатацией. Мы тестируем метод на симуляционном исследовании адаптивной рандомизации в клинических испытаниях, где закрытые формы постериоров позволяют провести валидацию. Дополнительные эксперименты рассматривают ситуации, когда постериор не имеет закрытой формы, и демонстрируют онлайн-обновление политики на основе постериорного распределения оптимальной политики.