Искусственный интеллектarXivScience Morning3 мин чтенияpreprint
KRCA: Эффективная система анализа коренных причин в гипермасштабируемых микросервисных системах с использованием агентного ИИ
KRCA: An Efficient Root Cause Analysis System in Hyper-Scale Microservice Systems via Agentic AI
Карточка статьи
Рубрика
Искусственный интеллект
Источник
arXiv
Дата
02.07.2026
Автор
Science Morning
Время чтения
3 мин
Это предварительная публикация, она не прошла научное рецензирование.
Аннотация
Гипермасштабируемые микросервисные системы стали стандартной инфраструктурой для крупных интернет-компаний. Эти системы состоят из множества слабо связанных микросервисов, которые развиваются независимо через постоянную разработку и развертывание. Такая сложность делает сбои неизбежными, что требует эффективного анализа коренных причин (RCA), чтобы помочь инженерам по надежности сайтов (SRE) быстро локализовать корневые сервисы и классифицировать типы сбоев. Однако существующие методы RCA часто сталкиваются с трудностями в адаптации к экстремальной динамичности и масштабам этих систем. В этой работе мы представляем KRCA, сквозную систему RCA, разработанную для гипермасштабируемых микросервисных систем. Для управления обширным пространством поиска KRCA использует многоступенчатый конвейер, который начинается с досконального анализа на уровне API для изоляции подозрительных сервисов. Затем он создает граф причинно-следственных связей на основе аномальных метрик, чтобы служить высокореколлным структурным приоритетом, прежде чем использовать память-расширенную многоагентную структуру для проверки причинности и генерации окончательного отчета о сбое. Объединив структурированные причинно-следственные ограничения с многоагентным рассуждением, KRCA обеспечивает баланс между диагностической точностью и требованиями к эффективности для использования в реальном времени. Экспериментальные результаты показывают, что KRCA достигает оценок AC@1 0.88 и 0.79 для локализации корневых сервисов и классификации типов сбоев, превосходя самые сильные базовые показатели по крайней мере на 31% в абсолютных приростах. KRCA была внедрена в производственной среде Kuaishou на протяжении более шести месяцев, что позволило сократить среднее время диагностики на 77.3%.
Краткое резюме
KRCA — это новая система анализа коренных причин, предназначенная для гипермасштабируемых микросервисов, которая значительно увеличивает скорость и точность диагностики сбоев, сокращая время анализа на 77,3%.
Практический вывод
KRCA демонстрирует высокий уровень эффективности в локализации корневых причин и классификации типов сбоев, что может значительно улучшить надежность и производительность микросервисных систем.
Ограничения
Это предварительная публикация, она не прошла научное рецензирование. Хотя KRCA показала отличные результаты, она может быть ограничена в применимости к системам с другим архитектурным стилем, и ее эффективность может варьироваться в зависимости от специфики данных и инфраструктуры.
Болезнь Альцгеймера (БА) — это дегенеративное неврологическое заболевание, характеризующееся потерей памяти, ухудшением когнитивных функций и уменьшением объема мозговой ткани. Обнаружить его на ранней стадии сложно из-за вариаций в прогрессировании заболевания и ограниченных возможностей методов нейровизуализации с единственной модальностью. Диагностика болезни Альцгеймера на основе магнитно-резонансной томографии (МРТ) предоставляет дополнительные структурные и функциональные данные, однако существующие методы глубокого обучения часто сталкиваются с проблемами несбалансированности данных, высокой вычислительной сложности и ограниченной обобщаемостью. Для устранения этих пробелов разработана структура извлечения признаков из МРТ на основе EfficientNet для классификации стадий болезни Альцгеймера. EfficientNet, оснащенный комбинированным масштабированием, слоями с разделением по глубине и компонентами сжатием и возбуждением, позволяет точно охарактеризовать корковые структуры и вариации во всем мозге, сохраняя при этом вычислительную эффективность. Извлеченные признаки классифицируются с помощью сети свёрточной многомасштабной внимательной сети на основе сжатия (C-MSACCN), которая объединяет механизмы внимания и стратегии сжатия для повышения точности и снижения сложности модели. Более того, улучшенный оптимизатор соседей клеток (ICNO) тонко настраивает гиперпараметры, находя баланс между исследованием и эксплуатацией для оптимального сходимости и устойчивости. С точностью 99,9%, точностью, полнотой и F1-мерой на наборах данных модель превосходит предыдущие работы. Валидация подтверждает согласованность, а методы визуализации выделяют области, связанные с заболеванием, для предоставления клинической информации.
Мы изучаем агентную генерацию кода в Dafny, где модель должна генерировать как исполняемый код, так и артефакты доказательства для верификации. Мы представляем AxDafny, фреймворк для исправления, управляемый верификатором, который итеративно генерирует реализации, инварианты, утверждения и доводы о завершении. Также мы вводим LiveCodeBench-Pro-Dafny (LCB-Pro-Dafny), набор тестов из 250 задач программирования в стиле соревнований, переведенных на Dafny с формальными спецификациями и средой оценки на базе верификатора. На LCB-Pro-Dafny AxDafny существенно улучшает уровень успешности верификации по сравнению с базовой производительностью GPT-5.5. На DafnyBench AxDafny достигает 92.7% успешности верификации, что на 6.5 процентных пункта превышает ранее зафиксированный самый высокий уровень базового указания доказательства. Наконец, мы показываем, что успешность верификации и производительность тестов во времени измеряют различные аспекты сгенерированного кода.
Текущие исследования в области роботизированной сборки мебели в основном сосредоточены на игрушечных масштабах или манипуляциях с одной рукой. Мы представляем FurnitureVLA, первое систематическое исследование бимануальной сборки мебели в реальном масштабе с использованием моделей видения-языка-действия (VLA). Мы формализуем задачу, разрабатываем масштабируемый симуляционный конвейер для генерации и оценки экспертных данных и создаем систему телеприсутствия в виртуальной реальности для управления бимануально одним оператором с целью сбора качественных демонстраций из реального мира. Чтобы справиться с экстремально долгосрочной сборкой, которая включает до 7 подсостояний и 1550 контрольных шагов, мы предлагаем улучшенную модель VLA, донастроенную на семантически обоснованные подсостояния, которая совместно предсказывает действия и непрерывный сигнал прогресса, позволяя автоматически переходить между подсостояниями и снижая накопление ошибок во время вывода. Мы также исследуем факторы проектирования восприятия и управления, которые критически влияют на точность в сборке в реальном масштабе. FurnitureVLA улучшает средний уровень успеха симуляции с 48% до 80% по сравнению с базовыми показателями для трех типов мебели, с дополнительным приростом в 21% благодаря изучению факторов проектирования. Мы валидируем на реальной платформе Kinova Gen3 с только 16% снижением на наиболее сложной задаче.
Хотя большие языковые модели (БЯМ) хорошо справляются с задачами, связанными с таблицами, они все же совершают ошибки при ссылках на данные (ЭСД), то есть неправильно цитируют или опускают значения из таблиц, несмотря на понимание их структуры. Кроме того, что ошибки при ссылках на данные влияют на точность финальных ответов, они прямо ставят под сомнение корректность и надежность промежуточных шагов рассуждения. Однако предыдущие исследования предлагали лишь ограниченные и мелкомасштабные анализы. В данной работе мы представляем первую систематическую оценку ошибок ссылок на табличные данные в различных моделях и задачах. Наши результаты показывают, что ЭСД встречаются во всех протестированных моделях (от 1.7 до 20 миллиардов параметров). Кроме того, мы демонстрируем, что внедрение ссылок на данные в качестве критика значительно улучшает точность ответов на 12.0% с помощью фильтрации на основе критика и выборки для отклонения. В заключение, мы обучили легкую модель критика с 4 миллиардами параметров, которая достигает средней F1 оценки 78.2% в обнаружении как внутрираспределенных, так и внераспределенных ЭСД и эффективно способствует выводу для более крупных моделей.
Достижение ненавязчивого высокочастотного мониторинга ишемического инсульта (ИИ) остается важной клинической задачей для своевременного вмешательства и точной вторичной профилактики. Установление точных корреляций между системными микроскопическими молекулярными отпечатками пациентов и локализованными макроскопическими патологическими событиями в органах является необходимым для преодоления ограничений одномодального выявления и повышения эффективности клинической оценки риска. Однако, учитывая сложность гетерогенных данных, эффективная интеграция кросс-мерных данных «молекулярной визуализации» остается критическим узким местом на пути к достижению этой цели. В данном исследовании мы представляем метод, подтверждающий возможность различия между пациентами с подтвержденным ИИ и здоровыми контрольными группами (ЗК), который использует методы машинного обучения (МЛ) в сочетании с поверхностно-усиленной рамановской спектроскопией (SERS) мочи (одномерные данные) и ультразвуковым изображением ствола сонной артерии (CBI) (двухмерные данные). В экспериментальной когорте из 101 участника данный подход проанализировал 10 100 спектров SERS и 481 изображение CBI, достигнув 92% точности классификации и площади под кривой (AUC) 0,95. Более того, с помощью комбинации спектров SERS и технологии жидкостной хроматографии-масс-спектрометрии данное исследование предварительно исследовало различия в мочевых биомаркерах между группами ЗК/ИИ. Предложенная в этом исследовании стратегия многомерного слияния данных эффективно преодолевает информационный разрыв между традиционным молекулярным выявлением и клиническими фенотипами, систематически соотнеся микрофлюидные биомаркеры с макроорганными изображениями. Этот подход предоставляет ранее не исследованный, ненавязчивый и высокоточный инструмент для стратификации риска и клинического принятия решений при классификации групп ЗК/ИИ.
Квантовые вычисления все активнее исследуются в области оптимизации программного обеспечения (ПО), однако перевод требований на естественном языке (ЕЯ) на уровне задач в исполняемые квантовые приложения по-прежнему требует значительных знаний в области квантовой механики и программирования. Мы представляем QPipe — архитектуру многоагентной системы на основе большой языковой модели (БЯМ), которая автономно преобразует требования на ЕЯ в отслеживаемые рабочие процессы квантовых приложений с помощью специализированных агентов для разбора требований, их формулировки, генерации кода, рецензирования, выполнения и верификации. Мы оценили QPipe на 20 требованиях на ЕЯ, каждое из которых связано с реальным бенчмарком и задачей оптимизации тестов. QPipe успешно завершил ключевые этапы генерации квантового приложения для всех требований, достигнув средних показателей 100% по компиляции кода и 96,7% по выполнению приложений и комбинированию окончательных результатов, с средними затратами на генерацию 260,1 секунды и 1,89 миллиона токенов на требование. Среди сгенерированных квантовых приложений, которые завершились успешно, полученные решения в большинстве случаев превосходят базовый уровень, заданный оффлайн-генетическим алгоритмом. Результаты абляции показывают, что преимущества QPipe зависят от сохранения навыков генерации кода, знания задач, обратной связи по рецензированию и мультиагентной декомпозиции. Эти результаты подтверждают, что координация агентов может поддерживать генерацию исполняемых квантовых приложений для решения задач оптимизации тестов на основе реальных бенчмарков.