Искусственный интеллектmedRxivScience Morning3 мин чтенияpreprint
Декодирование регуляторной генетической архитектуры эндометриоза с использованием AlphaGenome
Decoding the regulatory genetic architecture of endometriosis using AlphaGenome
Карточка статьи
Рубрика
Искусственный интеллект
Источник
medRxiv
DOI
10.64898/2026.06.27.26356730
Дата
30.06.2026
Автор
Science Morning
Время чтения
3 мин
Это предварительная публикация, она не прошла научное рецензирование.
Краткое резюме
Исследование с использованием AlphaGenome выделило 147,033 высококачественных регуляторных сигналов, связанных с эндометриозом, что подтверждает важность регуляторных эффектов, специфичных для матки, в понимании патогенеза заболевания.
Практический вывод
Полученные результаты могут помочь приоритезировать кандидаты на генетические варианты и гены для дальнейшего изучения в контексте эндометриоза.
Ограничения
Это предварительная публикация, она не прошла научное рецензирование. Основные ограничения исследования связаны с ограниченным охватом аннотации, специфичной для тканей, и возможными пропусками в понимании биологических механизмов, связанных с идентифицированными SNP.
Обучение с подкреплением (RL) стало центральным компонентом постобучения крупных языковых моделей (LLMs), однако мало что известно о том, как адаптация RL распределена по слоям трансформера. Существующие подходы обычно обновляют все параметры модели равномерно, подразумевая, что каждый слой вносит схожий вклад в приросты, достигнутые в процессе постобучения с использованием RL. В данной работе мы ставим под сомнение это предположение через систематическое изучение обучения RL по слоям. Удивительно, но мы обнаружили, что обучение одного слоя трансформера может воспроизвести большую часть приростов, достигнутых при полном обучении с RL, а в некоторых случаях даже превзойти его. Чтобы количественно оценить это явление, мы вводим величину "вклад слоя", которая измеряет долю полного улучшения RL, достигнутого благодаря обучению слоя в изоляции. В рамках семи моделей, охватывающих две семейства моделей (Qwen3, Qwen2.5), три алгоритма RL (GRPO, GiGPO, Dr. GRPO) и несколько областей задач, включая математическое рассуждение, генерацию кода и агентное принятие решений, мы наблюдаем замечательно стабильный паттерн: приросты RL сосредоточены в небольшом подмножестве, а в большинстве случаев даже в одном слое трансформера. Более того, тот же структурный паттерн последовательно возникает: слои с высоким вкладом сосредоточены в середине стека трансформера, тогда как слои ближе к входу и выходу вносят значительно меньший вклад. Ранжирование слоев при этом остается сильно коррелированным между датасетами, задачами, семействами моделей и алгоритмами RL.
Болезнь Альцгеймера (БА) — это дегенеративное неврологическое заболевание, характеризующееся потерей памяти, ухудшением когнитивных функций и уменьшением объема мозговой ткани. Обнаружить его на ранней стадии сложно из-за вариаций в прогрессировании заболевания и ограниченных возможностей методов нейровизуализации с единственной модальностью. Диагностика болезни Альцгеймера на основе магнитно-резонансной томографии (МРТ) предоставляет дополнительные структурные и функциональные данные, однако существующие методы глубокого обучения часто сталкиваются с проблемами несбалансированности данных, высокой вычислительной сложности и ограниченной обобщаемостью. Для устранения этих пробелов разработана структура извлечения признаков из МРТ на основе EfficientNet для классификации стадий болезни Альцгеймера. EfficientNet, оснащенный комбинированным масштабированием, слоями с разделением по глубине и компонентами сжатием и возбуждением, позволяет точно охарактеризовать корковые структуры и вариации во всем мозге, сохраняя при этом вычислительную эффективность. Извлеченные признаки классифицируются с помощью сети свёрточной многомасштабной внимательной сети на основе сжатия (C-MSACCN), которая объединяет механизмы внимания и стратегии сжатия для повышения точности и снижения сложности модели. Более того, улучшенный оптимизатор соседей клеток (ICNO) тонко настраивает гиперпараметры, находя баланс между исследованием и эксплуатацией для оптимального сходимости и устойчивости. С точностью 99,9%, точностью, полнотой и F1-мерой на наборах данных модель превосходит предыдущие работы. Валидация подтверждает согласованность, а методы визуализации выделяют области, связанные с заболеванием, для предоставления клинической информации.
Мы анализируем влияние оптимизации начальной популяции генетического программирования (ГП) для символьной регрессии (СР) на точность и сложность решений. Мы сравниваем три хорошо известные методы случайной инициализации, а также инициализацию с небольшими оптимизированными решениями из исчерпывающей символьной регрессии (ИСР), используя реализацию ГП/СР, основанную на многокритериальном эволюционном алгоритме NSGA-II. Мы сравниваем конечные парето-фронты, найденные с помощью каждого метода инициализации, на двенадцати синтетических задачах различной сложности и одной реальной выборке. Мы не обнаружили значительных различий в точности или сложности моделей среди методов инициализации. Начальное преимущество инициализации с использованием ИСР исчезает всего через несколько поколений. Наши результаты показывают, что при сходной диверсификации в начальной популяции влияние метода инициализации в символьной регрессии на основе ГП на конечный парето-фронт представляет собой незначительный фактор.
Болезнь Хантингтона (БХ) имеет гетерогенное нейродегенеративное течение, при котором моторные, когнитивные и функциональные симптомы развиваются по-разному у различных людей. Такое нетипичное течение осложняет определение дискретных стадий болезни, что затрудняет понимание траекторий заболевания, timely pa- tient care и разработку терапии. В результате существующие клинические системы стадирования в значительной степени полагаются на критерии, определяемые клиницистами, специфичные для области, и фиксированные границы клинического измерения для назначения стадии, что снижает объективность и часто приводит к перекрытию клинических измерений между стадиями. Хотя методы машинного обучения могут помочь, существующие подходы не могут полностью уловить сложные временные зависимости внутри и между пациентами. Мы предлагаем URL-STFN, модель динамического представления графов, которая кодирует как меж-, так и внутри-пациентные временные паттерны на основе долгосрочных клинических измерений. Затем мы оцениваем стадии заболевания, образованные через кластеризацию и анализ стабильности латентных представлений URL-STFN, и сравниваем их с представлениями, полученными с помощью традиционных методов эмбеддинга. Мы также проводим бенчмаркинг этих стадий, основанных на кластеризации, по сравнению с состояниями, полученными из традиционных временных моделей, включая DHMM. Мы предполагаем, что кластеризация латентных представлений URL-STFN позволяет идентифицировать стадии БХ с уменьшением перекрытия клинических измерений. Предложенная структура оценивается с использованием 1,477 клинических визитов из набора данных Enroll-HD, крупной продольной когорты с повторными клиническими оценками. Для стадирования мы использовали 44 клинических измерения, охватывающих моторную, когнитивную и функциональную области. URL-STFN определяет клинически значимые стадии БХ, которые соответствуют установленному прогрессированию заболевания, одновременно уменьшая перекрытие значений клинических признаков по сравнению с подходами, основанными на DHMM, и клиническими стадиями. Эти выводы подчеркивают потенциал модели обучения представления на основе динамических графов и фреймворка кластеризации для поддержки более объективного, основанного на данных и точного стадирования БХ.
В данной работе представлена компактная MIMO-антенна с четырьмя элементами, демонстрирующая резонанс на частотах 6.39 ГГц, 11.09 ГГц, 14.69 ГГц и 17.96 ГГц, охватывающая диапазоны C, X и Ku соответственно в рамках одной компактной структуры. Разработанная четырехэлементная MIMO-антенна использует Y-образную радиирующую монопольную конфигурацию с соединённымиGround-элементами для удобной интеграции в системы. Также разработанная MIMO-антенна достигает геометрически обусловленной круглой поляризации (CP) под определёнными углами возвышения без внешних фазовращателей или паразитных структур, что приводит к повышенной надежности против затухания многопутевых сигналов и несовпадения поляризаций. Кроме того, критически важный параметр высокой изоляции между элементами поддерживается (Sij < -20 дБ), эффективно подавляя взаимные помехи. Параметры представленного дизайна четырехпортовой антенны также оптимизированы с использованием различных алгоритмов машинного обучения, причем модель гауссовской регрессии оказалась наиболее подходящей, обеспечивая наилучшие показатели возвратных потерь. В заключение, разработанная четырехпортовая MIMO-антенна была изготовлена, и её прототип протестирован для валидации смоделированных результатов. Компрéhенсивный анализ характеристик разнообразия демонстрирует параметры ECC (≤ 0.001), DG (≈ 10 дБ), CCL (< 0.2 б/с/Гц) и TARC (> 9.99), что обеспечивает эргодическую пропускную способность канала, превышающую 9 б/с/Гц. Средняя эффективность наблюдается на уровне 57% по всем диапазонам с пиковым усилением 9.78 дБи на 17.96 ГГц, что делает это решение высокоинтегрированным, надежным и перспективным для CP-MIMO систем связи, делая его сильным кандидатом для спутниковых и современных беспроводных приложений.
Обучение с подкреплением с проверяемыми наградами (RLVR) стало мощной парадигмой для обучения языковых моделей (ЛМ) по задачам с четко определяемыми метриками успеха, такими как генерация кода и математическое рассуждение. Однако текущие методы RLVR оптимизируют лишь то, что можно объективно оценить, часто пренебрегая субъективными, непроверяемыми аспектами человеческих выводов, такими как стиль и структура. Это ограничение приводит к хорошо задокументированным проблемам, таким как потеря разнообразия, неестественно звучащие ответы и манипулирование наградами. Мы предлагаем противоборствующую систему генератора-дискриминатора, которая дополняет проверяемые награды обученным сигналом из человеческих демонстраций. Модель генератора обучается с использованием RL для максимизации как точности выполнения задач, так и противоборствующей награды, полученной от дискриминатора. Дискриминатор, обучаемый вместе с политикой генератора, учится отличать тексты, написанные человеком, от сгенерированных моделью. Дискриминатор служит обученной прокси для распределения человеческих выходов, предоставляя обратную связь по аспектам генерации, которые трудно формализовать в виде скалярных наград. В различных областях, включая исправление ошибок и открытую генерацию, наш подход последовательно улучшает непроверяемые свойства, сохраняя при этом приросты точности RLVR. В исправлении ошибок наш метод демонстрирует решения с значительно меньшим расстоянием правок по сравнению с базовыми методами RLVR, достигая аналогичных результатов. В генерации рассказов наш подход значительно увеличивает вероятность победы, создавая истории, которые являются разнообразными и более приближенными к человеческим. В простом тесте на манипулирование наградами наш метод почти полностью устраняет неправильное поведение модели, сохраняя при этом высокие оценки по стандартам. Вместе эти результаты показывают, что наш подход соединяет RL и SFT, предлагая масштабируемый путь к совместной оптимизации проверяемых и непроверяемых свойств задачи.