БиологияarXivScience Morning3 мин чтенияpreprint

MolSight: Модель визуального языка с учетом графов для универсального понимания химических изображений

MolSight: A Graph-Aware Vision-Language Model for Unified Chemical Image Understanding

Рубрика
Биология
Источник
arXiv
Дата
02.07.2026
Автор
Science Morning
Время чтения
3 мин

Это предварительная публикация, она не прошла научное рецензирование.

Биология

Аннотация

Использование крупных языковых моделей (LLM) для молекул в качестве единой платформы для понимания молекулярных структур и функций становится новой тенденцией в таких задачах, как молекулярный дизайн и открытие лекарств. Тем не менее, эти модели не способны в полной мере отражать визуальное представление молекулярных структур, что ограничивает их потенциал. Хотя существующие молекулярные модели визуального языка (VLM) показывают обнадеживающие результаты, они по-прежнему сталкиваются с проблемами структурной подгонки и недостатком необходимого топологического моделирования для точного понимания молекул. Чтобы решить эту проблему, мы предлагаем MolSight — платформу модели визуального языка, учитывающую графы, предназначенную для повышения понимания молекулярных изображений с помощью VLM. MolSight интегрирует Модуль молекулярной топологии, чтобы внедрить информацию о соседстве химических связей в визуальные токены, и Модуль молекулярного сопоставления для согласования визуальных особенностей с химической символикой семантики. Наши эксперименты показывают, что MolSight значительно превосходит существующие VLM, молекулярные LLM и специализированные инструменты по множеству задач понимания химических изображений, достигая нового уровня рассуждений о молекулярных изображениях.

Краткое резюме

MolSight — это новая модель, предназначенная для улучшения анализа молекулярных изображений. Она использует графовую структуру для более точного отображения молекулярных свойств и значительно превосходит предшествующие модели в ряде химических задач.

Практический вывод

MolSight может стать мощным инструментом в области молекулярного дизайна и разработки лекарств, обеспечивая более глубокое понимание химических изображений.

Ограничения

Это предварительная публикация, она не прошла научное рецензирование. Работа основана на предварительных результатах и требует дальнейшего валидации и тестирования в реальных условиях, чтобы подтвердить ее эффективность и применимость.

Похожие исследования

Подборка учитывает рубрику, ключевые слова, аннотацию, резюме, практические выводы и источник.

Биология
Биология
100%

DisciplineGen-1M: Массированный набор данных для многодисциплинарного визуального генерирования и редактирования

Недавние модели генерации и редактирования изображений могут создавать визуально привлекательные натуральные изображения, однако они остаются ненадежными, когда целевое изображение представляет собой знания-интенсивную диаграмму, корректность которой зависит от дисциплинарных концепций, символической структуры и точных пространственных отношений. Мы представляем DisciplineGen-1M, набор данных многодисциплинарного масштаба с миллионом образцов, который поддерживает генерацию изображений из текста и редактирование изображений. Он содержит 1,2 миллиона образцов из математики, физики, химии, биологии, географии, информатики, экономики, истории, музыки и спорта. Для создания набора данных мы разрабатываем масштабируемую структуру, которая объединяет рендеринг векторной графики, редактирование на основе OCR, программный синтез и крупномасштабную фильтрацию текстов в изображения. Эти рабочие процессы обеспечивают создание аннотаций, инструкций по редактированию, структурированных аннотаций и пар изображений с контролируемыми семантическими различиями. Основываясь на DisciplineGen-1M, мы дополнительно представляем модель генерации рассуждений, учитывающую дисциплину, для генерации изображений из текста и редактирования изображений. Эксперименты на связанных с дисциплиной моделях, GenExam и GRADE, показывают значительные улучшения по сравнению с открытыми эталонами, в то время как оценки на общих моделях, информированных рассуждениями, WISE и RISE, дополнительно указывают на более широкий перенос. Результаты свидетельствуют о том, что структурированные академические визуальные данные большого объема являются ключевым компонентом для перехода генерации изображений от эстетической правдоподобности к верифицируемому созданию визуального контента на основе знаний. Мы публично выпустим наш набор данных, модель и исходный код процесса кураторства данных, чтобы обеспечить воспроизводимость и содействовать будущим исследованиям.

Биология
Биология
100%

GlycoMAC: Мультимасштабная метаболическая и гликозилирующая модель для предсказания гликозилирования в условиях культур млекопитающих клеток

Продуктивность антител и качество гликозилирования в культурах CHO возникают из динамически меняющейся метаболической среды, однако модели часто работают в изоляции или на одном уровне. В данной работе мы представляем мультимасштабную механистическую модель, связывающую молекулярный, клеточный и процессный уровни, для предсказания того, как входные параметры формируют траектории биопроцессов. Основой модели является кинетическая модель на уровне одной клетки, которая связывает метаболические и гликозилирующие сети, управляющие выходом и критическими качественными характеристиками (CQA). Стохастическая модель одной клетки описывает зависящие от окружающей среды переходы между ростом, производством и упадком, учитывая гетерогенность популяции. Мы также вводим накопительное изменение скорости поглощения кислорода, интегрируя общее метаболическое изменение со временем, как компактный биомаркер для предсказания метаболических изменений. В отличие от подходов, основанных на среднем по популяции, модель передает метаболические состояния с разрешением на уровень клеток (включая pH Гольджи, регулируемое аммиаком, доступность нуклеотидных сахаров, марганцевые кофакторы и скорость синтеза) в процесс гликозилирования. Модель была оценена на культурах CHO-K1, производящих VRC01 IgG1 при целевом стрессе от аммиака, в условиях контроля и с использованием стратегии пирамидальной подачи с более строгим контролем. Она точно предсказывает траектории плотности клеток, метаболитов, продуктивности и гликозилирования, включая увеличение G0F и снижение галактилирования при стрессе от аммиака, и количественно оценивает, как метаболическая гетерогенность влияет на изменчивость продуктивности и CQA. Эта работа предоставляет единое основание для предсказательной биопроизводства и продвинутого управления процессами.

Биология
Биология
79%

Структурированные гауссовские процессы для классификации омических данных с учетом неопределенности в условиях высокой размерности и малых выборок

Классификация гетерогенных омических данных по-прежнему остается основной проблемой в вычислительной биологии, особенно в условиях высокой размерности и малых выборок, где доминируют нелинейные взаимодействия, а дисбаланс классов дополнительно усложняет надежное предсказание редких фенотипов. Хотя традиционные методы на основе ядров полагаются на изобилие признаков, они не используют известные ландшафты взаимодействий биологических систем. В данной работе мы предлагаем структуру классификации на основе гауссовского процесса, которая интегрирует закодированные графом биологические пути непосредственно в конструкцию ядра. Пропагируя информацию вдоль известных сетей взаимодействия и комбинируя это с признаками, основанными на изобилии, полученный классификатор захватывает как количественные измерения, так и топологический контекст. Мы проводим оценку нашей предложенной методологии на трех общедоступных наборах данных по микробиому кишечника и кала. Для решения проблемы серьезного дисбаланса классов мы оцениваем дополнительные стратегии, включая ресемплирование на уровене данных, калибровку порогов и корректировки на основе матрицы замешательства, и сообщаем о результатах для класса меньшинства наряду с общей точностью. Гибридный подход дает прирост производительности по сравнению с неструктурированными базовыми решениями и соответствует показателям установленных эталонов для аналогичных наборов данных. Кроме того, вероятностная природа данного подхода естественным образом предоставляет откалиброванную предсказательную неопределенность, позволяя надежно различать уверенные предсказания и неоднозначные образцы.

Биология
Биология
77%

Воздействие атмосферных твердых частиц и их химических компонентов на резерв яичников среди 29,610 женщин с бесплодием в провинции Шэньси, Китай.

Тонкие частицы (PM) были предложены как потенциальный фактор риска для женского репродуктивного здоровья. Однако исследования, посвященные конкретным компонентам PM и резерву яичников, остаются ограниченными. Более того, уязвимые временные окна воздействия загрязнения воздуха недостаточно изучены. Наша цель состояла в оценке взаимосвязи между компонентами PM и резервом яичников в Китае. В исследование вошли 29,610 женщин в возрасте от 20 до 45 лет, которые проходили лечение с применением вспомогательных репродуктивных технологий в центре репродуктивной медицины в провинции Шэньси, Китай, в период с 2015 по 2020 год. Воздействие резидентного PM и пяти ключевых компонентов, включая сульфат (SO), нитрат, аммоний, органическое вещество и черный углерод, на протяжении пяти этапов развития фолликулов было оценено с помощью спутниковых моделей. Для анализа взаимосвязи между воздействием компонентов PM на каждом этапе и показателями резерва яичников, включая количество антральных фолликулов и анти-Мюллеров гормон, применялась обобщенная линейная регрессия. Воздействие PM было связано с уменьшением количества антральных фолликулов в несколько периодов, особенно в период с первичных до вторичных фолликулов. Скорректированный β варьировался от -0.123 (95% доверительный интервал: -0.232, -0.013) для периода 3 (первичный фолликул до вторичного фолликула) до -0.190 (95% доверительный интервал: -0.295, -0.085) для периода 1 (первичный до небольшого антрального фолликула). Модель остатка по компонентам показала, что SO наиболее сильно связан с ухудшением резерва яичников. Надежность результатов подтверждается дополнительными анализами чувствительности. Эти взаимосвязи были более выраженными среди женщин с низким уровнем образования. Наши выводы подчеркивают важность охраны общественного здоровья для снижения загрязнения воздуха с целью улучшения репродуктивного здоровья женщин.

Биология
Биология
77%

MERLIN-SUITE: Вероятностное модульное восстановление генетических регуляторных сетей из многомерных омных данных с интеграцией регуляторных приоритетов и активности транскрипционных факторов

Точное восстановление генетических регуляторных сетей (GRN) имеет решающее значение для понимания транскрипционных процессов в процессе развития и при заболеваниях. MERLIN-SUITE представляет собой набор алгоритмических расширений, основанных на MERLIN — вероятностной структуре, которая выводит специфические для генов и модуля регуляторные программы со-регулируемых модулей, захватывая как детализированные, так и модульные аспекты транскрипционных сетей. Хотя вывод на основе экспрессии эффективен, он часто плохо совпадает с экспериментально подтвержденными регуляторными взаимодействиями. MERLIN-P решает эту проблему, интегрируя внешние регуляторные приоритеты, такие как мотивы, данные ChIP и данные о perturbations, для повышения биологической значимости и предсказательной точности. MERLIN-P-TFA далее развивает структуру, внедряя регуляризованную оценку скрытой активности транскрипционных факторов, преодолевая ограничение, что уровни мРНК TF могут не представлять активность белка. Интегрируя данные о экспрессии, предшествующие знания и моделирование с учетом активности, этот унифицированный подход поддерживает надежное восстановление GRN как в объемных, так и в одноядерных наборах данных. Этот раздел представляет MERLIN-SUITE с акцентом на MERLIN-P-TFA и демонстрирует его использование на наборе данных мышиного клеточного перепрограммирования с несколькими модальностями для вывода GRN и идентификации ключевых регуляторов.

Биология
Биология
72%

Переломный момент 3D-фенотипирования растений: 3D-фундаментальные модели позволяют реконструкцию кросс-культур в масштабе от минут до секунд

3D-фенотипирование растений известно сложностью процедур и низкой производительностью из-за обширной многовидовой съемки, хрупкой цепочки 3D-реконструкции и дополнительных затрат на извлечение фенотипической информации из восстановленной геометрии. Эти ограничения усиливаются при низкозатратном сборе данных, когда видео со смартфонов или малонагруженные многовидовые изображения обеспечивают ограниченное перекрытие видов и самозатемнение. В этой работе мы показываем, что традиционную схему 3D-фенотипирования растений можно упростить и значительно ускорить с помощью 3D-фундаментальных моделей (3DFMs), и в частности, представляем одну из первых схем 3D-фенотипирования кросс-культур, основанную на 3DFMs. Эта схема заменяет разреженную инициализацию в стиле COLMAP на основанное на 3DFM геометрическое восстановление с прямой связью, сочетает 3D Gaussian Splatting с ограничениями по геометрии для плотной реконструкции, позволяет реконструировать из нескольких видов через итеративный синтез и уточнение видов и преобразует восстановленную геометрию в измеримые органы через семантический перенос из 2D в 3D, восстановление метрического масштаба и разделение экземпляров органов. Мы также создаем набор данных для кросс-культур с приобретением изображений на основе смартфонов, разнообразными морфологиями растений и ручными аннотациями для сегментации и фенотипической оценки. Эксперименты на 26 последовательностях растений показывают, что 3D-фундаментальные модели сокращают среднее время реконструкции с 6,52 минут до 1,58 секунд, сохраняя при этом высокое качество реконструкции и точность фенотипирования. Эти результаты предполагают новый технический путь для высокопроизводительного 3D-фенотипирования растений, начиная с недорогого получения изображений и заканчивая быстрой реконструкцией, восприятием, восстановлением масштаба и фенотипическим измерением.