Искусственный интеллектarXivScience Morning3 мин чтенияpreprint
Мир в движении: Генеративная динамическая гауссовская реконструкция из монокулярного видео
World from Motion: Generative Dynamic Gaussian Reconstruction from Monocular Video
Карточка статьи
Рубрика
Искусственный интеллект
Источник
arXiv
Дата
01.07.2026
Автор
Science Morning
Время чтения
3 мин
Это предварительная публикация, она не прошла научное рецензирование.
Аннотация
Мы представляем метод «Мир в движении», который позволяет создавать динамические 3D гауссовские представления из монокулярных видео, пригодные для произвольного рендеринга. Наш подход основывается на условной модели видео, которая использует плотные, пиксельно согласованные рендеры, кодирующие внешний вид, геометрию и движение 3D-сцены вдоль траекторий ввода и целевой камеры, чтобы исправить артефакты рендеринга и заполнить отсутствующие области исходной реконструкции. Для обучения этой модели мы создали набор данных, состоящий из выровненных пар многовидовых видео и динамических 3D гауссовских представлений, с имитированными артефактами, характерными для монокулярной реконструкции. На этапе тестирования мы извлекаем генерации модели, включая вновь наблюдаемые области и движения, обратно в единое согласованное, высококачественное динамическое 3D гауссовское представление, что улучшает как синтез новых видов, так и основное 3D движение. Наш метод устанавливает новый эталон в 4D реконструкции и беспесдно обобщается на видео с больших изменений ракурсов и динамическими движениями.
Краткое резюме
Исследование представляет новый метод генерации динамических 3D гауссовских представлений из монокулярных видеороликов, который улучшает качество реконструкции и позволяет лучше обрабатывать изменения в сценах. Новый подход обеспечивает высокое качество рендеринга и корректирует недостатки, возникающие при монокулярной реконструкции.
Практический вывод
Метод позволяет значительно улучшить реконструкцию динамических сцен из одиночных видеопотоков, открывая новые возможности для применения в области компьютерной графики и визуализации.
Ограничения
Это предварительная публикация, она не прошла научное рецензирование. Метод требует большого объема выровненных данных для обучения и может быть ограничен в обработке сложных сцен с сильно изменяющимися перспективами и произвольными движениями объектов.
Формирование случаев (ФС) является ключевым навыком для терапевтов; однако создание качественных ФС требует значительного времени. Данное исследование направлено на демонстрацию того, что использование графа знаний на основе мета-аналитической литературы может повысить качество ФС. Были сформированы пять групп, включая 4 группы больших языковых моделей и 1 группу профессионалов, каждая из которых создала 25 ФС на основе 25 ситуаций. Контрольная группа с Claude (Sonnet 3.7; Anthropic) создала 25 ФС. Группа персонализации служила контрольной группой с дополнительными подсказками о персонализации. Группа графа знаний использовала большую языковую модель, которая сгенерировала 25 ФС, предоставленную с графом знаний по мета-анализу. Далее дополнительная персонализация составила группу графа знаний с персонализацией. Наконец, экспертная группа состояла из 25 ФС, созданных человеком-экспертом. Эти 125 ФС в общей сложности были оценены на общую качество (т.е. правильность, полнота, осуществимость и согласованность) с использованием 7-балльной шкалы и 18 основных элементов с бинарными оценками (0 или 1) другим экспертом. ФС также были качественно проанализированы. Группы графа знаний и графа знаний с персонализацией набрали значительно более высокие баллы, чем контрольная группа по таким показателям, как правильность, полнота и осуществимость. Экспертная группа значительно лучше набрала баллы за согласованность, чем группы сгенерированные машинами. Кроме того, не было значительных различий в оценках осуществимости среди групп графов знаний, графов знаний с персонализацией и экспертной группы. Качественная оценка показала, что ФС, созданные человеком, сужают текст до содержания, легко воспринимаемого клиентом, в то время как ФС, созданные машинами, более склонны включать выражения, которые неестественны для клиента. Эти результаты указывают на то, что предоставление графов знаний начинающим терапевтам увеличивает правильность, полноту и осуществимость ФС. Предоставление опытным терапевтам графов знаний также рекомендуется для улучшения качества их ФС и услуг в области психического здоровья.
Модели скрытого мира позволяют планировать на основе многомерных наблюдений, предсказывая будущие состояния в компактном скрытом пространстве. Однако, как правило, эти модели остаются неизменными во время тестирования: когда их предсказания становятся неточными, планирование может потерпеть неудачу, особенно при изменении распределения в процессе тестирования. Для решения этой проблемы мы предлагаем AdaJEPA, адаптивную модель скрытого мира, которая осуществляет адаптацию во время тестирования в рамках замкнутого цикла управления, основанного на предсказаниях модели (MPC). После обучения AdaJEPA планирует и выполняет первую часть действий, использует наблюдаемое изменение состояния как сигнал для саморегулируемой адаптации и пересматривает план с обновленной моделью. Это обновление в замкнутом цикле постоянно перекалибрует модель мира без дополнительных демонстраций экспертов. В различных задачах достижения целей AdaJEPA значительно улучшает успех планирования, требуя всего одну итерацию градиентного шага на этапе пересмотра плана MPC.
Мы анализируем влияние оптимизации начальной популяции генетического программирования (ГП) для символьной регрессии (СР) на точность и сложность решений. Мы сравниваем три хорошо известные методы случайной инициализации, а также инициализацию с небольшими оптимизированными решениями из исчерпывающей символьной регрессии (ИСР), используя реализацию ГП/СР, основанную на многокритериальном эволюционном алгоритме NSGA-II. Мы сравниваем конечные парето-фронты, найденные с помощью каждого метода инициализации, на двенадцати синтетических задачах различной сложности и одной реальной выборке. Мы не обнаружили значительных различий в точности или сложности моделей среди методов инициализации. Начальное преимущество инициализации с использованием ИСР исчезает всего через несколько поколений. Наши результаты показывают, что при сходной диверсификации в начальной популяции влияние метода инициализации в символьной регрессии на основе ГП на конечный парето-фронт представляет собой незначительный фактор.
В автономных лабораториях агенты ИИ предлагают следующий пакет экспериментов. Однако планирование и выполнение этих задач с полным использованием доступных ресурсов - это совершенно другой вопрос. Это может быть сложно при работе с ограничениями реального оборудования, особенно когда имеется несколько инструментов с разной пропускной способностью и мощностью. В данной работе мы демонстрируем метод из двух этапов для решения задачи использования ресурсов нашей автономной платформы для синтеза металлоорганических каркасов. Сначала мы используем ограниченное программирование для нахождения оптимальных расписаний, которые минимизируют общее время, при этом удовлетворяя ограничениям и мощностям оборудования. Во-вторых, мы используем систему зависимостей статусов для каждой задачи, что позволяет надежно выполнять оптимальные расписания.
Миелоидные клетки, включая макрофаги, моноциты, нейтрофилы и дендритные клетки, являются метаболически пластичными стражами, формирующими микроокружение опухоли. Среди множества метаболитов в раке лактат и никотинамид аденин динуклеотид (NAD⁺) выделяются как центральные координаторы судьбы миелоидных клеток. Накопление лактата, вызванное гликолизом опухоли, глубоко перепрограммирует метаболизм миелоидных клеток через рецептор-опосредованное сигнализирование, транспорт мономолекул и лактилирование гистонов, устанавливая иммуносупрессивные и пронкологические фенотипы. Параллельно, путь утилизации NAD⁺, зависимый от никотинамидфосфорибозилтрансферазы (NAMPT), поддерживает редокс-гомеостаз и эпигенетическую регуляцию в миелоидных клетках, контролируя деацетилирование, опосредованное сиртуинами, и перестройку транскрипции. Появляющиеся доказательства предполагают наличие обратной связи между лактатом и NAMPT, сочетающей доступность экстрацеллюлярного лактата с внутриклеточным оборотом NAD⁺ для поддержания иммунорегуляторных состояний в опухолях. В этом обзоре мы интегрируем современные знания о метаболизме лактата и сигнальном пути NAMPT в миелоидных клетках, ассоциированных с опухолями, подчеркивая их конвергенцию на метаболических и эпигенетических контрольных точках. Мы также обсуждаем, как искусственный интеллект (ИИ) — через интеграцию многослойного анализа на уровне одиночных клеток, пространственные метаболомные выводы и моделирование на основе графов — может расшифровать сложные иммунометааболические сети и ускорить открытие лекарств, направленных на эти пути. Наконец, мы очерчиваем терапевтические стратегии, комбинирующие агентов, нацеленных на лактат, ингибиторы NAMPT и иммунотерапию, акцентируя внимание на перспективах прецизионной иммунообменной терапии, ориентированной на ИИ. Понимание и моделирование оси лактат-NAMPT может открыть новые пути перепрограммирования миелоидного иммунитета и преодоления устойчивости к лечению рака.
Живые организмы полагаются на молекулярные сети, такие как генетические цепи и сигнальные пути, для обработки информации и надежного принятия решений в переполненных и шумных средах. Последние достижения показывают, что взаимодействующие биомолекулы самоорганизуются посредством фазовых переходов в сосуществующие пространственные компартменты, называемые конденсатами, зачастую на клеточных поверхностях, таких как хроматин и мембраны. В данной работе мы демонстрируем, что многокомпонентные жидкости могут быть спроектированы для рекрутинга различных конденсатов на поверхности с различными составами, выполняя форму классификации поверхности посредством конденсации. Мы проводим аналогию с многомерной классификацией в машинном обучении и исследуем, как скрытые виды, аналогичные скрытым узлам, расширяют выразительность и емкость этих взаимодействующих ансамблей для облегчения сложных границ решений. Простое изменение уровней отдельных видов позволяет повторно запрограммировать тот же молекулярный репертуар для решения новых задач. Наши выводы показывают, что физические процессы, лежащие в основе биомолекулярных конденсатов, могут кодировать и управлять адаптивной обработкой информации, выходя за рамки компартментализации.