Искусственный интеллект30.06.2026arXivScience Morning3 мин чтенияpreprint

FLORA: Подход глубокого обучения для предсказания лесных показателей на основе гетерогенных данных LiDAR

FLORA: A deep learning approach to predict forest attributes from heterogeneous LiDAR data

Карточка статьи

Рубрика: Искусственный интеллект
Источник: arXiv
Дата: 30.06.2026
Автор: Science Morning
Время чтения: 3 мин

Это предварительная публикация, она не прошла научное рецензирование.

Аннотация

Лесные характеристики имеют ключевое значение для мониторинга ресурсов на национальном уровне. Метрики воздушного LiDAR являются одними из дополнительных переменных, наиболее сильно коррелирующих с лесными характеристиками, используемыми для оценки в Национальном лесном инвентаре (NFI). Однако создание предсказаний на всей территории остается сложной задачей, когда данные LiDAR собираются в гетерогенных условиях. С расширением национальных программ LiDAR в Европе изменчивость датчиков, параметров полета, сезонов и углов сканирования ограничивает надежность существующих моделей, которые часто откалиброваны для местных условий. Мы представляем FLORA (Регрессия лесного LiDAR на основе октодерева с использованием вспомогательных данных), фреймворк глубокого обучения, который предсказывает шесть лесных показателей: доминирующую высоту, общий объем, объем лиственных древесных пород, объем хвойных древесных пород, базальную площадь и плотность стволов на основе гетерогенных точечных облаков LiDAR. FLORA объединяет основу на основе октодерева с экологическими и спатиально-временными вспомогательными переменными с помощью механизма поздней фузии. Модели обучаются и оцениваются на 32,052 участках Национального лесного инвентаря по материковой Франции с использованием данных из программы LiDAR HD во Франции. Одна модель, обученная как на лиственном, так и на безлистном захвате, превосходит модели, специфичные для сезона, и улучшает надежность по сезонам. Вспомогательные переменные обеспечивают скромные общие приросты, но в большей степени способствуют предсказанию объема по видам. FLORA достигает значения rRMSE около 12,3% (R2 = 0,88) для доминирующей высоты и 39% (R2 = 0,74) для общего объема, предоставляя надежную основу для оценки лесных характеристик в крупных масштабах на основе гетерогенных национальных программ LiDAR.

Краткое резюме

Исследование представляет FLORA — фреймворк глубокого обучения для предсказания лесных характеристик из данных LiDAR в сложных условиях. Модель показывает высокую точность при оценке объема и высоты леса, что может улучшить национальное лесное управление.

Практический вывод

FLORA может быть использована для более точного мониторинга лесных ресурсов, что поможет в управлении и сохранении лесов на национальном уровне.

Ограничения

Это предварительная публикация, она не прошла научное рецензирование. Модель может быть менее эффективной в условиях, отличающихся от использованных для обучения данных, и требует дополнительной адаптации для применения в других регионах.

Дальше по теме

Похожие исследования

Подборка учитывает рубрику, ключевые слова, аннотацию, резюме, практические выводы и источник.

Искусственный интеллект1 июля 2026 г.

100%

Имитационное обучение с критикой языка на основе субоптимальных демонстраций

Предыдущие работы по имитационному обучению на основе субоптимальных демонстраций обычно полагаются на сжатые сигналы супервизии, такие как оценки уверенности, баллы дискриминатора или веса важности. Эти скалярные сигналы имеют свои ограничения, так как не могут явно выразить промежуточные размышления о ходе выполнения задачи, режимах неудачи или корректирующих действиях. Мы предлагаем рамки имитационного обучения с критическим анализом языка, которое вместо этого использует естественный язык в качестве структурированного сигнала супервизии, избегая сворачивания выразительной обратной связи в скаляры. Наш метод сначала создает языковые метки на основе демонстраций, которые явно описывают текущий прогресс, идентифицируют субоптимальное поведение и предоставляют детализированные корректирующие рекомендации. Затем мы вводим функцию потерь критики языка, которая непосредственно обучает политики, используя эти структурированные сигналы, не сводя их к скалярам, и инстанцируем ее для как имитационного клонирования поведения, так и диффузионных политик, получая LC-BC и LC-DP. Мы также предоставляем теоретический результат, показывающий, что предложенная цель обеспечивает верхнюю границу разрыва производительности эксперта при стандартных предположениях. Эмпирически мы проводим оценку на различных задачах непрерывного управления, охватывающих навигацию, манипуляцию и игровую деятельность, где наши методы последовательно превосходят сильные базы имитационного обучения и оффлайн обучения с подкреплением. Эти результаты демонстрируют, что язык может служить мощной и структурированной формой супервизии для обучения устойчивым политикам на основе субоптимальных данных.

arXivЧитать

Искусственный интеллект1 июля 2026 г.

100%

Гипотеза разделения предсказания состояния

Трансформеры используют один и тот же поток вычислений для предсказания следующего токена и хранения полезного состояния для будущих предсказаний токенов. Мы формулируем гипотезу о разделении предсказания состояния: разделение этих двух ролей обеспечивает лучшую производительность языкового моделирования. Мы разрабатываем вариант трансформера, который использует два вычислительных потока для разделения этих функций, и проводим эксперименты по предварительному обучению на данных различного масштаба. Наши эксперименты показывают, что разделение предсказания состояния последовательно предлагает лучшую эффективность данных и вычислений, улучшая показатель валидации и превосходя стандартные трансформеры в среднем на 2-3 процентных пункта по downstream задачам. Мы также проводим обширный эмпирический анализ, который исключает потенциальные конфаундеры и демонстрирует принципиальное различие в градиентах, которое влечет наш дизайн.

arXivЧитать

Искусственный интеллект30 июня 2026 г.

100%

Обучение предпочтениям в произвольной форме для робототехнической манипуляции

Дизайн вознаграждений остается центральным узким местом для улучшения политики автономных роботов, особенно в задачах манипуляции с длительным горизонтом, где разрозненные метки успеха предоставляют слишком слабый сигнал, а бинарные предпочтения сводят множество конкурирующих представлений о качестве в один неоднозначный сигнал. Мы представляем Метод Обучения Предпочтениям в Произвольной Форме (FPL), который позволяет обучать роботам на основе произвольных человеческих предпочтений. Вместо того чтобы спрашивать аннотаторов, какая из двух траекторий лучше в целом, FPL позволяет им определять оси предпочтений на естественном языке, такие как скорость, безопасность, качество размещения или аккуратность, и предоставлять парные предпочтения вдоль каждой оси. Эти аннотации используются для обучения модели вознаграждения, обусловленной языком, которая преобразует траекторию и метку предпочтения в вознаграждение, специфичное для оси. Мы используем эту модель для обучения политики, обусловленной вознаграждением, которая оптимизирует по нескольким заданным человеком измерениям. В четырех реальных задачах манипуляции и двух смоделированных задачах с длительным горизонтом FPL превосходит методы с разрозненным вознаграждением и бинарными предпочтениями на 38 процентных пунктов. Помимо улучшенной производительности, FPL обучает плотные сигналы прогресса без явной сегментации подтасков, демонстрирует композиционность поведения, отсутствующую в данных, и позволяет пользователям направлять политику к различным видам поведения на этапе тестирования без повторного обучения. Запись в блоге с видео доступна по адресу https://freeform-pl.github.io/fpl.website/

arXivЧитать

Искусственный интеллект30 июня 2026 г.

100%

Переосмысленный самообучение: скрытая хрупкость обучения на основе самосгенерированных QA

Языковые модели все чаще обучаются с использованием синтетической супервизии вопросов и ответов (QA): модель генерирует вопросы о документе, отвечает на них, используя тот же текст, и полученные пары используются для дообучения, дистилляции или сжатия знаний в другую модель. Мы показываем, что этот этап генерации не является нейтральной предобработкой. Это неявная политика, которая как выбирает, какие доказательства становятся обучающим сигналом, так и решает, как это доказательство будет отвечено, и она хрупка на обоих этапах. При выборе, что спросить, генераторы не обходят документ равномерно. Покрытие быстро достигает насыщения и концентрируется на заметных отрезках, разнообразные подсказки сливаются в одни и те же области, а то, что выглядит достойным вопроса, определяется локальным представлением. В результате заметные артефакты, такие как плохо очищенные разметки, могут захватить генерацию вопросов среди семейств и масштабов моделей. При ответах модель, генерирующая супервизию, склонна подчиняться инструкциям, внедренным в текст. Эта приверженность зависит от намерения и поверхностной формы отрывка, а не от его строгости, и ухудшается при конфликте задач, где более крупные модели подчиняются чаще. Эти режимы сбоев возникают из-за выборов, сделанных во время генерации QA, поэтому их можно сократить, не меняя цикл обучения. Привязка каждого вопроса к фиксированной цели уменьшает предвзятую селекцию, а фильтрация отрывков, похожих на инструкции, перед ответом снижает среднюю степень соблюдения инъекций с $88\%$ до $13\%$ в нашей оценке, сохраняя при этом почти весь чистый текст.

arXivЧитать

Искусственный интеллект2 июля 2026 г.

95%

Алгоритмы машинного обучения для определения пола по измерениям черепа и таза, полученным с помощью 3D-компьютерной томографии.

Определение пола по останкам скелета является ключевым элементом судебной антропологии, при этом череп и таз являются наиболее различимыми по полу элементами с точки зрения морфологии. Традиционные морфометрические подходы, такие как дискриминантный анализ и логистическая регрессия, достигли высокой точности в оценке пола среди различных популяций, включая южноафриканцев. Однако использование машинного обучения (МЛ) для определения пола на основе измерений черепа и таза еще не было исследовано ни в одной южноафриканской популяции. Это исследование оценивало потенциал алгоритмов МЛ для определения пола по черепным и тазовым измерениям, полученным с помощью компьютерной томографии (КТ) современных чернокожих южноафриканцев. В выборку вошли 680 элементов скелета (400 черепов и 280 тазовых костей) с равным распределением мужчин и женщин. КТ-сканы, архивируемые в Отделе радиологии Академической больницы Шарлотты Макеке в Йоханнесбурге, были реконструированы в 3D-модели с помощью программного обеспечения Xiris и IntelliSpace, откуда были собраны восемь черепных и одиннадцать тазовых измерений. Применялись семь классических алгоритмов МЛ, и использовались методы ранжирования признаков для определения наиболее информативных переменных для оценки пола. Затем была разработана модель стекового обучения МЛ, в которую были включены три лучших классификатора в качестве базовых моделей. Их выводы были объединены и переданы различным алгоритмам МЛ, которые выступали в роли мета-обучающих для финальной классификации. Результаты подтвердили сильный половой диморфизм в черепных и тазовых костях, а стековые модели достигли высокой точности (череп: 80,3-94,3%; таз: 86,1-96,1%) по сравнению с традиционными многовариантными методами, демонстрируя потенциал МЛ в судебном определении пола.

PubMedЧитать

Искусственный интеллект1 июля 2026 г.

92%

Квантовое и кластическое машинное обучение: унифицированное эмпирическое сравнение

Квантовые вычисления стали многообещающей вычислительной парадигмой для машинного обучения (МЛ), с потенциалом предложить вычислительные преимущества по сравнению с классическими подходами. На данный момент доказательства, подтверждающие эффективность и преимущества квантовых моделей машинного обучения (QML) по отношению к классическим моделям, недостаточны. Чтобы заполнить этот пробел, в данной работе представлено эмпирическое исследование производительности моделей QML и их классических аналогов. Мы сравниваем семь пар моделей, охватывающих контролируемое обучение и обучение с подкреплением. Наши результаты показывают, что оцениваемые модели квантового машинного обучения пока не превосходят классические эталоны по общей точности прогнозирования, стабильности политики или времени обучения. Тем не менее, QML остается многообещающим подходом для фильтрации шума и контроля ложноположительных срабатываний. Результаты нашего исследования подводят итоги проблемам, с которыми сталкивается квантовое машинное обучение в различных аппаратных средах, эффективности обучения и стабильности сходимости, создавая основу для исследований по устойчивости и оптимизации параметров QML. Эта работа доступна по адресу https://github.com/Z-537-437/QML.

arXivЧитать