
Искусственный интеллектmedRxivEvidence 44 / Предварительная
Infoxmed2.0-27B: Тюнинг инструкций, согласование предпочтений и обучение модели награды на основе GRPO для медицинских LLM
Последняя публикация
Абстракт. Большие языковые модели (LLMs) продемонстрировали выдающиеся возможности в общих областях, однако их применение в специализированных медицинских контекстах требует строгой адаптации к предметной области. Мы представляем ...
