Como mapas ajudam a IA a segmentar parques e bairros
Автор: IA Papers
Загружено: 2026-01-16
Просмотров: 94
Описание:
Título original:
Urban Socio-Semantic Segmentation with Vision-Language Reasoning
Resumo:
Este documento detalha o desenvolvimento e a validação do SocioSeg, um novo benchmark para segmentação socio-semântica urbana, e do SocioReasoner, um framework de raciocínio de visão e linguagem (VLM) projetado para identificar entidades urbanas definidas por atributos sociais. Enquanto modelos tradicionais segmentam com precisão entidades físicas (edifícios, estradas), eles falham em categorias sociais (escolas, parques) cujas fronteiras são moldadas por semântica, não apenas por aparência visual. O SocioSeg inova ao unificar imagens de satélite com camadas de mapas digitais, transformando dados geoespaciais heterogêneos em uma tarefa de raciocínio visual. O framework SocioReasoner emprega uma estratégia de duas etapas — localização e refinamento — otimizada por aprendizado por reforço (GRPO), superando os modelos de estado da arte e demonstrando forte generalização zero-shot em cenários globais.
Link do paper:
https://huggingface.co/papers/2601.10477
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: