Vision Language Models

TopViewRS: Vision-Language Models as Top-View Spatial Reasoners

TopViewRS: Vision-Language Models as Top-View Spatial Reasoners.

Chengzu Li, Caiqi Zhang, Han Zhou, Nigel Collier, Anna Korhonen, Ivan Vulić