En la estimación de los valores del suelo es frecuente utilizar un conjunto de variables independientes con potencial de explicar el mercado inmobiliario.
Este tipo de variables suelen ser distancias calculadas a localizaciones relevantes de la ciudad, como el centro o zonas comerciales que también emergen fuera de la zona central, conocidas como “nuevas centralidades”. Del mismo modo, distancias a lugares en donde se presume, se ejerce una influencia negativa sobre el valor de la tierra, como la proximidad a basurales o plantas de alcantarillado. También es frecuente la utilización de variables que intentan capturar la característica del entorno, en un determinado radio o distancia, como la densidad constructiva desarrollada o la oferta de suelo vacante.
Mediante la utilización de esta información es relativamente simple elaborar modelos con potencial explicativo del valor del suelo, conocidos como de precios hedónicos, cuyo principal atractivo es el de “descomponer” el valor del suelo en la influencia independiente de cada una de las variables utilizadas. Por otro lado, si lo que interesa es resolver la estimación del valor del suelo en zonas donde no existen observaciones, cobran relevancia las técnicas algorítmicas conocidas como “machine learning”, que muestran un potencial predictivo mucho más fuerte que los modelos lineales de precios hedónicos.
Lamentablemente, el desarrollo de los datos mencionada es costoso y requiere de un estudio previo de la ciudad que excede a la ya titánica tarea de recolectar muestras de mercado. Sin embargo, es mucho lo que se puede hacer con sólo dos datos: localización de la muestra y valor del suelo ($/m²) en dicha localización.
Aplicación de caso a partir de los datos disponibles en el Mapa de Valores de Suelo de América Latina
Mediante la utilización de los datos abiertos disponibles en la plataforma (accesibles en https://valorsueloamericalatina.org/el-mapa) se procedió a la estimación de los valores de suelo en la ciudad de Curitiba, Brasil, donde existen 364 datos georreferenciados de 2016.
Se aplicaron dos métodos de naturaleza totalmente diferente. En primer lugar, se interpoló el valor del suelo mediante la técnica geoestadística conocida como Kriging Ordinario, que parte del principio de auto-correlación espacial.
En segundo lugar, se aplicó una técnica algorítmica conocida como “K-Vecinos más cercanos”, donde las únicas variables independientes utilizadas fueron la latitud y longitud (ubicación) de cada observación, y se pondera la influencia mutua entre observaciones próximas en una determinada distancia (euclidiana).
La calidad de las estimaciones se evaluó mediante un proceso de validación cruzada conocido como “leave one out”, que consiste en quitar aleatoriamente un dato de la muestra, construir los modelos de estimación con los datos restantes y posteriormente, estimar el dato extraído. Luego, se incluye el dato extraído nuevamente en la muestra y se procede a quitar un dato diferente, para estimar nuevamente los modelos y predecir el valor de este nuevo dato. El proceso se repite hasta que todos los datos de la muestra han salido del modelado una vez. El objetivo de esta validación es aproximar la capacidad de predicción del modelo con datos no contemplados en la muestra, con el fin de conocer qué puede suceder en lugares que no han sido muestreados, por no existir ofertas de mercado al momento del relevamiento en dichas localizaciones. Para cada dato se registra la diferencia entre el valor real de mercado y el valor predicho por los modelos, y se toma la mediana de esta distribución como un indicador de la capacidad predictiva del modelo.
De esta manera se observa que el error mediano del modelo Kriging Ordinario es de +/- 22%, en tanto que el error mediando del modelo K-vecinos más cercanos es +/- 25%.
Modelo | Mediana del error en valor absoluto |
Kriging Ordinario | 0.2201524 |
K-vecinos más cercanos | 0.2524515 |
Como puede apreciarse, sólo con muestras georreferenciadas de mercado y su valor de suelo ($/m²) pueden diseñar modelos predictivos con una calidad aceptable.
Te invitamos a ver los resultados de la elaboración en el siguiente link
Los datos utilizados fueron aportados por Leonardo Afonso Brusamolín, durante la Edición 2016. [Conocer más…]
El Equipo del Mapa de Valores del Suelo Latam
valoresinmobiliariosal@gmail.com