Visualización de datos: dos técnicas clásicas que aplicamos en IDECOR

Colaboración:
Ing. Civil Elena Toccacieli,
Arq. Sergio Sosa Quilaleo,
IDECOR


‘Hacer que los datos hablen’. Seguramente has oído esa expresión para hacer referencia a la representación de datos a través de gráficos, esquemas, imágenes, mapas y otros recursos con el objetivo de facilitar la comprensión e interpretación de aquello se que desea mostrar.

En IDECOR trabajamos para representar datos georreferenciados a través de mapas que reflejan información sobre una amplia variedad de actividades en la provincia de Córdoba. Hoy te contamos acerca de dos técnicas útiles a la hora de crear mapas temáticos, analizar la distribución de variables cuantitativas y su método de aplicación.

¡Comenzamos!

Paso 1: Describir la variable a graficar. En este ejemplo, utilizaremos la variable Valor Unitario de la tierra urbana de Córdoba (VUT) 2023, por parcela, presenta las siguientes estadísticas descriptivas:  

Número parcelasPromedio vut $/m²Mediana vut $/m²Desv. estándarMin  $/m²Max  $/m²
361.84281.66642.500177.1881.6002.670.000

Este resumen estadístico indica que los valores unitarios de la tierra en pesos por metro cuadrado tienen una amplia variabilidad. El promedio es de $81.666/m², pero la mediana, que representa el valor central, es considerablemente más baja en $42.500/m².

El análisis sugiere una distribución sesgada hacia la derecha (positivamente asimétrica), con algunos valores extremadamente altos (atípicos) que afectan la media. La desviación estándar de 177.188 refleja la alta dispersión de los datos, y los valores mínimo y máximo indican la amplitud de los valores en la muestra; estos parámetros nos ayudarán a determinar qué técnica nos permite visualizar aquello que necesite representarse.

Paso. 2 Elegir el número de clases. En este ocasión se proponen 10 clases, útiles para presentar la amplia variedad de niveles de valor en diferentes áreas de la ciudad.

Paso. 3 Seleccionar el método de clasificación. El método de clasificación debe proporcionar una comprensión más detallada de la variabilidad en los valores y su distribución en el espacio urbano, en esta ocasión presentamos 2 métodos: la visualización por cuantiles y la visualización con rupturas naturales Jenks.

I. Visualización de mapas por cuantiles

Los cuantiles (Kendall, 1940) son puntos que dividen la función de distribución de la variable en intervalos regulares, cada uno de los cuales contiene el mismo número de entidades. Los intervalos más conocidos son los cuartiles, que dividen a la distribución en cuatro partes; los quintiles, que lo hacen en cinco partes; los deciles, en diez partes; y los percentiles, que la subdividen en cien partes. 

En el siguiente mapa (Imagen 1), se visualiza la clasificación por deciles del vut 2023 por parcela. 

Imagen 1. Valor unitario de suelo urbano 2023 ($/m²), localidad de Córdoba, clasificación por deciles.

Con la clasificación por deciles es posible detectar eventuales disparidades espaciales en el territorio. En este caso, se observa que el 10% (D1) de las parcelas con valores de vut más bajos de la ciudad se sitúa entre $1.600 y $7.800/m², y se ubica en general en las zonas periféricas de la mancha urbana (color amarillo claro). En el extremo opuesto, el 10% (D9) de parcelas de valores mayores, con un vut de $160.000/m² o superior, se ubican en la zona del centro, el eje Noroeste, y la zona sur, dentro del anillo de Circunvalación. 

El vut mediano de la ciudad se ubica en los $42.500/m², y se corresponde con el decil cinco (D5).

Este método de clasificación es sensible a la presencia de valores atípicos, la consistencia interna de la información agrupada es baja, ya que en una misma clase pueden quedar incluidos datos muy dispersos (Decil 9 comprende valores desde 160.000 hasta 2.670.000 $/m²).

II. Visualización de mapas con las rupturas naturales Jenks

A diferencia de los deciles, las rupturas naturales Jenks (Jenks, G.C, 1960) son puntos de corte que minimizan la varianza dentro de cada clase y maximizan la varianza entre las clases, lo que hace que los grupos de intervalos resultantes sean estadísticamente distintos, internamente coherentes y significativos

Esto hace que la utilización de esta técnica sea de importancia a la hora de identificar patrones espaciales en los datos con distribuciones irregulares y sesgadas.

En el siguiente mapa (Imagen 2), se visualiza la clasificación por cortes naturales Jenks (10 clases) del vut 2023 por parcela. 

Imagen 2. Valor unitario de suelo urbano 2023 ($/m²), localidad de Córdoba, clasificación por ruptura naturales jenks,10 clases.

En este ejemplo, las parcelas con valores más altos se agrupan en un intervalo desde $2.060.000/m² hasta $2.670.000/m², (0,03% del total de parcelas ) y están distribuidas en la zona de Plaza España.

Los valores altos (atípicos) siguen concentrándose en las zonas centrales de la ciudad, en la primera parte de los corredores hacia el norte, con valores entre $1.000.000 y $2.060.000, (0,89% del total de parcelas).

Finalmente, se puede identificar que un 85% de parcelas tiene un valor inferior a $120.000/m² concentrado desde las zonas aledañas al centro hasta la periferia urbana (sectores en naranja y amarillo).

Mapeo por deciles vs cortes naturales de Jenks 

Comparativamente, los mapas presentan resultados muy diferentes entre sí, producto de la elección del modelo de clasificación. Se pueden observar diferencias en los valores de corte de cada intervalo y la cantidad de parcelas correspondientes a cada corte, de modo que cada técnica proporciona un enfoque diferente para analizar y comprender la distribución de los valores en un conjunto de datos.

A partir de estos resultados, es posible inferir algunas conclusiones al utilizar uno u otro método de clasificación, y extraer algunos criterios para elegir el más adecuado para cada caso. 

En la clasificación por deciles, al asignar el mismo número de parcelas a cada clase, no aparecen clases vacías, ni clases con demasiados valores ni con pocos valores. 

En el mapa de la Imagen 1, por ejemplo, a cada clase de valor le corresponden aproximadamente 30.000 parcelas. Este aspecto hace que parcelas con valor similar se pueden situar en clases distintas, o parcelas con valores muy diferentes se pueden poner en la misma clase, como el decil 9 (D9), que presenta valores qué varían entre $160.000 y $2.670.000/m². Al utilizar esta clasificación por informaciones con alta variabilidad de valores, es importante tener en cuenta este aspecto.

Este enfoque basado en deciles resulta apropiado cuando la necesidad es segmentar el conjunto de datos en fracciones iguales de la muestra, facilitando la comparación relativa y la simplificación de análisis y visualización de resultados, pero puede no reflejar adecuadamente la naturaleza de la distribución cuando ésta es significativamente asimétrica.

En tanto, con las rupturas naturales de Jenks las parcelas se agrupan en clases qué maximizan las regularidades internas de los valores, arrojando cantidades variables de objetos agrupados por cada intervalo. Es una metodología de clasificación específica que puede resultar inadecuada para estudios comparativos de variables.  

En el caso de los valores analizados anteriormente, la clasificación por rupturas naturales Jenks proporciona información más detallada sobre la distribución de valores unitarios de la tierra, lo que puede ser útil para la planificación urbana y la toma de decisiones. 

La elección entre estos métodos depende de los objetivos y de cómo se desee presentar y comunicar los resultados. En muchos casos, combinar ambos enfoques puede proporcionar una comprensión completa de la distribución de la variable analizada.

¿Cuál es tu experiencia con los métodos de clasificación? ¿Te parece que los mapas temáticos utilizando cortes naturales de Jenks son más fáciles de interpretar o preferís el mapeo por cuantiles? ¿En qué caso crees que no se debería utilizar un método o el otro? Si te interesa conocer más sobre las técnicas que aplicamos en IDECOR para desarrollar los diversos mapas, escribinos a [email protected]. Seguí informándote sobre las novedades de IDECOR a través de las redes sociales Instagram,  Linkedin, X y YouTube.