R la letra que le falta al GIS… y a la IDE?

Ya sea para gestión de políticas públicas, promover el desarrollo de un negocio o llevar adelante una investigación, las IDE proveen a los usuarios grandes volúmenes de datos. ¿Cómo aprovechar tantos recursos, de diversas temáticas y obtener nueva información especializada? La “ciencia de datos” también emerge en el sector de las geociencias y la geoinformación.

¿Con qué herramientas aplicar “inteligencia artificial” al procesar la “big data” que ofrecen las IDE? ¿Cómo ejecutar algoritmos de “machine learning” con datos geográficos, usando una amplia y flexible variedad de alternativas?

Ejemplo de aplicación de algoritmo de Inteligencia Artificial en base a datos de la IDE (ver nota publicada previamente)

R una herramienta +
R no es sólo una letra del abecedario. Es además un lenguaje de programación creado en 1995 por Ross Ihaka y Robert Gentleman. En sus principios, enfocado principalmente en el análisis estadístico, R proporcionaba una amplia variedad de técnicas, como modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series de tiempo, clasificación, técnicas gráficas, entre otros; al día de hoy es altamente extensible.

R está disponible como software libre según los términos de la Licencia Pública General GNU de Free Software Fundación, en forma de código fuente. Además, se ejecuta en una amplia variedad de sistemas operativos como Linux, Windows e iOS.
Desde el punto de vista gráfico, su interfaz resulta no muy atractiva y fácil para trabajar; para sortear este inconveniente se utilizan entornos de desarrollo integrado. Como principal referente de estos entornos figura Rstudio, que ofrece un interfaz más flexible, práctica para su uso y accesible para quienes se aventuran a sumergirse en el mundo de la programación.

Además cuenta con un gran aporte comunitario por medio de foros y consultas en páginas como Stack Overflow o espacios colaborativos para desarrollar proyectos GitHub. El crecimiento de R como lenguaje de programación se puede apreciar por el sostenido crecimiento en las consultas realizadas en Stack Overflow, aunque este crecimiento exponencial también puede estar mostrando una dificultad en su aprendizaje. Sea cual fuere la razón, junto con Python son los lenguajes que están siendo más utilizados y en crecimiento.

Cantidad de consultas en Stack Overflow por año

Según “Dice Salary Survey”, que año a año realiza reportes sobre los niveles salariales en EEUU en función de factores como la ubicación, el tipo de trabajo, el objetivo del empleo o los requerimientos técnicos, entre otros, el manejo de un lenguaje de programación es un atributo buscado en el mercado laboral. Concretamente, aquellas personas que durante el año anterior se desempeñaron utilizando R, recibieron un salario promedio de USD 106.000, posicionándose por encima de quienes utilizaron otros conocidos lenguajes de programación como Python o JavaScript. Tentador, ¿verdad?

Lenguajes de programación mejor pagados en 2018

R y procesamiento geográfico
La mayoría de los usuarios que utilizan R probablemente proceden del mundo de la estadística, pero lentamente otros profesionales empiezan a entender cuáles son las ventajas de R para la comprensión y manejo de grandes volúmenes de datos, entre ellos los espaciales. Durante los últimos años, se observa un fuerte fenómeno de crecimiento en la relación entre R y los SIG (Sistemas de Información Geográfica) para procesar grandes volúmenes de datos geográficos, como aquellos disponibles en las IDE (Infraestructuras de Datos Espaciales).

Algunas librerías que permiten el análisis de datos espaciales son: SF, Raster, Mapview, Spdep y Rdgal. Es posible trabajar con diversos formatos específicos, como archivos ESRI Shape, raster (TIFF, ECW), geopackage, GeoJSON, entro otros. Para visualización y análisis interactivo de resultados, destaca la librería Mapview con base en Leaflet, bajo diferentes capas de datos o web map services (WMS).

Pantallas de R, integrando visualización geográfica y análisis de datos geográficos

Así mismo, pueden manipularse diferentes tipos de geometrías, ya sean polígonos, puntos, líneas, multipoligonos, etc. Y trabajar con funciones propias de programas como QGIS o ArcGIS, para crear uniones espaciales, calcular centroides, distancias, generar buffers y un sinfín de funciones espaciales con mucha facilidad y mejores rendimientos computacionales que en los tradicionales paquetes de software SIG.
Resulta indispensable, para un profesional que trabaje con SIG y datos geográficos, adquirir habilidades en la manipulación estadística de datos espaciales…… ¿Será R tu próxima herramienta a incorporar?


Contribución:
Micael Salomón, Licenciado en Economía, U.N.C.
Juan Pablo Carranza, Mgter. en Admin. Pública y Lic. en Economía, U.N.C.
Estudio Territorial Inmobiliario, Ministerio de Finanzas

Categorías: Novedades
Etiquetas: Geo Data Science