rOpenSci | Conociendo a las estrellas del universo R: comunidad R, intercambiar y aprender

Conociendo a las estrellas del universo R: comunidad R, intercambiar y aprender

Esta es la primera entrega de nuestra serie de entrevistas “Conociendo a las estrellas del universo R”. Tenemos como objetivo introducir los grupos de trabajo y las personas que están detrás del desarrollo del software y paquetes que muchos utilizamos y que se encuentran disponibles en R-Universe. Queremos resaltar y conocer diferentes proyectos alrededor del mundo, el trabajo que hacen, sus procesos y usuarios. Iniciamos nuestro recorrido en Argentina y con un equipo que utiliza R y desarrolla paquetes de R en el estado Argentino (no dejes de ver el vídeo con extractos de la entrevista).

🔗 La experiencia de trabajar con paquetes de R en el estado argentino

Hace dos años, Juan Pablo Ruiz Nicolini (también conocido como el Tucu) fue invitado a formar parte de la Dirección de Mercados y Estadística del Ministerio de Deporte y Turismo de la Nación, a cargo de Matías Lammens. Como parte de su trabajo, Juan Pablo dirige un equipo que gestiona un gran volumen de datos y con posibilidades de utilizar esos datos con múltiples objetivos. Por estas razones tienen a R y a la comunidad de R como un actor sumamente importante en su trabajo.

Foto de perfil de Juan Pablo Ruiz Nicolini.

Juan Pablo Ruiz Nicolini
Director Nacional de Mercados y Estadísticas
de la Subsecretaría de Desarrollo Estratégico del
Ministerio de Turismo y Deportes de la Nación.

El equipo de trabajo con el que cuentan es grande en comparación con otras reparticiones del Estado similares y con proyectos permanentes de gran envergadura como los que desarrollan en conjunto con el INDEC (Instituto Nacional de Estadísticas y Censos de la Argentina).

“Cuando empezamos, nuestro diagnóstico fue que había un montón de cosas buenísimas, un montón de datos, un montón de procesos (…) había mucho espacio para sacarle jugo a toda esa información que estaba viviendo adentro de las computadoras de los equipos que trabajaban en la dirección”, así explica Juan Pablo el desafío y la oportunidad que representaba sumarse a esa oficina. La idea además era poder compartir toda es información hacia afuera y con procesos accesibles para distintos públicos.

Desde un comienzo, el proceso incluyó varios pasos. Primero tomaron la decisión de que los paquetes de R y el software libre eran el camino. Después vino la etapa de la capacitación interna.

Foto de perfil de Pablo Tiscornia.

Pablo Tiscornia
Coordinador de procesos.
Ministerio de Turismo y Deportes de la Nación.
Dirección Nacional de Mercados y Estadísticas.

Pablo Tiscornia forma parte del equipo de el Tucu y explica que el punto de partida del trabajo, en una oficina que hasta hace poco tiempo combinaba procesos manuales y casi todo estaba en software propietario, fue la filosofía del software libre sumada a todo lo que comunidad de R venía ofreciendo en la región. Tanto Pablo como el Tucu se encontraron con un equipo de 17 personas aproximadamente que trabajaban de alguna manera con procesamiento de datos y que todos estaban muy involucrados con los procesos: “Primero, necesitábamos resolver una dinámica de trabajo interna (…) había mucho para hacer y hoy, creo que de esas 17 personas, 15, 14 todas saben abrir R, saben armar un Script y saben involucrarse en el proceso de trabajo que definimos desde que se tiene un dato hasta que se lo comunica al final.”

En esta etapa el objetivo estaba cumplido: que el equipo conozca la herramienta y conozca la dinámica de trabajo que habían definido como la más adecuada.

El segundo paso era “abrir el proceso” además de “mejorar el flujo de trabajo”. Pablo explica que también incorporaron la “dinámica de un estado abierto con una apertura de proceso, de no ocultar cómo hacemos las cosas”. Un concepto que incluye en un futuro también la posibilidad de recibir aportes de la comunidad y de poner a revisión sus propios códigos.

Como todos los procesos son complejos y en muchos casos con pasos en simultáneos y hasta “caóticos”, como lo relata el Tucu, donde distintas personas con conocimientos diversos hicieron sus aportes para poder diseñar los proyectos que hoy tienen en desarrollo.

El Tucu pone como ejemplo la reunión de los jueves donde muestran y comparten sus códigos para que otras personas puedan utilizarlos en otras partes del proceso: “Hacemos código en vivo donde planteamos dudas y hacemos ejercicios (…) tratamos de generar una dinámica en la cual vamos compartiendo de una manera hasta lúdica a veces, mostrando cada parte que van haciendo para ser compartida con los demás.”

🔗 Software libre y en nuestro idioma

Además de la gratuidad del software libre y de la importancia del manejo de los recursos para un estado, Pablo Tiscornia explica lo que aparece casi como una declaración de principios: “Es una filosofía de trabajo y de concepción sobre cómo desarrollamos y promovemos el conocimiento. Creo que somos gracias al software libre, lo que hoy podemos darle al estado; entonces sería casi un acto irresponsable no promover lo que a nosotros nos formó.” Juan Pablo refuerza la idea con su experiencia personal: “Yo era un tesista de maestría en ciencias políticas y hace siete años me obligué a hacer la tesis en R para aprender (…) y lo que rápidamente encontré, por suerte, fue la comunidad de R”.

y lo que rápidamente encontré, por suerte, fue la comunidad de R” Intercambiar con la comunidad y aprender de la comunidad parece ser el mantra principal de la comunidad R que tanto el Tucu como Pablo comparten con el equipo.

Además suman dos objetivos importantes para todo el proceso: allanar el lenguaje de programación R y transformarlo en accesible para todas las personas, incluso para quienes no vengan necesariamente de la programación, y “desarrollar los paquetes lo más en castellano posible que se pueda”. El objetivo era el mismo, reducir las barreras para el equipo: no tener que pensar si el equipo sabe o no inglés o si el idioma se transforma en una barrera para realizar el trabajo.

🔗 Un trabajo para la comunidad

Los públicos que reciben el trabajo que se desarrolla en el área de turismo son múltiples.

Pagina de inicio del sistema SINTA con accesos a sus conjuntos de datos abiertos

Hoy cuentan con un sitio llamado SINTA (Sistema de Información Turístico de la Argentina) donde presentan de manera ordenada las “distintas maneras de entrarle a la información”. Juan Pablo explica que “el trabajo fue ir desarrollando herramientas, y en esto R tiene mucho que ver, para poder acercarle la información a distintos públicos”.

Esos públicos incluyen el académico (personas que investigan y enseñan), las distintas oficinas de diferentes niveles de estado que necesitan de esos datos, la dirección para la que trabajan que utiliza la información para la toma de decisiones y el establecimiento de políticas públicas y también para todas las personas que quieran interactuar con la información que se encuentra en el portal de datos abiertos.


🔗 La experiencia R-universe

El concepto de comunidad tiene mucha relación con las redes sociales y de comunicación y fue precisamente Twitter la que acercó por primera vez a Juan Pablo a R-Universe donde descubrió el paso a paso sobre cómo construir su propio universo de R.

“Es el siguiente lugar medio lógico en esto de estar compartiendo las cosas que estamos haciendo hacia fuera, era poder disponibilizar también a los paquetes que están en nuestro GitHub, es poder abrir nuestro pequeño mercadito, nuestro mini CRAN (…) y R-universe sirve para compartir ahí las librerías que estamos empezando a armar”, así explica el Tucu el primer uso que le dieron a la plataforma y agrega: “Lo que me parece espectacular, es cómo se va modificando en el tiempo, lo completo que es la manera de visualizar todo el desarrollo que uno está compartiendo en R-Universe”.

Pablo agrega que desarrollar paquetes fue el paso lógico en el proceso, después de la capacitación y de la incorporación del lenguaje R a la oficina: “Armamos, por un lado, las herramientas que nos mejoraban el flujo de trabajo, el paquete {Herramientas}. Y por el otro, el paquete de {Comunicación} donde la idea era principalmente y hoy todavía sigue siendo, mejorar el flujo de trabajo de nuestro equipo, de nuestro día a día”.

Perfil de r-universe con los paquetes de la Dirección

Tanto Pablo como Juan Pablo coinciden en que el principal potencial de R-universe para la oficina es poder alojar todos los paquetes que tienen en desarrollo. Pablo lo define así: “El principal uso que hoy le veo a priori es ser un gran armario en donde poner todas nuestras cajas de herramientas y que incluso también podamos mostrar eso (…) que tenemos un armario de herramientas que tienen un sentido común y que tienen una filosofía común de trabajo también.

El trabajo de Juan Pablo y de Pablo como el de R-universe se inscriben en un mundo que ha cambiado sus estructuras y tal como lo definen en la charla. En palabras de Pablo: “Estamos en un mundo en donde la programación ya no es de programadores en término de quien estudió para eso estamos en un mundo en donde hay muchas personas que colaboran y quieren colaborar con solo una parte o un granito de arena”.

Juan Pablo finaliza diciendo: “Hay más barreras que se pueden seguir bajando y sobre todo para quienes no venimos de la programación, venimos de las ciencias sociales y empezamos a programar y empezamos a usar herramientas que nos facilitaron el trabajo.” y lo más importante, “que además lo podemos hacer en castellano”.

🔗 Video de la entrevista

Si quieres escuchar más detalles sobre la experiencia, no dejes de ver a los protagonistas en el vídeo con extractos de la entrevista. Puedes activar los subtítulos en español y en inglés.