rOpenSci | Conociendo a las estrellas del universo R: comunidad R, intercambiar y aprender

Conociendo a las estrellas del universo R: comunidad R, intercambiar y aprender

Esta es la primera entrega de nuestra serie de entrevistas “Conociendo a las estrellas del universo R”. Tenemos como objetivo introducir los grupos de trabajo y las personas que est谩n detr谩s del desarrollo del software y paquetes que muchos utilizamos y que se encuentran disponibles en R-Universe. Queremos resaltar y conocer diferentes proyectos alrededor del mundo, el trabajo que hacen, sus procesos y usuarios. Iniciamos nuestro recorrido en Argentina y con un equipo que utiliza R y desarrolla paquetes de R en el estado Argentino (no dejes de ver el v铆deo con extractos de la entrevista).

🔗 La experiencia de trabajar con paquetes de R en el estado argentino

Hace dos a帽os, Juan Pablo Ruiz Nicolini (tambi茅n conocido como el Tucu) fue invitado a formar parte de la Direcci贸n de Mercados y Estad铆stica del Ministerio de Deporte y Turismo de la Naci贸n, a cargo de Mat铆as Lammens. Como parte de su trabajo, Juan Pablo dirige un equipo que gestiona un gran volumen de datos y con posibilidades de utilizar esos datos con m煤ltiples objetivos. Por estas razones tienen a R y a la comunidad de R como un actor sumamente importante en su trabajo.

Foto de perfil de Juan Pablo Ruiz Nicolini.

Juan Pablo Ruiz Nicolini
Director Nacional de Mercados y Estad铆sticas
de la Subsecretar铆a de Desarrollo Estrat茅gico del
Ministerio de Turismo y Deportes de la Naci贸n.

El equipo de trabajo con el que cuentan es grande en comparaci贸n con otras reparticiones del Estado similares y con proyectos permanentes de gran envergadura como los que desarrollan en conjunto con el INDEC (Instituto Nacional de Estad铆sticas y Censos de la Argentina).

鈥淐uando empezamos, nuestro diagn贸stico fue que hab铆a un mont贸n de cosas buen铆simas, un mont贸n de datos, un mont贸n de procesos (…) hab铆a mucho espacio para sacarle jugo a toda esa informaci贸n que estaba viviendo adentro de las computadoras de los equipos que trabajaban en la direcci贸n鈥, as铆 explica Juan Pablo el desaf铆o y la oportunidad que representaba sumarse a esa oficina. La idea adem谩s era poder compartir toda es informaci贸n hacia afuera y con procesos accesibles para distintos p煤blicos.

Desde un comienzo, el proceso incluy贸 varios pasos. Primero tomaron la decisi贸n de que los paquetes de R y el software libre eran el camino. Despu茅s vino la etapa de la capacitaci贸n interna.

Foto de perfil de Pablo Tiscornia.

Pablo Tiscornia
Coordinador de procesos.
Ministerio de Turismo y Deportes de la Naci贸n.
Direcci贸n Nacional de Mercados y Estad铆sticas.

Pablo Tiscornia forma parte del equipo de el Tucu y explica que el punto de partida del trabajo, en una oficina que hasta hace poco tiempo combinaba procesos manuales y casi todo estaba en software propietario, fue la filosof铆a del software libre sumada a todo lo que comunidad de R ven铆a ofreciendo en la regi贸n. Tanto Pablo como el Tucu se encontraron con un equipo de 17 personas aproximadamente que trabajaban de alguna manera con procesamiento de datos y que todos estaban muy involucrados con los procesos: 鈥淧rimero, necesit谩bamos resolver una din谩mica de trabajo interna (…) hab铆a mucho para hacer y hoy, creo que de esas 17 personas, 15, 14 todas saben abrir R, saben armar un Script y saben involucrarse en el proceso de trabajo que definimos desde que se tiene un dato hasta que se lo comunica al final.鈥

En esta etapa el objetivo estaba cumplido: que el equipo conozca la herramienta y conozca la din谩mica de trabajo que hab铆an definido como la m谩s adecuada.

El segundo paso era “abrir el proceso鈥 adem谩s de 鈥渕ejorar el flujo de trabajo鈥. Pablo explica que tambi茅n incorporaron la 鈥渄in谩mica de un estado abierto con una apertura de proceso, de no ocultar c贸mo hacemos las cosas鈥. Un concepto que incluye en un futuro tambi茅n la posibilidad de recibir aportes de la comunidad y de poner a revisi贸n sus propios c贸digos.

Como todos los procesos son complejos y en muchos casos con pasos en simult谩neos y hasta 鈥渃a贸ticos鈥, como lo relata el Tucu, donde distintas personas con conocimientos diversos hicieron sus aportes para poder dise帽ar los proyectos que hoy tienen en desarrollo.

El Tucu pone como ejemplo la reuni贸n de los jueves donde muestran y comparten sus c贸digos para que otras personas puedan utilizarlos en otras partes del proceso: 鈥淗acemos c贸digo en vivo donde planteamos dudas y hacemos ejercicios (…) tratamos de generar una din谩mica en la cual vamos compartiendo de una manera hasta l煤dica a veces, mostrando cada parte que van haciendo para ser compartida con los dem谩s.鈥

🔗 Software libre y en nuestro idioma

Adem谩s de la gratuidad del software libre y de la importancia del manejo de los recursos para un estado, Pablo Tiscornia explica lo que aparece casi como una declaraci贸n de principios: 鈥淓s una filosof铆a de trabajo y de concepci贸n sobre c贸mo desarrollamos y promovemos el conocimiento. Creo que somos gracias al software libre, lo que hoy podemos darle al estado; entonces ser铆a casi un acto irresponsable no promover lo que a nosotros nos form贸.鈥 Juan Pablo refuerza la idea con su experiencia personal: 鈥淵o era un tesista de maestr铆a en ciencias pol铆ticas y hace siete a帽os me obligu茅 a hacer la tesis en R para aprender (…) y lo que r谩pidamente encontr茅, por suerte, fue la comunidad de R鈥.

y lo que r谩pidamente encontr茅, por suerte, fue la comunidad de R鈥 Intercambiar con la comunidad y aprender de la comunidad parece ser el mantra principal de la comunidad R que tanto el Tucu como Pablo comparten con el equipo.

Adem谩s suman dos objetivos importantes para todo el proceso: allanar el lenguaje de programaci贸n R y transformarlo en accesible para todas las personas, incluso para quienes no vengan necesariamente de la programaci贸n, y “desarrollar los paquetes lo m谩s en castellano posible que se pueda鈥. El objetivo era el mismo, reducir las barreras para el equipo: no tener que pensar si el equipo sabe o no ingl茅s o si el idioma se transforma en una barrera para realizar el trabajo.

🔗 Un trabajo para la comunidad

Los p煤blicos que reciben el trabajo que se desarrolla en el 谩rea de turismo son m煤ltiples.

Pagina de inicio del sistema SINTA con accesos a sus conjuntos de datos abiertos

Hoy cuentan con un sitio llamado SINTA (Sistema de Informaci贸n Tur铆stico de la Argentina) donde presentan de manera ordenada las 鈥渄istintas maneras de entrarle a la informaci贸n鈥. Juan Pablo explica que 鈥渆l trabajo fue ir desarrollando herramientas, y en esto R tiene mucho que ver, para poder acercarle la informaci贸n a distintos p煤blicos鈥.

Esos p煤blicos incluyen el acad茅mico (personas que investigan y ense帽an), las distintas oficinas de diferentes niveles de estado que necesitan de esos datos, la direcci贸n para la que trabajan que utiliza la informaci贸n para la toma de decisiones y el establecimiento de pol铆ticas p煤blicas y tambi茅n para todas las personas que quieran interactuar con la informaci贸n que se encuentra en el portal de datos abiertos.


🔗 La experiencia R-universe

El concepto de comunidad tiene mucha relaci贸n con las redes sociales y de comunicaci贸n y fue precisamente Twitter la que acerc贸 por primera vez a Juan Pablo a R-Universe donde descubri贸 el paso a paso sobre c贸mo construir su propio universo de R.

鈥淓s el siguiente lugar medio l贸gico en esto de estar compartiendo las cosas que estamos haciendo hacia fuera, era poder disponibilizar tambi茅n a los paquetes que est谩n en nuestro GitHub, es poder abrir nuestro peque帽o mercadito, nuestro mini CRAN (…) y R-universe sirve para compartir ah铆 las librer铆as que estamos empezando a armar鈥, as铆 explica el Tucu el primer uso que le dieron a la plataforma y agrega: 鈥淟o que me parece espectacular, es c贸mo se va modificando en el tiempo, lo completo que es la manera de visualizar todo el desarrollo que uno est谩 compartiendo en R-Universe鈥.

Pablo agrega que desarrollar paquetes fue el paso l贸gico en el proceso, despu茅s de la capacitaci贸n y de la incorporaci贸n del lenguaje R a la oficina: 鈥淎rmamos, por un lado, las herramientas que nos mejoraban el flujo de trabajo, el paquete {Herramientas}. Y por el otro, el paquete de {Comunicaci贸n} donde la idea era principalmente y hoy todav铆a sigue siendo, mejorar el flujo de trabajo de nuestro equipo, de nuestro d铆a a d铆a鈥.

Perfil de r-universe con los paquetes de la Direcci贸n

Tanto Pablo como Juan Pablo coinciden en que el principal potencial de R-universe para la oficina es poder alojar todos los paquetes que tienen en desarrollo. Pablo lo define as铆: 鈥淓l principal uso que hoy le veo a priori es ser un gran armario en donde poner todas nuestras cajas de herramientas y que incluso tambi茅n podamos mostrar eso (…) que tenemos un armario de herramientas que tienen un sentido com煤n y que tienen una filosof铆a com煤n de trabajo tambi茅n.

El trabajo de Juan Pablo y de Pablo como el de R-universe se inscriben en un mundo que ha cambiado sus estructuras y tal como lo definen en la charla. En palabras de Pablo: 鈥淓stamos en un mundo en donde la programaci贸n ya no es de programadores en t茅rmino de quien estudi贸 para eso estamos en un mundo en donde hay muchas personas que colaboran y quieren colaborar con solo una parte o un granito de arena鈥.

Juan Pablo finaliza diciendo: 鈥淗ay m谩s barreras que se pueden seguir bajando y sobre todo para quienes no venimos de la programaci贸n, venimos de las ciencias sociales y empezamos a programar y empezamos a usar herramientas que nos facilitaron el trabajo.” y lo m谩s importante, “que adem谩s lo podemos hacer en castellano鈥.

🔗 Video de la entrevista

Si quieres escuchar m谩s detalles sobre la experiencia, no dejes de ver a los protagonistas en el v铆deo con extractos de la entrevista. Puedes activar los subt铆tulos en espa帽ol y en ingl茅s.