Automatización desatendida de descarga de datos mediante RPA para nutrir data lake

Héctor Martín Gutiérrez

Ingeniería Informática

El primer paso que hay que realizar en analitica de datos es la obtención de información, para posteriormente, estructurarla y tratarla. En este trabajo se ha estudiado el desarollo de un automatismo para la descarga masiva de datos, con los que, alimentar un lago de datos donde tener centralizada toda la información.

En este contexto, todas las distribuidoras publican cada día, alojadas en sus servidores, los datos horarios de energía bruta validada. Se trata de una cantidad grande de ficheros, por lo que, sería interesante que se pudiesen descargar de manera desatendida y que se ordenasen por distribuidora para, poder nutrir un lago de datos.

Enlace al poster

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *