Estamos en la era de la información, y como tal, cualquier empresa por pequeña que sea es capaz de acumular y gestionar una gran cantidad de datos diariamente. Cualquier pyme puede llegar a monitorizar infinidad de datos a través de una simple cuenta de Google Analytics, puede analizar el comportamiento de sus grupos de anuncios en Adwords y puede estudiar los datos que aportan sus afiliados a su mailing list.
“Datos es sinónimo de información, y toda información si se sabe gestionar, filtrar e interpretar es la principal fuente de negocio de cualquier empresa”
Para grandes empresas, con sistemas de Big Data integrados y una captación de datos diarios enorme, habrá momentos a lo largo de los años que sus sistemas, herramientas o aplicaciones del día a día necesiten un volcado de información para actualizarse. Es aquí donde entran en juego los procesos ETL como parte esencial en la integración de datos. Habitualmente, a medida que la empresa crece se adhieren más plataformas de gestión y segmentación de datos como soporte de la empresa, siendo por ejemplo los ERP (Sistemas de Planificación de Recursos Empresariales) una de las principales herramientas de uso habitual entre grandes corporaciones.
El volcado de datos entre sistemas, la actualización de herramientas antiguas a otras más nuevas o la incorporación de nuevos programas de gestión de datos puede provocar un problema importante si no se saben clasificar y categorizar adecuadamente todos estos datos. Un proceso ETL viene definido por sus fases: Extract (Extracción), Transform (Transformación) y Load (Carga), en referencia al recorrido que realizan los datos desde la fuente de origen hasta el sistema de destino.
Todo proceso ETL es un momento delicado ya que una mala configuración puede dañar todos los datos históricos que ha acumulado la empresa hasta el momento, o al menos aquellos que se quisieran migrar a otra plataforma. Pero a la vez puede ser una oportunidad de mejora ostensible si se tiene claro qué información necesitará la empresa en el presente y en el futuro, y cómo adecuar los datos existentes a esas plantillas o patrones.
Filtrar la información es esencial entre tanto volumen de datos, y un proceso ETL puede servir para pulir algunos datos innecesarios o bien para renovar la forma de estructurar algunos ya existentes. Las necesidades cambian con el tiempo, y a veces este tipo de plataformas no tienen la flexibilidad que el mundo económico actual requiere. Es por ello que un proceso ETL, además de migrar datos debe ser un punto de reflexión corporativo a través del cual definir las líneas maestras que deberán seguir los datos en su categorización durante los próximos meses o años. Siempre, detrás de todo proceso ETL hay una oportunidad de negocio latente.
Imagen de: http://www.neuronics.es/servicios.html