La transformación de datos es el proceso de convertir datos de un formato, como un archivo de base de datos, un documento XML o una hoja de cálculo de Excel, a otro. Las transformaciones a menudo implican convertir una fuente de datos sin procesar en un formato limpio, validado y listo para usar. El proceso de transformación de datos también se puede denominar extracción / transformación / carga (ETL) y es crucial para la integración de datos, la gestión de datos y la creación de conocimientos empresariales oportunos.
La transformación de los datos se ha vuelto cada vez más importante a medida que ha proliferado el volumen de datos disponibles para y sobre cualquier organización. Por lo tanto, aprovechar estos datos requiere una estrategia sólida de transformación de datos que se centre en las necesidades de los usuarios comerciales. Cuando la transformación de datos se realiza correctamente, los datos son de fácil acceso, consistentes, seguros y considerados confiables por los usuarios previstos.
El proceso de transformación de datos
El proceso de transformación de datos se puede describir como un proceso de dos etapas, con unos pocos pasos en cada etapa.
- La primera etapa implica el descubrimiento de datos para identificar fuentes y tipos de datos, determinar la estructura de las transformaciones que deben ocurrir y el mapeo de datos para definir cómo se cambiarán o agregarán los campos.
- La segunda etapa implica extraer datos de la fuente original, realizar transformaciones y enviar datos al almacenamiento de destino, como una base de datos o un almacén de datos. Las ubicaciones desde las que se pueden producir las extracciones incluyen fuentes estructuradas, fuentes de transmisión o archivos de registro de aplicaciones web.
Dado que la transformación de datos requiere el uso de un programa que sea capaz de leer el idioma base original de los datos, es posible que sea necesario traducirlo antes de poder utilizarlo. Los lenguajes transformacionales de uso común incluyen Perl, TXL, Awk y XSLT.
Razones para transformar los datos
Las razones por las que es posible que deba ocurrir una transformación de datos incluyen hacerlos compatibles con otros datos, moverlos a otro sistema, compararlos con otros datos o agregar información en los datos. Por ejemplo, es posible que las bases de datos deban combinarse después de una adquisición corporativa, transferirse a un almacén de datos en la nube o fusionarse para su análisis. La transformación de datos también puede ser un enfoque para eliminar valores nulos o duplicados de los datos.
Aunque las transformaciones de datos normalmente implican la conversión de documentos, las conversiones de datos a veces implican la conversión de un programa de un lenguaje informático a otro para permitir que el programa se ejecute en una plataforma diferente. Este tipo de migración de datos generalmente se realiza cuando se adopta un nuevo sistema.
Beneficios de la transformación de datos
- Mayor calidad de datos.
- Número reducido de errores como valores perdidos.
- Consultas y tiempos de recuperación más rápidos.
- Se necesitan menos recursos para manipular datos.
- Mejor organización y gestión de datos.
- Datos más utilizables, especialmente para fines analíticos o de inteligencia empresarial avanzada.