¿En qué se diferencian la federación de datos y la captura de datos modificados (CDC)? ¿Pueden las empresas utilizar ambas tecnologías de integración de datos? ¿O es un tipo de trato de uno u otro?
La premisa detrás de la federación de datos es administrar conjuntos de información grandes y dispares como una serie de almacenes de datos relacionados pero individuales. El enfoque federado surgió debido a la creencia tradicional de que construir cuatro sistemas pequeños es más fácil y menos costoso que crear un sistema masivo. Por ejemplo, hay muchas empresas que tienen varios mercados de datos, cada uno con su propio contenido específico de área temática. Para ayudar a los usuarios que necesitan analizar problemas comerciales que requieren datos de varios mercados de datos, las empresas pueden emplear uno de varios métodos diferentes para integrar los datos en una sola vista. La federación de datos en sí no es tanto una tecnología de integración de datos como un enfoque arquitectónico para almacenar información dispar en diferentes sistemas.
La captura de datos modificados es un método de extracción para el procesamiento ETL (es decir, extraer, transformar y cargar rutinas). Hay dos formas de extraer datos de un sistema de origen: como una imagen completa de los datos o una que solo incluye los registros modificados. La captura de datos modificados (como sugiere el nombre) se centra en extraer y cargar solo aquellos registros de datos que han cambiado en el sistema de origen desde el proceso ETL anterior.
A medida que maduran los entornos de data warehouse y data mart, es bastante común que las actividades ETL migren a un enfoque de captura de datos modificados para reducir el volumen de datos que deben extraerse y procesarse como parte de las rutinas ETL. El uso de CDC es independiente de si un entorno de almacenamiento de datos está centralizado o federado. De hecho, es bastante común que los entornos federados incluyan técnicas y herramientas de captura de datos de cambios.