¿Cuál es su opinión con respecto a los enfoques de Ralph Kimball frente a Bill Inmon para el diseño del almacén de datos?
Definiré el enfoque como una combinación de metodología (cronograma de construcción) y arquitectura (flujos y estructuras de datos) …
Tanto Bill Inmon como Ralph Kimball han hecho contribuciones tremendas a nuestra industria.
Tengo una presentación completa sobre este tema, pero intentaré resumirla aquí. Hay menos diferencias de las que la gente piensa entre los dos enfoques para el diseño del almacén de datos. Es principalmente una cuestión de diferentes enfoques (Inmon – arquitectura, Kimball – modelado) y terminología ligeramente diferente.
Creo firmemente que la personalización y la extensión son necesarias para cada situación. Ninguno de los enfoques es completo para responder a todas las preguntas ni eliminar la necesidad de aplicar el juicio.
Tendrá que tomar dos decisiones básicas y numerosas decisiones de seguimiento:
- Arquitectura orientada a empresas frente a Data Mart
- Metodología orientada a la empresa versus de abajo hacia arriba
Ejemplo de decisiones de seguimiento:
- Construir alcance
- Participación empresarial
- Definición de data marts: unidades de trabajo o expansión física de uso con la herramienta ETL en ETL
- Procesa las opciones de acceso a los datos y la forma de selección: por uso, por empresa, por categoría
- Retención de datos y definición de archivo de mercados de datos: unidades de trabajo o expansión física del uso de la herramienta ETL en procesos ETL
- Granularidad de la estrategia de integración de captura de datos: necesidad de técnicas de modelado de manejo de metadatos virtuales y físicos, utilidad y naturaleza física de los mercados de datos
- Supervisión e informes operativos: almacén de datos en tiempo real, EAI, gestión del rendimiento de BAM
- Persistencia, necesidad y naturaleza física de la puesta en escena de datos
- Creación de instancias físicas de almacenes de datos operativos: fuente única, fuente múltiple
- Proceso de selección de tecnología de ingeniería del equipo de desarrollo del programa: marco, el mejor de su clase
- Distribución del esfuerzo de trabajo de origen: equipo de origen, equipo de almacenamiento de datos, compartido
- Uso de almacenes de datos operativos para sistemas fuente: selectivo, completo
Especialmente para almacenes de datos «grandes» (o potencialmente grandes), prefiero la arquitectura EDW y una metodología cuasi-ascendente. Es como concluyo la presentación: «El mejor enfoque parece ser una arquitectura cuasi empresarial híbrida y una metodología de desarrollo híbrida, pero rápida, con algo de trabajo inicial y uso de estándares con empresas ampliamente definidas y técnicas de federación utilizadas para unir a las grandes empresas. . «