Krypton Solid

La última tecnología en raciones de 5 minutos

Mejores prácticas para el acceso al almacenamiento de datos y los informes

Este extracto de libro de Data Warehouse Design: Modern Principles and Methodologies cubre las mejores prácticas y técnicas …

para consultar y acceder a almacenes de datos, incluida la ejecución de informes, sesiones OLAP y paneles. También cubre los operadores OLAP comunes, incluidos roll-up, drill-down, slice-and-dice, pivot, drill-through y drill-through.

Tabla de contenido:

Introducción al almacenamiento de datos
Arquitecturas, conceptos y fases del almacén de datos
Las ventajas de las bases de datos multidimensionales y el modelado de cubos
Mejores prácticas para el acceso al almacenamiento de datos y los informes
Similitudes y diferencias entre ROLAP, MOLAP y HOLAP

1.7 Acceso a los almacenes de datos

El análisis es el último nivel común a todos los tipos de arquitectura de almacenamiento de datos. Después de limpiar, integrar y transformar los datos, debe determinar cómo aprovecharlos al máximo en términos de información. Las siguientes secciones muestran los mejores enfoques para que los usuarios finales consulten los almacenes de datos: informes, OLAP, y cuadros de mando. Los usuarios finales suelen utilizar la información almacenada en un almacén de datos como punto de partida para aplicaciones de inteligencia empresarial adicionales, como análisis hipotéticos y minería de datos. Consulte el Capítulo 15 para obtener más detalles sobre estas aplicaciones avanzadas.


1.7.1 Informes
Este enfoque está orientado a aquellos usuarios que necesitan tener un acceso regular a la información de forma casi estática. Por ejemplo, suponga que una autoridad de salud local debe enviar a sus oficinas estatales informes mensuales que resuman la información sobre los costos de admisión de pacientes. El diseño de esos informes ha sido predeterminado y puede variar solo si se aplican cambios a las leyes y regulaciones vigentes. Los diseñadores emiten las consultas para crear informes con el diseño deseado y «congelar» todos los de una aplicación. De esta forma, los usuarios finales pueden consultar los datos actuales siempre que lo necesiten.

A reporte se define mediante una consulta y un diseño. Una consulta generalmente implica una restricción y una agregación de datos multidimensionales. Por ejemplo, puede buscar los recibos mensuales durante el último trimestre para cada categoría de producto. Un diseño puede parecerse a una tabla o un gráfico (diagramas, histogramas, tartas, etc.). La Figura 1-16 muestra algunos ejemplos de diseños para la consulta de recibos.

Una herramienta de informes debe evaluarse no solo sobre la base de diseños de informes completos, sino también sobre la base de sistemas de entrega de informes flexibles. Los usuarios pueden ejecutar explícitamente un informe o enviarlo automática y regularmente a los usuarios finales registrados. Por ejemplo, se puede enviar por correo electrónico.

Tenga en cuenta que los informes existían mucho antes de que aparecieran los sistemas de almacenamiento de datos. Los informes siempre han sido la principal herramienta utilizada por los gerentes para evaluar y planificar tareas desde la invención de las bases de datos. Sin embargo, agregar almacenes de datos a la combinación es beneficioso para los informes por dos razones principales: Primero, aprovechan los resultados confiables y correctos porque los datos resumidos en los informes son consistentes e integrados. Además, los almacenes de datos agilizan el proceso de generación de informes porque la separación arquitectónica entre el procesamiento de transacciones y los análisis mejora significativamente el rendimiento.

FIGURA 1-16: Diseños de informes: tabla (arriba), gráfico de líneas (medio), gráficos circulares en 3-D (abajo)
Ejemplo de informe de almacenamiento de datos


1.7.2 OLAP
OLAP podría ser la forma principal de explotar la información en un almacén de datos. Seguramente es el más popular, y brinda a los usuarios finales, cuyas necesidades de análisis no son fáciles de definir de antemano, la oportunidad de analizar y explorar datos de forma interactiva sobre la base del modelo multidimensional. Si bien los usuarios de las herramientas de generación de informes desempeñan esencialmente un papel pasivo, los usuarios de OLAP pueden iniciar una sesión de análisis compleja de forma activa, en la que cada paso es el resultado del resultado de los pasos anteriores. Las propiedades en tiempo real de las sesiones OLAP, el conocimiento profundo requerido de los datos, las consultas complejas que se pueden emitir y el diseño para usuarios que no están familiarizados con TI hacen que las herramientas en uso desempeñen un papel crucial. La GUI de estas herramientas debe ser flexible, fácil de usar y eficaz.

Una sesión OLAP consta de una ruta de navegación que corresponde a un proceso de análisis de hechos según diferentes puntos de vista y con diferentes niveles de detalle. Esta ruta se convierte en una secuencia de consultas, que a menudo no se emiten directamente, sino que se expresan de forma diferencial con respecto a la consulta anterior. Los resultados de las consultas son multidimensionales. Debido a que los humanos tenemos dificultades para descifrar diagramas de más de tres dimensiones, las herramientas OLAP generalmente usan tablas para mostrar datos, con múltiples encabezados, colores y otras características para resaltar las dimensiones de los datos.

Cada paso de una sesión de análisis se caracteriza por un OLAP operador que convierte la última consulta en una nueva. Los operadores más comunes son roll-up, drill-down, slice-and-dice, pivot, drill-through y drill-through. Las cifras que se incluyen aquí muestran diferentes operadores y se generaron utilizando la aplicación de interfaz de usuario de MicroStrategy Desktop en el conjunto de herramientas de MicroStrategy 8. Se basan en el ejemplo de V-Mall, en el que un gran centro comercial virtual vende artículos de su catálogo por teléfono e Internet. La figura 1-17 muestra las jerarquías de atributos relevantes para el hecho de ventas en V-Mall.

FIGURA 1-17: Jerarquías de atributos en V-Mall; las flechas muestran dependencias funcionales
Ejemplo de jerarquías de atributos

los enrollar El operador provoca un aumento en la agregación de datos y elimina un nivel de detalle de una jerarquía. Por ejemplo, la Figura 1-18 muestra una consulta realizada por un usuario que muestra los ingresos mensuales en 2005 y 2006 para cada región del cliente. Si lo «acumula», elimina el detalle del mes para mostrar los ingresos totales trimestrales por región. La acumulación también puede reducir la cantidad de dimensiones en sus resultados si elimina todos los detalles de la jerarquía. Si aplica este principio a la Figura 1-19, puede eliminar información sobre los clientes y mostrar los ingresos totales anuales por categoría de producto a medida que convierte la tabla tridimensional en una bidimensional. La figura 1-20 utiliza la metáfora del cubo para esbozar una operación de enrollado con y sin disminución de las dimensiones.

FIGURA 1-18: Resumen de jerarquía de tiempo
Resumen de jerarquía de tiempo

FIGURA 1-19: Roll-up eliminando la jerarquía de clientes
  Roll-up eliminando la jerarquía de clientes

los profundizar El operador es el complemento del operador enrollable. La Figura 1-20 muestra que reduce la agregación de datos y agrega un nuevo nivel de detalle a una jerarquía. La figura 1-21 muestra un ejemplo basado en una tabla bidimensional. Esta tabla muestra que la agregación basada en las regiones de los clientes cambia a una nueva agregación detallada basada en las ciudades de los clientes.

FIGURA 1-20: Enrollar (izquierda) y perforar (derecha) un cubo
Ejemplo de resumen y desglose

En la Figura 1-22, el operador de desglose provoca un aumento en el número de dimensiones de la tabla después de agregar detalles de la región del cliente.

FIGURA 1-21: Desglose de la jerarquía de clientes
Desglose de la jerarquía de clientes

Parte y pica es uno de los términos más abusados ​​en la literatura sobre almacenamiento de datos porque puede tener muchos significados diferentes. Algunos autores lo utilizan generalmente para definir todo el proceso de navegación OLAP. Otros autores lo utilizan para definir operaciones de selección y proyección basadas en datos. De acuerdo con la sección 1.5.1, definimos rebanar como una operación que reduce el número de dimensiones del cubo después de establecer una de las dimensiones en un valor específico. El corte en cubos es una operación que reduce el conjunto de datos que se analizan mediante un criterio de selección (Figura 1-23). Las figuras 1-24 y 1-25 muestran algunos ejemplos de rebanar y cortar en cubitos.

FIGURA 1-22: Desglosar y agregar una dimensión
Desglose, agregando un ejemplo de dimensión

FIGURA 1-23: Cortar (arriba) y cortar en cubitos (abajo) un cubo
Ejemplo de cubo de datos para cortar y cortar en cubitos

FIGURA 1-24: Rebanado basado en el Año =Predicado ‘2006’
Ejemplo de datos de rebanar y cortar en cubitos

FIGURA 1-25: Selección basada en un predicado complejo
Cortar y cortar en cubitos: selección basada en predicciones complejas

los pivote operador implica un cambio en los diseños. Tiene como objetivo analizar un grupo individual de información desde un punto de vista diferente. Según la metáfora multidimensional, si pivotas datos, rotas tu cubo para poder reorganizar las celdas sobre la base de una nueva perspectiva. En la práctica, puede resaltar una combinación diferente de dimensiones (Figura 1-26). Las figuras 1-27 y 1-28 muestran algunos ejemplos de tablas pivotantes bidimensionales y tridimensionales.

FIGURA 1-26: Girar un cubo
Girar un cubo

FIGURA 1-27: Girar una mesa bidimensional
Acceso a datos: pivotar una tabla bidimensional (2D)

FIGURA 1-28: Girar una mesa tridimensional
Acceso a datos: pivotar una tabla tridimensional (3D)

El término perforar representa la oportunidad de crear un vínculo entre dos o más cubos interrelacionados para comparar sus datos. Por ejemplo, esto se aplica si calcula ingresos y descuentos una expresión que involucra medidas de dos cubos (Figura 1-29). La figura 1-30 muestra un ejemplo en el que se perfora un cubo de ventas en un cubo de promociones para comparar por trimestre y categoría de producto.

La mayoría de las herramientas OLAP pueden funcionar perforar a través operaciones, aunque con diferente eficacia. Esta operación cambia de datos agregados multidimensionales en data marts a datos operativos en fuentes o en la capa reconciliada.

En muchas aplicaciones, se utiliza ampliamente un enfoque intermedio entre los informes estáticos y OLAP. Este enfoque intermedio se llama informes semiestáticos. Incluso si un informe semiestático se centra en un grupo de información previamente establecido, les da a los usuarios cierto margen de libertad. Gracias a este margen, los usuarios pueden seguir un conjunto limitado de rutas de navegación. Por ejemplo, esto se aplica cuando puede acumular solo algunos atributos de jerarquía. Esta solución es común, porque aporta algunas ventajas indiscutibles. Primero, los usuarios necesitan menos habilidades para usar modelos de datos y herramientas de análisis de lo que necesitan para OLAP. En segundo lugar, esto evita el riesgo que ocurre en OLAP de lograr resultados de análisis inconsistentes o incorrectos debido a cualquier uso indebido de los operadores de agregación. En tercer lugar, si impone restricciones a los análisis permitidos, evitará que los usuarios ralenticen involuntariamente su sistema cada vez que formulen consultas exigentes.

FIGURA 1-29: Perforar a través de dos cubos
Acceder a los datos: perforar en dos cubos


1.7.3 Cuadros de mando
Los paneles son otro método utilizado para mostrar información almacenada en un almacén de datos. El término tablero se refiere a una GUI que muestra una cantidad limitada de datos relevantes en un formato breve y fácil de leer. Los paneles pueden proporcionar una descripción general en tiempo real de las tendencias de un fenómeno específico o de muchos fenómenos que están estrictamente conectados entre sí. El término es una metáfora visual: el grupo de indicadores en la GUI se muestra como el tablero de un automóvil. Los cuadros de mando a menudo los utilizan los altos directivos que necesitan una forma rápida de ver la información. Sin embargo, para realizar y mostrar análisis muy complejos de fenómenos, los cuadros de mando deben combinarse con herramientas de análisis.

Hoy en día, la mayoría de los proveedores de software ofrecen cuadros de mando para la creación y visualización de informes. La Figura 1-31 muestra un tablero creado con MicroStrategy Dynamic Enterprise. La literatura relacionada con el diseño gráfico de cuadros de mando también ha demostrado ser muy rica, en particular en el ámbito de las empresas (Few, 2006).

FIGURA 1-30: Perforando en el cubo de ventas (Ingresos medida) y el cubo de promociones (Descuento la medida)
Paneles de control: exploración en el cubo de ventas y promociones

FIGURA 1-31: Un ejemplo de paneles
Un ejemplo de cuadros de mando

Sin embargo, tenga en cuenta que los paneles no son más que indicadores de rendimiento detrás de las GUI. Su efectividad se debe a una cuidadosa selección de las medidas relevantes, utilizando estándares de calidad de la información del almacén de datos. Por esta razón, los paneles de control deben verse como un complemento eficaz y sofisticado de los sistemas de almacenamiento de datos, pero no como el objetivo principal de los sistemas de almacenamiento de datos. De hecho, el objetivo principal de los sistemas de almacenamiento de datos siempre debe ser definir correctamente un proceso para transformar los datos en información.

Más sobre el diseño de almacenes de datos:

Deja un comentario

También te puede interesar...

¿Debería Google comprar Tesla? | Krypton Solid

Si Google está buscando un fabricante de automóviles para comprar, ¿por qué no Tesla? Todos sabemos que las industrias del transporte y las comunicaciones están entrelazadas. Con el nombre que desee (transcomunicación, transporte o lo

¿Qué es Salesforce.org? Definición de Krypton Solid.

Salesforce.org es una empresa social de la empresa estadounidense de computación en la nube Salesforce.com que ofrece tecnología, subvenciones y programas de voluntariado a organizaciones educativas y sin fines de lucro. El objetivo de la

Definición de reacción exagerada

¿Qué es una reacción exagerada? Una reacción exagerada es una respuesta extremadamente emocional a la nueva información. En finanzas e inversiones, es una respuesta emocional a un valor como una acción u otra inversión, que

Ichimoku Kinko Hyō

¿Qué es Ichimoku Kinko Hyo? Ichimoku Kinko Hyo, o Ichimoku para abreviar, es un indicador técnico que se utiliza para medir el impulso junto con futuras áreas de soporte y resistencia. El indicador técnico todo

N + I: Symbol adopta la tecnología VPN inalámbrica

Symbol Technologies, el proveedor líder de las llamadas aplicaciones inalámbricas de «cuello azul» como almacenamiento, venta minorista y entrega, lanzará un componente seguro el lunes para su suite de administración de red inalámbrica AirBeam en

Índice de suma de McClellan

¿Qué es el índice de suma de McClellan? El McClellan Sum Index es una versión a largo plazo del McClellan Oscillator, que es un indicador del tamaño del mercado basado en los avances y descensos

Definición de sonda

¿Qué es una sonda? Un pozo es un agujero que se perfora para ayudar a explorar y recuperar recursos naturales, incluidos petróleo, gas o agua. Un pozo es el verdadero agujero que forma el pozo.

Introducción al error tipo 1

Un error tipo I es un tipo de error que ocurre durante el proceso de prueba de hipótesis cuando se rechaza una hipótesis nula, incluso si es precisa y no debe rechazarse. En la prueba

Definición de riesgo de desajuste

¿Cuál es el riesgo de desajuste? El riesgo de descalce tiene una serie de definiciones particulares en finanzas, pero cada una se refiere esencialmente a la posibilidad de que una pérdida pueda surgir de la

¿Cómo debo hacer para enviar discos duros?

Un ejecutivo de una empresa de discos duros me dijo una vez que estaba mirando por la ventana del aeropuerto de St. Louis y … Vio a un manipulador de equipaje arrojando cajas por la

El sitio de Dota 2 se lanza con IceFrog Q&A

Se lanzó el sitio oficial de Dota 2 y presenta una larga sesión de preguntas y respuestas con IceFrog, el principal desarrollador del juego y creador de DotA Allstars. Siga leyendo para obtener la información

Gales, de Wikipedia, quiere enfrentarse a Google

Si todo sale según lo planeado, el fundador de Wikipedia, Jimmy Wales, y su socio Amazon, lanzarán un motor de búsqueda con carga social para competir con Google, Yahoo, Ask y otros a principios del

Definición y explicación de la especulación

¿Qué es la especulación? En el mundo de las finanzas, la especulación o el comercio especulativo se refiere al acto de realizar una transacción financiera que tiene un riesgo sustancial de pérdida de valor, pero