Krypton Solid

La última tecnología en raciones de 5 minutos

¿Qué es data mart (datamart)?

Un data mart es un repositorio de datos diseñado para servir a una comunidad particular de trabajadores del conocimiento. Los mercados de datos permiten a los usuarios recuperar información para departamentos o temas individuales, lo que mejora el tiempo de respuesta del usuario. Debido a que los data marts catalogan datos específicos, a menudo requieren menos espacio que los almacenes de datos empresariales, lo que los hace más fáciles de buscar y más económicos de ejecutar.

Tipos de mercados de datos

Hay tres tipos básicos de data marts:

  1. A mercado de datos dependiente ofrece centralización y permite la obtención de los datos de una organización desde un único almacén de datos. Hay dos métodos para crear una despensa de datos dependiente: uno en el que los usuarios pueden acceder tanto a la despensa de datos como al almacén de datos, y otro en el que el acceso de los usuarios está limitado solo a la despensa de datos. Este último método puede producir lo que comúnmente se conoce como depósito de chatarra de datos, ya que todos los datos comienzan con una fuente común, pero generalmente se eliminan o se desechan.
  2. Un mercado de datos independiente se crea sin utilizar un almacén de datos central y es ideal para grupos más pequeños dentro de una empresa u organización. Los mercados de datos independientes no tienen relaciones con el almacén de datos empresarial ni con ningún otro mercado de datos. Los datos se ingresan desde una fuente de datos interna o externa, y sus análisis se realizan de forma autónoma. Debido a que los mercados de datos independientes no funcionan ni interactúan con los almacenes de datos, los usuarios necesitan un almacenamiento coherente y centralizado de datos empresariales, como una base de datos relacional, a la que puedan acceder varios usuarios.
  3. A mercado de datos híbrido combina la entrada de fuentes de datos que no forman parte del almacén de datos, como los datos operativos, y ofrece a los usuarios una integración ad hoc. Los mercados de datos híbridos requieren una limpieza de datos mínima, admiten grandes estructuras de almacenamiento y son flexibles. Los mercados de datos híbridos son adecuados para entornos con múltiples bases de datos y organizaciones que requieren una respuesta rápida.
hoja de trucos del repositorio de datos
Conozca las diferencias y similitudes clave entre bases de datos relacionales, almacenes de datos, lagos de datos, mercados de datos y almacenes de datos operativos.

Martes de datos frente a almacén de datos

Un data mart es esencialmente un almacén de datos simplificado. Si bien los almacenes de datos recopilan y administran datos de diferentes fuentes, los mercados de datos solo se enfocan en un solo tema y solo extraen datos de un puñado de fuentes de datos. Debido a su mayor tamaño, los almacenes de datos empresariales son ideales para tomar decisiones estratégicas; Debido a que los data marts son mucho más pequeños, son ideales para tomar decisiones comerciales tácticas. Los mercados de datos se utilizan principalmente en las divisiones comerciales a nivel de departamento.

Los almacenes de datos proporcionan un entorno integrado y una imagen coherente del negocio. Esto dificulta bastante el proceso de diseño. Dado que los data marts son menos complicados, su proceso de diseño es más sencillo. Los almacenes de datos son grandes, con un tamaño que varía desde 100 gigabytes (GB) hasta uno o más terabytes (TB). Los data marts son mucho más pequeños, a menudo de menos de 100 GB.

El proceso de implementación para almacenes de datos y mercados de datos también difiere considerablemente. El proceso de implementación de los almacenes de datos se puede extender de meses a años, mientras que el mismo proceso para los almacenes de datos generalmente se limita a unos pocos meses.

Data mart frente a data lake

Lagos de datos y data marts a menudo se confunden, pero no son términos intercambiables. Los lagos de datos constan de datos sin procesar, indefinidos; a menudo, el propósito de estos datos aún no se ha determinado. Los data marts contienen datos específicos cuyo propósito ha sido claramente definido por los usuarios. En los mercados de datos, el espacio nunca se desperdicia, ya que todos los datos han sido procesados ​​y se ajustan a una necesidad específica; Los lagos de datos sirven como repositorio de datos no estructurados y sin refinar.

Debido a su tamaño, los lagos de datos suelen ser más caros que los data marts y requieren más mantenimiento para evitar que se estanquen. Dado que el espacio es un bien preciado, los mercados de datos no contienen datos duplicados o no utilizados, mientras que los lagos de datos pueden contener, y a menudo lo hacen, datos redundantes y no utilizados. Por esta razón, los lagos de datos deben monitorearse en gran medida para garantizar que no se conviertan en pantanos de datos.

Debido a que los lagos de datos no tienen una estructura establecida, son fáciles de acceder y modificar. Por diseño, los data marts están más estructurados y es difícil y, a menudo, costoso manipularlos. Esto hace que los data marts sean más seguros.

La base de datos es la base sobre la que se construyen el almacén de datos y los mercados de datos.
Cómo coexisten las bases de datos, los almacenes de datos y los mercados de datos

Mercado de datos frente a base de datos

Las bases de datos a menudo sirven como base para los almacenes de datos, que, a su vez, sirven como base para los mercados de datos. Las bases de datos pueden albergar varios data marts, cada uno especializado en un tema diferente. Las bases de datos se denominan sistemas operativos porque a menudo se utilizan para procesar las transacciones diarias de una empresa; estas bases de datos se mantienen con sistemas de gestión especiales.

Mercados de datos virtuales y en la nube

El software de virtualización de datos se puede utilizar para crear mercados de datos virtuales, extrayendo datos de fuentes dispares y combinándolos con otros datos según sea necesario para satisfacer las necesidades de usuarios comerciales específicos. Una despensa de datos virtual proporciona a los trabajadores del conocimiento acceso a los datos que necesitan, al tiempo que evita los silos de datos y brinda al equipo de administración de datos de la organización un nivel de control sobre los datos de la organización a lo largo de su ciclo de vida.

El uso de mercados de datos virtuales puede evitar que los usuarios dupliquen datos accidentalmente. También pueden reducir el tiempo que lleva crear mercados de datos, reduciendo así el costo.

Otro enfoque para crear un data mart es a través de servicios de nube pública. Este enfoque de data mart-as-a-service permite a las empresas eliminar los requisitos de la infraestructura de datos local de la gestión de datos. También ofrece la ventaja de poder escalar rápidamente y entregar datos a los usuarios comerciales desde cualquier lugar a través de la web para su uso en aplicaciones de visualización de datos y inteligencia comercial (BI).

Deja un comentario

También te puede interesar...

Transmisor de esporas invadido por gusano Code Red

SINGAPUR – Cuando los usuarios intentaron descargar tonos de llamada desde el sitio web de Media Corporation en Singapur el viernes pasado, fueron recibidos con un mensaje: «Hackeado por chinos». Ese fue el mismo mensaje

Reorg, nuevo nombre de tienda para NEC

NEC Corp. tomará un nuevo nombre y una nueva cara con el comienzo del nuevo año. La empresa consolidará todas sus operaciones fuera de Japón y China con un nuevo nombre, NEC Computers International BV.

Definición de la comisión contingente

¿Qué es una comisión contingente? Una tarifa contingente es una tarifa pagada a un intermediario por una compañía de seguros o reaseguros con un monto que depende de la ocurrencia de un evento. El monto

Refinería de petróleo

¿Qué es una refinería de petróleo? Una refinería de petróleo es una planta industrial que transforma o refina el petróleo crudo en varios productos derivados del petróleo utilizables, como diesel, gasolina y aceites para calefacción.

Definición del método contable

¿Qué es un método contable? Un método de contabilidad se refiere a las reglas que sigue una empresa al informar los ingresos y los gastos. Los dos métodos principales de contabilidad son la contabilidad de

Análisis práctico del navegador web Edge de Microsoft

Edge, el nuevo navegador predeterminado de Microsoft para Windows 10, proporciona una alternativa ligera al pasado abultado y engorroso de Internet Explorer. Microsoft espera que el navegador Edge Web pueda recuperar parte de la participación

Definición de mercado definido

¿Qué es un mercado vendido? En finanzas, el término «mercado agotado» se refiere a una situación en la que la mayoría de los inversores ya han vendido o cerrado sus posiciones. Como resultado, es posible