¿Sabes cómo funcionan las bases de datos multidimensionales? En este artículo te hablamos sobre este tipo de sistemas de almacenamiento, que han supuesto un gran avance a la hora de procesar datos en línea a gran velocidad.

¿Qué es una base de datos multidimensional? ¿Definición?

La definición de bases de datos multidimensionales viene marcada por la forma en la que guardan y procesan la información. Al igual que las bases de datos relacionales, almacenan la información en tablas. Sin embargo, la diferencia radica en la estructura que forman estas tablas, ya que en las bases multidimensionales los datos se ven como «cubos de información«.

Estos cubos de información añaden una nueva dimensión a las tradicionales bases de datos formadas por tablas. Los cubos están formados por dos componentes:

  • Tabla de dimensiones: aquí se almacenan datos como ítems (nombre del producto, marca, etc) o fechas
  • Tabla de hechos: almacena las medidas y las claves que la relaciona con las tablas de dimensiones. Por ejemplo, tamaño en centímetros o valor en euros.

Las bases de datos multidimensionales o MDB son ampliamente utilizadas en el entorno de los Data Warehouse y para aplicaciones encargadas de realizar análisis de procesos en línea. También es habitual que este tipo de bases de datos se empleen usando la información ya contenida en otras bases de datos relacionales.

Por otro lado, lo sistemas de gestión de bases de datos multidimensionales (MDDBMS) son capaces de procesar la información a gran velocidad, lo que las convierte en una herramienta muy útil para entornos o aplicaciones que requieren obtener respuestas a las consultas inmediatas o en tiempo real.

Características y aspectos a tener en cuenta

Las características de las bases de datos multidimensionales hacen que se diferencien de otros sistemas de almacenamiento. Veamos cuáles son los principales aspectos a tener en cuenta en este tipo de databases.

OLAP

Las tablas de las bases de datos multidimensionales se organizan en forma de cubo, más en concreto se les denomina cubo OLAP (On-Line Analytical Processing). En este tipo de estructura, cada dimensión del cubo equivale a un campo de dimensiones en la tabla, mientas que la información almacenada en cada celda del cubo corresponde a los hechos.

Tablas

Las bases de datos multidimensionales también pueden verse como una sola tabla, pero tienen una peculiaridad. Y es que tienen un campo o columna por cada dimensión, del mismo modo que también tiene un campo por cada hecho (métricas).

  • *Ejemplo: d1, d2, d3,…,m1, m2, m3…
  • *Donde «d» hace referencia a las dimensiones y «m» a las métricas o hechos que se almacenan.

De hechos

En una base de datos multidimensional están, por una parte, las tablas de hechos. Y es que este tipo de bases de datos se suelen organizar en base a un tema: Ventas, Ganancias, Climatología, etc.

Dicho tema ha de estar representado en la tabla de hechos. Esta tabla contiene valores numéricos que van a permitir establecer las relaciones entre las distintas dimensiones del cubo OLAP..

Aparte del nombre del hecho y un valor numérico para sus medidas, la tabla de hechos también incluye las claves que permitirán relacionar los hechos con la tabla de dimensiones.

De dimensiones

Por otro lado, están las tablas de dimensiones, que representan aquello que se quiere almacenar respecto a un tema concreto. En una misma base de datos multidimensional puede haber numerosas tablas de dimensiones asociadas entre sí.

Las tablas de dimensiones pueden ser generadas de forma automática, o creadas manualmente por los propios usuarios.

Asimismo, también existen claves naturales o subrogadas. Las claves naturales son aquellas que ya vienen predefinidas. Por su parte, las claves subrogadas se definen de forma manual, son de tipo secuencial y no tienen ningún tipo de relación directa con otros datos.

Medidas

En las tablas de hechos se almacenan las medidas de los datos. Estas medidas están formadas por dos componentes principales:

  • Una propiedad numérica, un valor, como puede ser el precio de venta de un producto.
  • Una fórmula, de forma que se puedan combinar distintos valores de medidas.

Se pueden distinguir entre tres tipos de medidas:

  • Medidas aditivas: pueden ser combinadas a lo largo de varias dimensiones. Por ejemplo, medir las ventas totales de un producto a lo largo del tiempo.
  • Medidas semiaditivas: no está permitida su combinación a lo largo de una o varias dimensiones. Por ejemplo, hacer inventario de productos presentes en el almacén. Sin embargo, no tendría ningún sentido sumar el stock total de un producto a través del tiempo.
  • Medidas no aditivas: no es posible combinarlas en ninguna dimensión

Jerarquía

El concepto de jerarquía permite que la información se que almacena en las bases de datos multidimensionales se organice en base a diferentes niveles de abstracción.

  • Nivel 1: Todos
  • Nivel 2: Continentes > Europa, Asia
  • Nivel 3: Países > Europa > Francia, Italia, España
  • Nivel 4: Ciudades > España > Madrid, Barcelona, Sevilla
  • Nivel 5: Oficinas > Madrid > Oficina 1, Oficina 2, Oficina 3

Ventajas y desventajas

La estructura multidimensional de estas bases de datos les confieren unas características especiales, lo que se traduce en una serie de ventajas e inconvenientes.

Ventajas

Comenzamos por ver algunas de las principales ventajas de las bases de datos multidimensionales:

  • Son capaces de trabajar con datos con un alto nivel de abstracción.
  • Posibilitan la creación de numerosas relaciones entre diversas dimensiones y hechos
  • Son muy utilizadas en los Data Warehouse y en los procedimientos de aplicaciones analíticas gracias a la gran velocidad de procesado de información y restitución de los datos.
  • Pueden trabajar con datos previamente almacenados en bases de datos relacionales simples.

Desventajas

Por otra parte, una de las principales desventajas de las bases de datos multidimensionales es la dificultad para hacer cambios en su estructura. Debido a su complejidad, cuando el usuario desea realizar modificaciones en la estructura de la base de datos, debe diseñar un nuevo cubo OLAP, sin posibilidad de utilizar la estructura previamente diseñada.

Estructura

Las estructura de una base de datos multidimensional puede ser de diferentes tipos. A continuación vemos algunos de los más frecuentes.

Esquema de estrella

Es la estructura más empleada en las bases de datos multidimensionales. Está formada por los siguientes elementos:

  • Una tabla central o Fact Table donde se almacenan los datos no redundantes.
  • Una serie de tablas de dimensiones (una por cada dimensión).
  • Cada tabla de dimensiones está formada por un conjunto de atributos.
  • Estos atributos se pueden organizar de forma jerárquica o parcial.

Esquema de copo de nieve

Es similar a la estructura anterior, con la salvedad de que algunas de las tablas que componen la base de datos están normalizadas. Gracias a esta normalización se pueden generar tablas adicionales, con lo que la estructura resultante tiene una forma parecida a un copo de nieve.

Las principales ventajas de este tipo de estructura respecto al esquema de estrella es que se reduce la redundancia y se ahorra espacio de almacenamiento.

Esquema de constelación de hechos

Es una estructura formada por un conjunto de esquemas de estrella, esto es, múltiples tablas de hechos que se relacionan con otras tablas de dimensiones.

Base de datos relacional vs Multidimensional

En este punto vemos las principales diferencias entre una base de datos multidimensional y una base de datos relacional.

Multidimensional Relacional
Organización de datos Celdas, dimensiones, tablas de hechos Tablas
Nivel de datos Detallados y agregados Detallados
Operaciones Análisis Actualizaciones
Lenguaje para Querys MDX SQL
Uso de espacio en disco Bajo Grande
Rendimiento Bueno Débil
Flexibilidad Baja Alta
Tiempo de procesamiento Alto Bajo
Escalabilidad Baja Alta
Alcance del diseño Limitado Muy grande
Acceso a datos Soporta acceso directo Acceso indirecto

Resumen

En definitiva, una base de datos multidimensional es un sistema que permiten añadir nuevas dimensiones a las relaciones que se establecen dentro de la base de datos, gracias a la creación de tablas de dimensiones que se asocian con tablas de hechos.

Gracias a ello son bases de datos muy empleadas en la analítica online y a la hora de trabajar con Data Warehouses. Entre sus ventajas están su gran rendimiento y la posibilidad de establecer relaciones complejas. Por contra, su escalabilidad y flexibilidad es bastante baja debido a su estructura.

Si quieres consultar más información te recomendamos consultar nuestro artículo sobre bases de datos, donde encontrarás información general y enlaces a otras tipologías de databases.

Escribe aquí tu comentario

Deja un comentario

Las siguientes reglas del RGPD deben leerse y aceptarse:
Este formulario recopila tu nombre, correo electrónico y contenido para que podamos realizar un seguimiento de los comentarios dejados en la web. Para más información revisa nuestra política de privacidad, donde encontrarás más información sobre dónde, cómo y por qué almacenamos tus datos.