La creación de estructuras de datos grandes y manejables

Como la computación se movió en el mercado comercial, los datos se almacenan en archivos planos que impusieron ninguna estructura. Hoy en día, los grandes datos requiere estructuras de datos manejables. Cuando las empresas necesitan para llegar a un nivel de comprensión detallada acerca de los clientes, que tenían que aplicar métodos de fuerza bruta, incluyendo modelos de programación muy detalladas para crear algún valor.

Más tarde, en la década de 1970, las cosas cambiaron con la invención del modelo de datos relacional y el sistema de gestión de bases de datos relacionales (RDBMS) que impuso estructura y un método para mejorar el rendimiento. Lo más importante, el modelo relacional añade un nivel de abstracción para que fuera más fácil para los programadores para satisfacer las crecientes demandas del negocio para extraer valor de los datos.

El modelo relacional ofrece un ecosistema de herramientas de un gran número de empresas de software emergentes. Llenó una creciente necesidad de ayudar a las empresas organizar mejor sus datos y poder comparar las transacciones de una geografía a otra.

Además, ayudó a los gerentes de empresas que querían ser capaces de examinar la información tal como inventario y compararlo con la información de pedidos de clientes para la toma de decisiones. Pero un problema surgido de esta demanda explosiva de respuestas: almacenar este creciente volumen de datos era caro y accediendo era lento. Para empeorar las cosas, un montón de duplicación de datos existían, y el valor de negocio real de que los datos era difícil de medir.

Cuando el volumen de datos que las organizaciones necesitan para gestionar creció fuera de control, el almacén de datos proporciona una solución. El almacén de datos permitió a la organización de TI para seleccionar un subconjunto de los datos que se almacena por lo que sería más fácil para el negocio para tratar de obtener información.


El almacén de datos se pretende ayudar a las empresas hacer frente a cada vez mayores cantidades de datos estructurados que tenían que ser capaces de analizar mediante la reducción del volumen de los datos a algo más pequeño y más centrado en un área particular de la empresa. Se llena la necesidad de separar el procesamiento de apoyo a las decisiones operativas y de soporte de decisiones - por razones de rendimiento.

Almacenes suelen almacenar los datos de años anteriores para entender el desempeño organizacional, identificando tendencias y ayudar a exponer a los patrones de comportamiento. También proporcionó una fuente integrada de la información desde el otro lado varias fuentes de datos que podrían ser utilizados para el análisis. Hoy en día, tanto los sistemas de gestión de contenidos y los almacenes de datos son capaces de tomar ventaja de las mejoras en la escalabilidad de hardware, tecnologías de virtualización y la capacidad de crear sistemas de hardware y software integrados.

A veces estos datos almacenes sí eran demasiado complejas y grandes y no ofrecen la velocidad y la agilidad que requiere el negocio. La respuesta fue un refinamiento adicional de los datos que se gestiona a través de mercados de datos. Estos data marts se centraron en temas de negocios específicos y apoyaron la necesidad de negocio para consultas rápidas. El almacén ha evolucionado para apoyar las nuevas tecnologías, como los sistemas integrados y dispositivos de datos.

Los almacenes de datos y data marts resuelven muchos problemas para las empresas que necesitan una manera consistente para gestionar datos transaccionales masivos. Pero cuando se trataba de la gestión de grandes volúmenes de datos no estructurados o semi-estructurados, el almacén no era capaz de evolucionar lo suficiente para satisfacer las cambiantes demandas.


Para complicar las cosas, los almacenes de datos se alimentan típicamente en intervalos de lotes, por lo general semanal o diaria. Esto está bien para la planificación, la presentación de informes financieros, y las campañas de marketing tradicionales, pero es demasiado lento para cada vez más entornos empresariales y de consumo en tiempo real.

¿Cómo las empresas capaces de transformar sus enfoques de gestión de datos tradicionales para manejar el volumen creciente de elementos de datos no estructurados? La solución no surgió durante la noche. Dado que las empresas comenzaron a almacenar datos no estructurados, los vendedores comenzaron a agregar capacidades tales como BLOB (objetos grandes binarios).

En esencia, un elemento de datos no estructurados se almacena en una base de datos relacional como una porción contigua de datos. Este objeto podría ser etiquetado pero no se podía ver lo que había dentro de ese objeto. Claramente, esto no se va a resolver las necesidades cambiantes de los clientes o de negocios.

Introduzca el sistema de gestión de base de datos objeto (ODBMS). La base de datos de objetos almacena el BLOB como un conjunto direccionable de piezas de manera que se podía ver lo que estaba allí. A diferencia del BLOB, que era una unidad independiente adjunta a una base de datos relacional tradicional, la base de datos de objetos proporciona un enfoque unificado para hacer frente a los datos no estructurados.

Bases de datos de objetos incluyen un lenguaje de programación y una estructura para los elementos de datos de manera que es más fácil de manipular diversos objetos de datos sin necesidad de programación y complejo se une. Las bases de datos de objetos introducen un nuevo nivel de innovación que ayudó a llevar a la segunda ola de la gestión de datos.




» » » » La creación de estructuras de datos grandes y manejables