Un Datawarehouse es
una base de datos corporativa que se caracteriza por integrar y depurar
información de una o más fuentes distintas, para luego procesarla permitiendo
su análisis desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creación de un datawarehouse representa en la mayoría de las
ocasiones el primer paso, desde el punto de vista técnico, para implantar una
solución completa y fiable de Business Intelligence.
La ventaja principal
de este tipo de bases de datos radica en las estructuras en las que se almacena
la información (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la información es homogénea
y fiable, y permite la consulta y el tratamiento jerarquizado de la misma
(siempre en un entorno diferente a los sistemas operacionales).
El término
Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho
más que eso. Según definió el propio Bill Inmon, un datawarehouse se
caracteriza por ser:
Integrado: los datos
almacenados en el datawarehouse deben integrarse en una estructura consistente,
por lo que las inconsistencias existentes entre los diversos sistemas
operacionales deben ser eliminadas. La información suele estructurarse también
en distintos niveles de detalle para adecuarse a las distintas necesidades de
los usuarios.
Temático: sólo los
datos necesarios para el proceso de generación del conocimiento del negocio se
integran desde el entorno operacional. Los datos se organizan por temas para
facilitar su acceso y entendimiento por parte de los usuarios finales. Por
ejemplo, todos los datos sobre clientes pueden ser consolidados en una única
tabla del datawarehouse. De esta forma, las peticiones de información sobre
clientes serán más fáciles de responder dado que toda la información reside en
el mismo lugar.
Histórico: el tiempo
es parte implícita de la información contenida en un datawarehouse. En los
sistemas operacionales, los datos siempre reflejan el estado de la actividad
del negocio en el momento presente. Por el contrario, la información almacenada
en el datawarehouse sirve, entre otras cosas, para realizar análisis de
tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores
que toma una variable en el tiempo para permitir comparaciones.
No volátil: el
almacén de información de un datawarehouse existe para ser leído, pero no
modificado. La información es por tanto permanente, significando la
actualización del datawarehouse la incorporación de los últimos valores que
tomaron las distintas variables contenidas en él sin ningún tipo de acción
sobre lo que ya existía.
Otra característica
del datawarehouse es que contiene metadatos, es decir, datos sobre los datos.
Los metadatos permiten saber la procedencia de la información, su periodicidad
de refresco, su fiabilidad, forma de cálculo... etc.
Los metadatos serán
los que permiten simplificar y automatizar la obtención de la información desde
los sistemas operacionales a los sistemas informacionales.
Los objetivos que
deben cumplir los metadatos, según el colectivo al que va dirigido, son:
Dar soporte al
usuario final, ayudándole a acceder al datawarehouse con su propio lenguaje de
negocio, indicando qué información hay y qué significado tiene. Ayudar a
construir consultas, informes y análisis, mediante herramientas de Business
Intelligence como DSS, EIS o CMI.
Dar soporte a los
responsables técnicos del datawarehouse en aspectos de auditoría, gestión de la
información histórica, administración del datawarehouse, elaboración de
programas de extracción de la información, especificación de las interfaces
para la realimentación a los sistemas operacionales de los resultados
obtenidos... etc.
Por último, destacar
que para comprender íntegramente el concepto de datawarehouse, es importante
entender cuál es el proceso de construcción del mismo, denominado ETL
(Extracción, Transformación y Carga), a partir de los sistemas operaciones de
una compañía:
Extracción: obtención
de información de las distintas fuentes tanto internas como externas.
Transformación:
filtrado, limpieza, depuración, homogeneización y agrupación de la información.
Carga: organización y
actualización de los datos y los metadatos en la base de datos.
Las claves del éxito
en la construcción de un datawarehouse es el desarrollo de forma gradual,
seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacén de datos a los demás usuarios. Por ello es
importante elegir este usuario inicial o piloto, siendo importante que sea un
departamento con pocos usuarios, en el que la necesidad de este tipo de
sistemas es muy alta y se pueda obtener y medir resultados a corto plazo.
Principales
aportaciones de un datawarehouse:
Proporciona una
herramienta para la toma de decisiones en cualquier área funcional, basándose
en información integrada y global del negocio.
Facilita la
aplicación de técnicas estadísticas de análisis y modelización para encontrar
relaciones ocultas entre los datos del almacén; obteniendo un valor añadido
para el negocio de dicha información.
Proporciona la
capacidad de aprender de los datos del pasado y de predecir situaciones futuras
en diversos escenarios.
Simplifica dentro de
la empresa la implantación de sistemas de gestión integral de la relación con
el cliente.
Supone una
optimización tecnológica y económica en entornos de Centro de Información,
estadística o de generación de informes con retornos de la inversión
espectaculares.
VISITAME EN
No hay comentarios.:
Publicar un comentario