Páginas

lunes, 12 de marzo de 2012

TIPOS DE BASES DE DATOS

BODEGA DE DATOS (DATA WAREHOUSE)

Son construciones de grandes repositorios integrados de datos que pueden ser generados internamente o recibidos de fuentes externas, organizados de tal manera que facilitan el proceso de toma de decisiones.



Almacenes de datos(DATA MART)

Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones.

Diseño de una Bodega de Datos

Hay tres arquitecturas en el diseño de sistemas de bodega de datos:

  • Esquema de estrella: En este diseño del almacén de datos la tabla de Variables (Hechos) esta rodeada por Dimensiones y juntos forman una estructura que permite implementar mecanismos básicos para poder utilizarla con una herramienta de consultas OLAP. Se implementa un diseño lógico relacional de base da datos que resulta en que las tablas de hechos representan la Tercera Forma Normal (3FN) y las dimensiones representan la Segunda Forma Normal (2FN).
Lo característico de la arquitectura de estrella es que sólo existe una tabla de dimensiones para cada dimensión y esta tabla representa la segunda forma normal. 
Un ejemplo del esquema de estrella:
Esquema estrella


  • Esquema en copos de nieve: Esquema en copo de nieve (bola de nieve) es una variedad más compleja del esquema estrella. El afinamiento está orientado a facilitar mantenimiento de dimensiones. 
Lo que distingue a la arquitectura en copo de nieve de la esquema estrella, es que las tablas de dimensiones en este modelo representan relaciones normalizadas (3NF) y forman parte de un modelo relacional de base de datos.
El problema es que para extraer datos de las tablas en esquema de copo de nieve, a veces hay que vincular muchas tablas en las sentencias SQL que puede llegar a ser muy complejo y difícil para mantener.
Un ejemplo del esquema en copos de nieve:
Esquema copo de nieve

  •  Esquema de constelación de hechos: Este esquema es más complejo que las otras arquitecturas debido a que contiene múltiples tablas de hechos. Con esta solución las tablas de dimensiones pueden estar compartidas entre mas de una tabla.
Este tiene mucha flexibilidad, y este factor es su grande virtud. Sin embargo, el problema es que cuando el número de las tablas vinculadas aumenta, la arquitectura puede llegar a ser muy compleja y difícil para mantener.
Un ejemplo del esquema de constelación de hechos:
Esquema constelación de hechos





















lunes, 5 de marzo de 2012

ARQUITECTURA


FUNCIONES DE USO

Una bodega de datos debe entregar la informacion correcta a la gente indicada en el momento adecuado en el formato correcto.
  • Da respuestas a las necesidades de usuarios conocedores, utilizando sistemas de soportes en la desicion (DSS): Proveen la interfaz humana con la bodega de datos. En el procesamiento de la información se pasa de simples consultas SQL a OLAP y de esta a Minería de Datos. Sistema de informacion ejecucion (EIS) o herramientas para hacer consultas y reportes.
  • Los usuarios finales pueden hacer consultas sobre sus bodegas de datos sin tocar o afectar la operacion del sistema.

lunes, 27 de febrero de 2012

Que Ofrecen las Bodegas de Datos?

El objetivo de las bodegas de datos es centralizar una gran variedad de datos e información, interpretar dicha información y darle un valor agregado para beneficio del negocio todo ello por supuesto, con un fácil acceso y visualización por parte de los usuarios. Algunos procesos que se realizan en estos escenarios son:

Transformación de Datos: Se obtienen datos e información de diferentes fuentes o almacenamientos y se aplica una serie de reglas definidas que convierten los datos en información útil para la toma de decisiones.

Repositorios y metadatos: Más importante aún que el flujo de datos es entender el origen y la descripción de éstos de una forma que sea común para toda la organización. "No se requiere más datos, se requiere entenderlos".

Procesamiento analítico en línea (OLAP): Provee el medio para obtener visualizar y analizar información con alto rendimiento y flexibilidad. OLAP presenta la información a los usuarios de una forma natural e intuitiva. De esta manera los usuarios pueden ser más efectivos en reconocer el valor de dicha información.

Visualización: En la mayoría de los casos los datos pueden ser mejor entendidos si los números son combinados de diferentes formas y presentados visualmente en forma de histogramas y varios tipos de gráficas. La visualización puede ser especialmente útil en identificar rápidamente cuales datos pueden tener un análisis especial.

Herramientas Utilizadas(Software)

Herramientas de almacenamiento: Son herramientas en las cuales se ira a almacenar datos. Dependiendo del volumen de los datos, presupuesto y capacidad de su sistema. Cada uno de los sistemas de administracion de bases de datos, como Oracle, DB2, Informix, TeraData, Sybase, etc, tienen una facilidad de Data Warehouse.


Herramientas de Extracción y Colección: Esta es una herramienta la cual ayuda a definir, acumular, totalizar y filtrar los datos de sus sistemas transaccionales  en el Data Warehouse. Estas herramientas son desarrollados especialmente para el personal interno ya que ellos tienen el conocimiento necesario para la modificar la información la cual se encuentra almacenadas en los sistemas de información.


Herramientas para Elaboración de Reportes a Usuarios Finales: Esta herramienta es la que el usuario final va a ver a traves de una interfaz. A este usuario se le debe proveer de un mecanismo fácil para que vea los datos de una manera fácil y rápida para que obtenga la solución a sus preguntas especificas. Existen muchas herramientas, incluyendo Cognos Powerplay, Business Objects, SAS, ShowCase Strategy etc.


Herramientas de Análisis Inteligente: Esta herramienta fue creadas utilizando inteligencia artificial que buscan alrededor del Data Warehouse modelos  y relaciones en los datos. Esta herramienta se utilizan una técnica conocida como Data Minning o Minería de Datos. Y hay empresas que utilizan bastante esta herramienta como lo son IBM, SAS, Arbor, Cognos, Business Objects, entre otras.

Que Caracteristicas tiene una Bodega de Datos?


  • INTEGRADAS: La base de datos contiene los datos de todos los sistemas operacionales de la organizacion y dichos datos deben ser consistentes.
  • ORIENTADAS A UN TEMA PARTICULAR: Ya que los datos que contienen, están organizados por temas, totalizados y optimizados para dar respuestas a preguntas de diversas áreas funcionales de la organización.
  • VARIANTES EN EL TIEMPO: Porque contrario a las Bases de Datos Operacionales que se centran en los datos actuales, las Bodegas de Datos representan el flujo de información a través del tiempo.
  • NO VOLATILES: La informacion no se modifica ni se elimina, una vez almacenado un dato, este se convierte en informacion de solo lectura y se mantiene para futuras consultas.


Que se Necesita para la Construcción de una Bodega de Datos?


En la construcción de una bodega de datos se requiere de un servidor para el almacenamiento y manejo de la base de datos corporativa; este servidor se recomienda que sea altamente escalable, pues algunas veces el proyecto de construcción de la bodega presenta re dimensionamiento es decir se debe  establecer de nuevo las dimensiones exactas o el valor pre siso  a medida que se avanza en la implementación. La capacidad inicial de almacenamiento estará determinada por los requerimientos de información histórica presentados por la empresa y por la perspectiva de crecimiento que se tenga.


Dependiendo del diseño del sistema, puede ser necesario contar con un segundo servidor para las herramientas de consulta de datos. Este equipo debe tener el sistema operativo recomendado por el proveedor de la herramienta a utilizar, siendo el más usado alguna versión de Windows.
Las estaciones de trabajo de cada usuario deberán cumplir con las características recomendadas por el proveedor de la herramienta de consulta seleccionada.
partiendo delo anterior podemos concluir que para la construcción de una bodega de datos es indispensable establecer el requerimiento sobre esta y como se diseñara la bodega de datos es decir que   si el sistema es mas complejo seria necesario establecer otro servidor para que uno se en cargue del almacenamiento y el otro únicamente se enfoque en las consultas de estas. 








Que Conforma una Bodega de Datos?

Dejando a una lado las consideraciones tecnicas y economicas, podemos encontrar 3 aspectos importantes que intervienen en el establecimiento y uso de una Bodega de Datos, Estos son:

  • Diseño: en este aspecto requiere analizar a profundidad la institucion o area en la cual se va a utilizar la bodega, asi como la informacion que se va a manejar, para asi tener la idea de su diseño y construccion, siendo una aspecto importante, ya que de aqui depende la buena toma de decisiones en el futuro.

  •  Mantenimiento: este aspecto es fundamental en la bodega, ya que sin un oportuno mantenimiento o actualizacion, los datos pasarian a ser obsoletos, y por ende la informacion ya no se aprovecharia a un 100%  para un buen analisis y desempeño en la labor de toma decisiones.

  •  Uso: aqui esta todo el trabajo que se hizo en los anteriores aspectos, ya que aqui se utiliza toda la informacion suministrada por la bodega para la buena interpretacion y analisis de una buena toma de decision, asi que la institucion o compañia debe ser consiente que los usuarios que la administren puedan preguntar e interpretar y poner en practica todos los datos que esta contiene. 
Si bien es cierto que la bodega de datos agiliza esta tarea, es deber de los usuarios de la bodega saber cómo preguntar y cómo interpretar y poner en práctica los resultados que obtienen, pero además, la institución debe definir en forma muy clara, el ámbito empresarial en el que operará la bodega, las dependencias administrativas de la organizacion que van a tener acceso a la bodega de datos y las consultas que ésta debe responder inicialmente.

Que es una Bodega de Datos?

Hay varias definiciones para una Bodega de datos, pero casi todas se asemejan a una, que es la que vamos a presentar a continuacion:

Una Bodega de Datos es un conjunto de datos integrados o orientados a una materia que varían con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de la administracion y esta orientada al manejo de grandes volúmenes de datos provenientes de diversas fuentes o diversos tipos.