miércoles, 25 de febrero de 2009

Los 4 principios del datawarehouse

La tarea de construir un datawarehouse es comparable a renovar una casa: es difícil estimar tiempos y costos porque surgen problemas inesperados y los requerimientos cambian.

A continuación cuatro puntos a considerar en un proyecto de este tipo o similar:

1. Lleva más tiempo y dinero renovar que construir
Renovar una casa es más costoso que construir desde cero. Detrás de las paredes y techos de una casa se esconden problemas invisibles que sabotean todas las proyecciones. Un datawarehouse significa reconstruir la infraestructura de información de una organización. Los sistemas contienen datos con diversa calidad y otros problemas que no son visibles de inmediato.

2. No confíe en la planeación original del proyecto
Es común que los dueños de la casa cambien los diseños a la mitad de la reparación o agreguen nuevas tareas al proyecto, lo que provoca que éste se alargue en tiempo y presupuesto. Los administradores inteligentes de proyectos de datawarehousing saben que los problemas y los cambios son inevitables, y planean tomando eso en cuenta. Se alejan de los proyectos complejos y riesgosos y escalan sus proyectos a través de incrementos manejables.

3. Obtiene lo que paga
Muchos dueños de casas toman la propuesta más económica. El adagio "Usted obtiene lo que paga" es cierto con proyectos de datawarehouse. Si no pone buenos cimientos de infraestructura, el datawarehouse fallará al encontrar nuevas y cambiantes necesidades de negocio. Pronto, no podrá escalar el sistema y no funcionará y no contendrá información consistente.

4. Asumir sin analizar mata los proyectos
La mayoría de los proyectos de renovación están muertos antes de iniciar. Lo que sucede es que ambas partes asumen diferentes cosas

cerca de las responsabilidades de este último. Los proyectos de datawarehousing son también sujetos a problemas causados por expectativas incorrectas y asunciones equivocadas. Debido al trabajo meticuloso para dar información integrada y de alta calidad, los incrementos iniciales de un datawarehouse siempre se quedan cortos de las expectativas de la gente de negocios. Para evitarlo se debe formalizar una estructura en que el negocio conduzca el proyecto.


Business intelligence
Business intelligence implica mejorar la velocidad y capacidad de las organizaciones para tomar decisiones, simplificando e integrando servicios en la misma plataforma, y proporcionando interfaces abiertas para acceder y compartir datos, dentro de la misma organización o con otras organizaciones externas.

Datawarehouse:

Los Sistemas de Información mantienen la información necesaria para la actividad diaria de la organización. La importancia de esta información de tipo transaccional reside no sólo en que permite la actividad diaria, sino también en que de ella se pueden deducir mediante análisis conclusiones de gran valor para la organización.

Cada directivo o analista puede "preguntar y analizar lo que quiera, cuando quiera y como quiera", sin la mediación del personal informático de la empresa, por lo que dedica su tiempo al análisis y extracción de valor añadido de la información.

Filosofía datawarehouse
"El DWH es una colección de datos
orientados al tema, integrados, no volátiles, organizados para el apoyo de un proceso de ayuda a la decisión"
Bill Inmon

El Data Warehouse surge como solución para atender las necesidades de análisis e información globales de la empresa, y consiste en un almacén de datos con toda la información tanto interna como externa necesaria para el negocio.
Enfocado a:

* Descubrimiento de oportunidades
* Control de gestión

Todos los datos del almacén reciben un tratamiento previo que garantiza la homogeneidad, la calidad y su orientación hacia el negocio, la información está especialmente organizada y se gestiona en el entorno idóneo para facilitar los procesos del tipo consulta.

La información se explota mediante herramientas flexibles que independizan en lo posible al usuario del desarrollo informático.
Cuadros de mando y sistemas de soporte a la decisión (EIS, DSS, etc...) son aplicaciones dirigidas a un perfil de usuario alto, no tecnológico.

Suele manejarse principalmente información agregada con un enfoque claramente de negocio.

La información se presenta en forma de indicadores de negocio y conceptos de información de las áreas usuarias en función de las dimensiones de negocio.

Estas aplicaciones se apoyan en técnicas OLAP que muestran la información almacenada en base de datos relacionales (ROLAP), multidimensionales (MOLAP), híbridas (HOLAP), dependiendo de la estrategia de almacenamiento.


Datawarehouse: informes

Utilizando herramientas de mercado que permitan a usuarios avanzados realizar sus propios informes, o se desarrollan informes predefinidos para usuarios menos avanzados. Existen dos tipos de herramientas a utilizar:

* Herramientas de Análisis Multidimensional.
* Herramientas de Query & Reporting.

Se puede definir como el proceso realizado sobre gran cantidad de datos para establecer o modelizar relaciones entre los mismos con un objetivo de negocio determinado. Es una de las formas de explotar el Data Warehouse.

El Datamining se basa en la aplicación de distintas técnicas analíticas y estadísticas sobre una población de datos obtenida del Data Warehouse, con el fin de obtener patrones de comportamiento entre determinados conceptos de información.

Las técnicas que se pueden utilizar en el proceso de Data Mining se clasifican en:

* Estadística clásica
* Exploración visual multidimensional
* Modelos basados en árboles de decisiones
* Redes neuronales

No hay comentarios: