16 mayo 2007

ALMACEN DE DATOS ( DATA WAREHOUSE )

Un almacen de datos es un almacén de información de temas especificos que esta orientado a ir las necesidades de aplicaciones de los sistemas de Soporte de Decisiones y de la Información de Ejecutivos, que permite acceder a la información corporativa para la gestión, control y apoyo a la toma de decisiones.
La informacion de estos almacenes de datos es construida a partir de bases de datos que registran las transacciones de los negocios de las organizaciones o bases de datos operacionales y su importancia se da ya que contribuye a la toma de decisiones estratégicas, tambien permite a los usuarios saber la importacia de decisiones y acciones, por ejemplo, a qué segmentos de clientes deben ir dirigidas las siguientes acciones de marketing.
Los almacenes de datos generan modelos descriptivos que permiten explorar automáticamente, visualizar y comprender los datos e identificar los posibles patrones, relaciones y dependencias que son escenciales en los resultados finales de la cuenta de resultados como por ejemplo el aumento de los ingresos.

Los almacenes de datos tienen que cumplir con una serie de caracteristicas para cumplir con su objetivo principal; estas caracteristicas son:

  • Temático Los datos están almacenados por temas. Estos se organizan desde el punto de vista del usuario final, mientras que en las Bases de Datos operacionales se organizan desde la perspectiva de la aplicación, con el objetivo de lograr una mayor eficiencia en el acceso a los datos.

  • Integrado Todos los datos almacenados en el almacen de datos están integrados. Las bases de datos operacionales orientadas hacia las aplicaciones fueron creadas sin pensar en su integración, por lo que un mismo tipo de datos puede ser expresado de distinta manera en dos bases de datos operacionales distintas (Por ejemplo, para representar el sexo: 'Femenino' y 'Masculino', 'F' y 'M' o '0' y '1').

  • No volátil Únicamente hay dos tipos de operaciones en el almacen de datos la carga de los datos procedentes de los entornos operacionales y la consulta de los mismos. La actualización de datos no forma parte de la operativa normal de un almacen de datos.

  • Histórico El tiempo debe estar presente en todos los registros contenidos en un DW. Las bases de datos operacionales contienen los valores actuales de los datos. Un almacen de datos no es más que una serie de instantáneas en el tiempo tomadas periódicamente.


http://www.mailxmail.com/curso/empresa/almacenesdedatos/capitulo3.htm

MINERIA DE DATOS ( DATA MINING)

La mineria de datos se refiere a la integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisión (Molina y otros, 2001).
Las técnicas de Data Mining son el resultado de un proceso de investigación y desarrollo que comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo
real.
La mineria de datos está lista para su aplicación en los negocios ya que podemos decir que está soportado por tres tecnologías:
• Recolección masiva de datos.
• Potentes computadoras con multiprocesadores.
• Algoritmos de Data Mining.
Una de las ventaja de la mineria de datos estan en explorar los datos se encuentran en las profundidades de las bases dedatos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años.
la mineria de datos produce ciertos tipos de informacion entre ellos podemos encontar: asociaciones , secuencias, clasificaciones, agrupamientos y por ultimo pronosticos.
Una de las extensiones de la mineria de datos consiste en aplicar sus técnicas a documentos y servicios del Web, lo que se llama minería de web (Kosala y otros, 2000). Todos los que visitan un sitio en Internet dejan huellasdigitales (direcciones de IP, navegador, galletas, etc.) que los servidores automáticamente almacenan en una bitácora de accesos (log). Las herramientas de la mineria de red analizan y procesan estos logs para producir información significativa, por ejemplo, cómo es la navegación de un cliente antes de hacer una compra en línea.