Contactos

¿Qué es el cubo OLAP en Excel? Los principales parámetros del sistema. Las principales características de OLAP incluyen.

/ De una manera cubista. Aplicación de cubos OLAP en la práctica de administrar grandes empresas.


En contacto con

Odnoklassniki.

Konstantin tokmachev, sistema arquitecto

De una manera cubista.
Aplicación de cubos OLAP en la práctica de administrar grandes empresas.

Puede haber pasado ya el tiempo en que recursos computacionales Las corporaciones se gastaron solo para el registro de información y informes contables. Al mismo tiempo, las decisiones de gestión se tomaron "en los ojos" en los gabinetes, en reuniones y reuniones. Es posible que en Rusia sea el momento de regresar a complejos de computación corporativa, sus principales tareas de administración de recursos básicos según los datos registrados en la computadora de datos

Sobre los beneficios de la inteligencia empresarial

En el circuito de control de la corporación entre los datos "crudos" y las "palancas" del impacto en el objeto administrado, hay "indicadores de trabajo" - KPI. Forman un "tablero de instrumentos", reflejando el estado de varios subsistemas de un objeto administrado. Para equipar a la compañía con indicadores de desempeño informativo y controlar su cálculo y los valores obtenidos son el trabajo de un análisis empresarial. La asistencia esencial en la organización de corporaciones de trabajo analítico puede proporcionar servicios de análisis automatizados, como la utilidad de EM servidor SQL Servicios de análisis (SSA) y su principal disposición - Olap-cubo.

Aquí hay que hacer otro comentario. Por ejemplo, en la tradición estadounidense, se llama BI (inteligencia comercial) orientada a la OLAP (inteligencia comercial). No debe haber ilusiones, como si la BI americana corresponde al analista de negocios ruso. Sin ofensa, pero a menudo nuestro analista de negocios es un "unincor" y "no proprogramista", un especialista con conocimiento difuso y con un pequeño salario, que realmente no tiene herramientas y metodología propias.

El especialista BI es, de hecho, matemático aplicado, un especialista en clase alta que ha surgido la compañía moderna. métodos matemáticos (Lo que se llamó Operations Reestenh - Métodos para la investigación de las operaciones). BI más corresponde a la primera una vez en el "analista del sistema" de la URSS, producida por la Facultad de la IMK MSU. M.v. Lomonosov. Los servicios de OLAP-CUBE y ANÁLISIS pueden ser una base prometedora para el lugar de trabajo del analista de negocios ruso, posiblemente después de un aumento en sus calificaciones hacia el BI americano.

EN Últimamente Había otra tendencia dañina. Debido a la especialización, se pierde la comprensión mutua entre las diferentes categorías de trabajadores de la corporación. Contador, Gerente y Programador, como "Swan, Cancer Sí Pike" en Basne I.A.A. Krylov, tire de la corporación en diferentes direcciones.

El contador está ocupado informando, su suma y su significado y en la dinámica no están directamente relacionados con el proceso de negocio de la empresa.

El gerente está involucrado en su segmento de procesos de negocios, pero no es capaz de evaluar a nivel mundial, a nivel de la compañía en su conjunto, los resultados y las perspectivas de sus acciones.

Finalmente, un programador que fue una vez (gracias a la educación) Conductor de ideas técnicas avanzadas de la ciencia de las empresas en el campo de las empresas, se convirtió en un intérprete pasivo de fantasías de un contador y gerente, por lo que ya no, cuando los departamentos de corporaciones son Inferior a los contadores y todos no demasiado perezosos. Programador sinitular, pequeño, pero relativamente alto de alto rendimiento es una verdadera playa de corporaciones rusas. (Casi como jugador de fútbol doméstico.) No estoy hablando de los llamados "economistas y abogados", todo se dice de ellos.

Por lo tanto, la posición de un análisis empresarial equipado con un aparato de alta tecnología SSAS, que posee la programación y la contabilidad de AZA, es capaz de consolidar el trabajo de la empresa con respecto al análisis y el pronóstico del proceso de negocio.

Ventajas de los cubos OLAP

OLAP CUBE es un medio moderno para analizar la base de datos corporativa. sistema de computación, lo que permite a los empleados de todos los niveles de la jerarquía por el conjunto requerido de indicadores que caracterizan el proceso de producción de la empresa. No es solo que una interfaz fácil de usar y un lenguaje de consulta flexible para MDX (expresiones multidimensionales) le permitan formular y calcular los indicadores analíticos necesarios, pero a una velocidad y facilidad notables con las que hace el cubo Olap. Además, esta velocidad y facilidad, dentro de los límites conocidos, no dependen de la complejidad de los cálculos y el volumen de la base de datos.

Alguna idea de OLAP-
cuba puede dar una "tabla de resumen" MS Excel. Estos objetos tienen una lógica similar y interfaces similares. Pero, como se verá en el artículo, la funcionalidad OLAP es incomparablemente más rica, y el rendimiento es incomparablemente más alto, de modo que la "tabla de resumen" sigue siendo un producto de escritorio local, mientras que OLAP es un producto de nivel corporativo.

¿Por qué el cubo Olap es tan bueno para resolver tareas analíticas? El cubo OLAP está dispuesto de tal manera que todos los indicadores en todos los recortes posibles se calculen de antemano (en su totalidad o en parte), y el usuario permanece "retirado" los indicadores requeridos (medidas de medidas) y cortes (dimensiones dimensiones ), y redibuja las señales.

Todos los analistas posibles en todos los recortes forman un campo enorme, o más bien, no el campo, sino solo un cubito OLAP multidimensional. Con cualquier solicitud, el usuario (administrador, analista de negocios, administrador) se dirigió al servicio de análisis, la velocidad de respuesta se explica por dos cosas: primero, los análisis requeridos se pueden formular fácilmente (o seleccionar de la lista por nombre o se define Por la fórmula en MDX), en segundo lugar, como regla general, ya está calculada.

La redacción de análisis es posible en tres versiones: este es el campo de la base de datos (o más bien, el campo del almacén), o el campo de cálculo, determinado en el nivel de diseño de Cuba, o la expresión del idioma MDX en el trabajo interactivo con el cubo.

Esto significa varias características atractivas de los cubos OLAP a la vez. De hecho, la barrera desaparece entre el usuario y los datos. La barrera en forma de programador de aplicaciones a la que, en primer lugar, debe explicar el problema (poner la tarea). En segundo lugar, debe esperar hasta que el programador de la aplicación cree el algoritmo, escribirá y depurará el programa, luego puede ser modificado. Si los empleados tienen mucho y sus requisitos son diversos y cambiantes, entonces necesita un equipo completo software aplicadotierra. En este sentido, el cubo OLAP (y un analista de negocios calificado) en términos de trabajo analítico reemplaza todo el comando de programadores de aplicaciones, ¡como una excavadora poderosa con una excavadora cuando cavando una zanja reemplaza toda una brigada de trabajadores migrantes con palas!

Al mismo tiempo, se logra otra calidad muy importante de los datos analíticos obtenidos. Dado que el Cubo OLAP es uno para toda la compañía, es decir, Este es el mismo campo con los analistas en absoluto, entonces se excluye una dispersión molesta en los datos. Cuando el gerente tiene que pedirle a la misma tarea a varios empleados independientes para excluir el factor de la subjetividad, y aún traen diferentes respuestas que todos toman algo para explicar, etc. El cubo OLAP proporciona una uniformidad de datos analíticos en diferentes niveles de la jerarquía corporativa, es decir, Si el gerente quiere detallar un cierto indicador que lo interese, sin duda llegará a los datos de nivel inferior que sus trabajos subordinados, y estos serán solo los datos sobre la base de los cuales el indicador de nivel superior está diseñado, y no Otros datos, obtenidos de alguna otra manera, en algún otro momento, etc. Es decir, toda la firma ve el mismo análisis, pero en diferentes niveles de consolidación.

Damos un ejemplo. Supongamos que el líder controla las cuentas por cobrar. Mientras que las cuentas por cobrar vencidas de KPI "Burns Green", significa que todo es normal, no se requieren acciones de administración. Si el color ha cambiado a amarillo o rojo, algo está mal: Corte el KPI en los departamentos de ventas e inmediatamente vea la división "en rojo". La siguiente incisión por parte de los gerentes, y el vendedor cuyos clientes se estaban cruzando los pagos definidos. (Además, la cantidad de retraso puede ser cortado por los compradores, según los términos, etc.), el jefe de la corporación puede comunicarse directamente con los infractores en cualquier nivel. Pero, de hecho, el mismo KPI (en sus niveles de jerarquía) consulte a los jefes de departamentos y gerentes de ventas. Por lo tanto, para corregir la situación, ni siquiera necesitan esperar una "llamada a la alfombra" ..., por supuesto, KPI en sí no necesariamente tiene que ser la cantidad de demora, puede ser un período promedio ponderado. de retraso o en general de cuentas por cobrar.

Cabe señalar que la complejidad y la flexibilidad del idioma MDX junto con la obtención rápida (a veces instantánea) obteniendo el resultado le permiten resolver (teniendo en cuenta las etapas de desarrollo y depuración) Tareas de gestión complejas, que en otras condiciones pueden no ser planteado en absoluto debido a consideraciones laborales para programadores de aplicaciones y incertidumbre inicial en la producción. (El tiempo prolongado de soluciones por programadores de aplicaciones de tareas analíticas debido a las modificaciones de los programas mal entendidos y largas cuando se encuentran las condiciones cambiantes a menudo en la práctica).

También prestamos atención al hecho de que todos los empleados de la compañía pueden recopilar analistas OLAP desde el campo común exactamente la cosecha que necesita para trabajar, y no contenta con esa "tira", que se corta en "informes estándar" comunales.

La interfaz de trabajo multijugador con el cubo OLAP en el modo cliente-servidor permite a cada empleado, independientemente de que otros tengan su propia fabricación (incluso su propia fabricación con algún habilidad), los bloques de análisis (informes), que se definen, se actualizan automáticamente. Más simplemente, siempre están en condiciones relevantes.

Es decir, el cubo OLAP le permite hacer un trabajo analítico (que generalmente está comprometido no solo por los analistas de notas, sino que, de hecho, casi todos los empleados de la compañía, incluso los logistas y los gerentes, controlan los restos y los envíos) más selectivos " Con una persona, no general, expresando "lo que crea condiciones para mejorar el trabajo y aumentar la productividad.

Sumando nuestra introducción, observamos que el uso de cubos OLAP puede aumentar la administración de la empresa a un nivel superior. Uniformidad de los datos analíticos en todos los niveles de jerarquía, su autenticidad, complejidad, facilidad de creación y modificación de indicadores, la individualidad de la configuración, alta velocidad de procesamiento de datos, finalmente ahorrando dinero y tiempo dedicado a soportar rutas de análisis alternativas (programadores de aplicaciones, empleado independiente Cálculos), perspectivas abiertas para el uso de cubos OLAP en la práctica de grandes compañías rusas.

OLTP + OLAP: circuito de retroalimentación en la firma de la cadena de gestión

Ahora considere la idea general de los cubos OLAP y su punto de aplicación en la cadena de gestión de la corporación. El término OLAP (procesamiento analítico en línea) fue introducido por el matemático británico del CODDO ERGAR además de los términos OLTP ingresados \u200b\u200banteriormente (procesamiento de transacciones en línea). Esto se dijo, pero E. CODD, por supuesto, sugirió no solo los términos, sino también las teorías matemáticas de OLTP y OLAP. Sin entrar en detalles, en la interpretación moderna de OLTP es una base de datos relacional, considerada como un mecanismo para registrar, almacenar y muestrear información.

Solución de metodología

Los sistemas ERP (planificación de recursos empresariales), como 1C7, 1C8, MS Dynamics AX, tienen interfaces de software orientadas al usuario (ingrese y ajustan documentos, etc.), y una base de datos relacional (DB) para almacenamiento y información de muestreo presentada hoy productos de software, como MS SQL Server (SS).

Tenga en cuenta que la información registrada en la base de datos del sistema ERP es, de hecho, un recurso muy valioso. El punto no es solo que la información registrada proporciona el flujo de documentos actual de la corporación (la declaración de documentos, su ajuste, la posibilidad de impresión y reconciliación, etc.) y no solo en la posibilidad de calcular las declaraciones contables (impuestos, Auditoría, etc.). Desde el punto de vista de la gerencia, es mucho más importante que el sistema OLTP (base de datos relacional) sea, de hecho, un modelo digital actualizado de las actividades de la corporación en tamaño completo.

Pero para administrar el proceso, no es suficiente registrar información al respecto. El proceso debe representarse como un sistema de indicadores numéricos (KPI), caracterizando su movimiento. Además, los valores válidos deben definirse para los indicadores. Y solo si el valor del indicador va más allá del intervalo permisible, se debe seguir el efecto de control.

Con respecto a tal lógica (o mitología) del control ("gestión de la desviación") convergencia y el antiguo filósofo griego de Platón, creando una imagen de alimentación (cibersois), que las líneas en la paleta, cuando el barco se desvía del curso, y el estadounidense Matemático Norbert Wiener que creó la ciencia de la cibernética en la era de la EVE de las computadoras.

Además del sistema de registro de información habitual mediante el método OLTP, necesita otro sistema, un sistema de análisis información recolectada. Esta superestructura, que en el circuito de control, desempeña el papel de los comentarios entre el manual y el objeto de control, es el sistema OLAP o, en resumen, el cubo OLAP.

Como implementación de software de OLAP, consideraremos la utilidad de Servicios de Análisis de MS, que forma parte de la entrega estándar de MS SQL Server, SSAS abreviada. Cabe señalar que, de acuerdo con la idea de E. CODD OLAP-CUBE en el analista, debe proporcionar la misma libertad de acción integral que el sistema OLTP y la base de datos relacional (SQL Server) se proporcionan en el almacenamiento y la muestra de información .

Material OLAP y soporte técnico.

Ahora considere la configuración específica de dispositivos externos, programas de aplicaciones y operaciones tecnológicas, en las que se basa el trabajo automatizado de OLAP Cuba.

Asumimos que la Corporación utiliza el sistema ERP, por ejemplo, 1C7 o 1C8, dentro de las cuales la información está registrada como de costumbre. La base de datos de este sistema ERP se encuentra en un determinado servidor y es compatible con el programa MS SQL Server.

También asumimos que el otro servidor está instalado en el otro servidor, que incluye MS SQL Server con la utilidad de Servicios de Análisis de MS (SSAS), así como el estudio de administración de MS SQL Server, MS C #, MS Excel y MS Programs Estudio visual.. Estos programas juntos forman el contexto deseado: Toolkit y las interfaces necesarias de desarrolladores de desarrollo cúbico OLAP.

El servidor SSAS tiene un programa de BLAT libremente distribuido llamado (con parámetros) desde la línea de comandos y proporcionando un servicio postal.

En las estaciones de trabajo de los empleados, dentro de la LAN, entre otras cosas, se instalan programas de MS Excel (versiones de al menos 2003), así como, tal vez un conductor especial para asegurar que MS Excel con Sra. Analysis Services (a menos que el conductor apropiado sea no más largo incluido en MS Excel).

Por definición, asumimos que los empleados están instalados en estaciones de trabajo. sistema operativo Windows XP, y en servidores - Servidor de windows 2008. Además, se deja que la MS SQL Server 2005 se use como SQL Server, y Enterprise Edition (EE) o desarrollador Edition (DE) se instala en el servidor con Cubo OLAP. En estas ediciones es posible utilizar el llamado. "Medidas semi -adivistas", es decir,. Funciones agregadas adicionales (estadísticas), diferentes de sumas ordinarias (por ejemplo, extremo o valor medio).

Diseño Olap Cuba (OLAP CUBISM)

Digamos algunas palabras sobre el diseño de la OLAP Cuba. En el idioma de las estadísticas de OLAP-CUBE, este es un montón de indicadores de desempeño calculados en todos los recortes necesarios, por ejemplo, el indicador de envío en cortes por compradores, por bienes, por fechas, etc. Debido a la traducción directa del inglés en la literatura rusa en los cubos OLAP, los indicadores se llaman "medidas" y los recortes son "dimensiones". Esto es matemáticamente correcto, pero sintácticamente y semánticamente, no es muy buena traducción. Las palabras rusas "medida", "medición", "dimensión" casi no difieren en el significado y la escritura, mientras que la "medida" británica y la "dimensión" son diferentes y escribiendo y en significado. Por lo tanto, preferimos similares en el sentido de los términos estadísticos rusos tradicionales "indicador" y "corte".

Hay varias opciones para la implementación del software del cubo OLAP con respecto al sistema OLTP en el que se inicia sesión los datos. Consideraremos solo un esquema, el más simple, confiable y rápido.

En este esquema, OLAP y OLTP no tienen tablas comunes, y los analistas OLAP se calculan lo más detallados posible en la etapa de actualización de Cuba (proceso) que precede a la etapa de uso. Este esquema se llama MOLAP (OLAP multidimensional). Sus minuses son asíncronos con ERP y altos costos de memoria.

Aunque formalmente el cubo OLAP se puede construir utilizando todas las tablas de la base de datos relacional del sistema ERP y todas (cientos) de sus campos como indicadores o incisiones, no es posible hacerlo. De lo contrario. Para cargar en los cubos, es más correcto preparar una base de datos separada llamada "Showcase" o "Warehouse".

Varias razones se ven obligadas a hacer esto.

  • Primeramente, Encuadernación de un cubo OLAP a las tablas de base de datos reales sin duda creará problemas técnicos. Cambiar los datos en la tabla puede iniciar una actualización de cubo, y la actualización del cubo no es necesaria proceso rápidoEntonces, el cubo estará en un estado de reestructuración permanente; Al mismo tiempo, el procedimiento de actualización de cubo puede bloquear (cuando lee) los datos de las tablas base, se inhibe mediante la operación de los usuarios para registrar datos en el sistema ERP.
  • en segundo lugar, La presencia de demasiados indicadores y recortes aumentará drásticamente el área de almacenamiento del cubo en el servidor. No olvidará que en OLAP Cuba, no solo se almacenan los datos de origen, como en el sistema OLTP, y también todos los indicadores resumen para todos los recortes posibles (e incluso en todas las combinaciones de todos los recortes). Además, en consecuencia, la velocidad de actualización del cubo disminuye y al finaliza la velocidad de la construcción y actualización de los informes de usuario analista y basados \u200b\u200ben el usuario.
  • En tercer lugar, también un gran número de Los campos (indicadores y recortes) crearán problemas en la interfaz del desarrollador OLAP, porque Las listas de elementos serán inquietas.
  • Por cuartos OLAP-CUBE es muy sensible a las violaciones de integridad de los datos. CUBO no se puede construir si los datos clave no están en referencia, prescritos en la estructura de los enlaces de cubo. Violación temporal o constante de integridad, campos no contados: lo habitual en la base de datos del sistema ERP, pero es categóricamente no adecuado para OLAP.

Aún puede agregar que el sistema ERP y el cubo OLAP deben colocarse en diferentes servidores para dividir la carga. Pero entonces, si hay tablas comunes para OLAP y OLTP, también se produce el problema del tráfico de red. Los problemas prácticamente intratables aparecen en este caso si necesita consolidación a un cubo olap-cúbico de varios sistemas de ERP heterogéneos (1C7, 1C8, MS Dynamics AX).

Probablemente, puede continuar con problemas técnicos a granel. Pero lo más importante es que recuerde que, a diferencia de OLTP, OLAP no es un medio de registro y almacenamiento de datos, sino un medio de análisis. Esto significa que no es necesario "solo en caso" y enviar datos "sucios" de ERP a OLAP. Por el contrario, primero debe desarrollar el concepto de administrar la compañía, al menos en el nivel del sistema KPI, y construir aún más el almacenamiento de datos (almacén), ubicado en el mismo servidor que el cubo OLAP, y contiene una pequeña cantidad refinada de Datos del ERP requerido para administrar.

Sin promover los malos hábitos, el cubo OLAP con respecto a OLTP puede compararse con la conocida "Cuba distilada", por la cual se extrae el "producto limpio" de la "masa cuidadosa" del registro real.

Entonces, tenemos que la fuente de datos para OLAP es una base de datos especial (almacén) ubicada en el mismo servidor que OLAP. En general, significa dos cosas. Primero, debe haber procedimientos especiales que creen almacén de bases de datos ERP. En segundo lugar, Olap Cube Asynchronen con sus sistemas ERP.

Dado lo anterior, ofrecemos la siguiente versión de la arquitectura del proceso de computación.

Soluciones de arquitectura

Deje en diferentes servidores Hay muchos sistemas de ERP de cierta corporación (tenencia), datos analíticos para los cuales nos gustaría consolidar ver dentro de un cubo OLAP. Enfatizamos que en la tecnología descrita, combinamos los datos de los sistemas ERP en el nivel del almacén, dejando el diseño sin cambios en el cubo OLAP.

En el servidor OLAP, creamos las bases de datos de imágenes (copias vacías) de todos estos sistemas ERP. Somos periódicamente (todos) a estas copias vacías, realizamos una replicación parcial de las bases de datos del ERP de trabajo activamente correspondiente.

Además, se inician SP (procedimiento almacenado), que en el mismo servidor OLAP sin tráfico de red, según las bases de datos de réplicas parciales de los sistemas ERP, crean (o reponen) almacenamiento (almacén) - Fuente data OLAP.-Cuba.

Luego, el procedimiento de actualización / edificio de CUBE estándar se inicia de acuerdo con el almacén (operación de proceso en la interfaz SSAS).

Comentamos sobre los momentos individuales de la tecnología. ¿Qué trabajo se realiza?

Como resultado de la replicación parcial, en forma de un sistema ERP en el servidor OLAP, aparecen los datos actuales. Por cierto, la replicación parcial se puede realizar de dos maneras.

Primero, desde todas las tablas de la base de datos del sistema ERP durante la replicación parcial, solo se copian los que se necesitan para construir almacén. Esto es administrado por una lista fija de nombres de tablas.

En segundo lugar, la parcidez de la replicación también puede significar que no todos los campos de campo se copien, sino solo los involucrados en la construcción del almacén. La lista de campos para la copia se establece, o se crea dinámicamente en SP en la imagen de la copia (si no hay campos en la copia de la tabla).

Por supuesto, es posible no copiar por completo las filas de las tablas, sino que solo agregan nuevas entradas. Sin embargo, esto crea graves inconvenientes al tomar el personal editorial de la "trasera" ERP, que a menudo se encuentra en los sistemas de trabajo en realidad. Por lo tanto, es más fácil, sin estar causando una custodia, copie todos los registros (o actualice la "cola" comenzando en alguna fecha).

A continuación, la tarea principal SP es convertir datos ERP en formato de almacén. Si solo hay un sistema ERP, la tarea de conversión se reduce principalmente al aserrado y, posiblemente, reformatando los datos necesarios. Pero si en el mismo OLAP Cuba es necesario consolidar varios sistemas ERP. de diferentes estructurasLa transformación es complicada.

La tarea de consolidación en un cubo de varios sistemas de ERP diferentes es especialmente difícil, si los conjuntos de sus objetos (libros de referencia, contrapartes, almacenes, etc.) se intersecan parcialmente, los objetos tienen un significado, pero naturalmente descrito de diferentes maneras en el Libros de referencia de diferentes sistemas (en sentido de códigos, identificadores, títulos, etc.).

Realmente, tal imagen surge en una explosión grande, cuando varios componentes de sus compañías autónomas de tipo único realizan los mismos tipos de actividad sobre el mismo territorio, pero usan sus propios sistemas de registro y no acordados. En este caso, al consolidar los datos al nivel del almacén, no lo realice sin asignar tablas auxiliares.

Prestaremos atención a la arquitectura del repositorio de almacenes. Por lo general, el esquema Olap Cuba está representado como una "estrella", es decir,. Como tabla de datos, rodeado de "rayos" de libros de referencia: tablas de valores de claves secundarias. La tabla es un bloque de "indicadores", los libros de referencia son sus cortes. Al mismo tiempo, el libro de referencia, a su vez, puede ser un árbol desequilibrado arbitrario o una jerarquía equilibrada, por ejemplo, una clasificación multinivel de bienes o contrapartes. En OLAP Cuba, los campos numéricos de la tabla de datos del almacén se convierten automáticamente en "indicadores" (o mediciones de medidas), y las secciones (o dimensiones dimensiones) pueden determinar las tablas de claves secundarias.

Esta es una descripción visual "pedagógica". De hecho, la arquitectura del cubo OLAP puede ser mucho más complicada.

Primero, el almacén puede consistir en varias "estrellas", posiblemente relacionadas con los directorios generales. En este caso, el cubo OLAP se fusionará varios cubos (bloques de datos múltiples).

En segundo lugar, la "viga" del asterisco puede no ser un libro de referencia, sino un sistema de archivos completo (jerárquico).

En tercer lugar, sobre la base de los recortes de dimensiones existentes, se pueden determinar nuevos recortes jerárquicos (digamos, con un número menor de niveles, con otro nivel de niveles, etc.).

En la base, sobre la base de los indicadores y recortes existentes cuando se utilizan las expresiones de idioma MDX, se pueden definir nuevos indicadores (cálculos). Es importante tener en cuenta que nuevos cubos, nuevos indicadores, los nuevos recortes se integran completamente completamente con los elementos de origen. También se debe tener en cuenta que, lamentablemente, los cálculos formulados y los cortes jerárquicos pueden disminuir notablemente la operación del cubo OLAP.

MS Excel como una interfaz con OLAP

El interés separado es una interfaz de usuario con cubos OLAP. Naturalmente, la interfaz más completa proporciona la utilidad SSAS en sí misma. Este es el kit de herramientas del desarrollador de cubos OLAP y un constructor de informes interactivo, y una ventana de trabajo interactiva con un cubo OLAP por solicitudes en el idioma MDX.

Además de SSAS, hay muchos programas que proporcionan una interfaz con OLAP, en mayor o menor medida que cubre su funcionalidad. Pero entre ellos hay uno, que, en nuestra opinión, tiene ventajas innegables. Esto es MS Excel.

La interfaz MS Excel proporciona un controlador especial, descargable individualmente o se incluye en Excel. No cubre toda la funcionalidad OLAP, pero con el crecimiento de las versiones de MS Excel, esta cobertura se está volviendo cada vez más (digamos, aparece la imagen gráfica KPI en MS Excel 2007, que no estaba en MS Excel 2003, etc.).

Por supuesto, además de la funcionalidad bastante completa, la principal ventaja de MS Excel es la distribución generalizada de este programa y el conocimiento de estrecho con el número abrumador de usuarios de oficinas. En este sentido, en contraste con otros programas de la interfaz, la compañía no necesita adquirir adicionalmente y que nadie debe ser abordado.

La gran ventaja de MS Excel como una interfaz OLAP es la capacidad de procesar más de forma independiente los datos obtenidos en el informe OLAP (es decir, los datos de investigación continuados obtenidos de OLAP en otras hojas del mismo Excel, ya no tienen herramientas OLAP, pero las herramientas de Excel convencionales ).

Ciclo de procesamiento Elexual Facubi

Ahora describimos el ciclo computacional diario (el blanco) de la operación OLAP. El cálculo se lleva a cabo bajo el control del programa Facubi escrito en C # 2005 y iniciado por programador de tareas en el servidor con almacén y SSAS. Al comienzo de Facubi se dirige a Internet y lee las tasas de cambio actuales (utilizadas para representar una serie de indicadores en moneda). A continuación, se realizan las siguientes acciones.

Primero, Facubi lanza SP esa replicación parcial de bases de datos de varios sistemas ERP (elementos de sujeción) disponibles en la red local. La replicación se realiza como dijimos, en "compuestos" preempleados, imágenes de sistemas de ERP remotos ubicados en el servidor SSAS.

En segundo lugar, a través de SP se muestra desde las réplicas de ERP al almacenamiento del almacén, un DB especial, que es la fuente de los datos del Cubo OLAP y se encuentra en el servidor SSAS. Al mismo tiempo, se resuelven tres tareas principales:

  • datos de ERP cuerpo debajo de los formatos de cubo requeridos; Estamos hablando de tablas y sobre los campos de las tablas. (A veces, la tabla deseada necesita "recortar", digamos, desde varias hojas de MS Excel). Los datos similares pueden tener formato diferente En diferentes ERP, por ejemplo, los campos de identificación clave en los libros de referencia de 1C7 tienen 36 dígitos código simbólico 8, pero los campos _idrref en los libros de referencia 1C8 - Números hexadecimales 32;
  • en el curso del procesamiento. Control lógico de los datos está en marcha (incluidos los valores predeterminados predeterminados en el sitio de los datos que faltan, cuando sea posible) y el control de integridad, es decir, Comprobación de la presencia de claves primarias y secundarias en los Clasificadores respectivos;
  • códigos de consolidación Objetos teniendo el mismo significado en diferentes ERP. Por ejemplo, los elementos correspondientes de los libros de referencia de diferentes ERP pueden tener el mismo significado, por ejemplo, esta es la misma contraparte. La tarea de consolidación de códigos se resuelve mediante la construcción de tablas de mapeo, donde se dan varios códigos de los mismos objetos a la unidad.

En tercer lugar, Facubi lanza el procedimiento estándar para actualizar los datos del proceso Cuba (a partir de los procedimientos de los procedimientos de utilidad SSAS).

Según las listas de control, el programa Facubi envía mensajes de correo sobre el progreso de los pasos de procesamiento.

Siguiendo Facubi, el programador de tareas se lanza varias veces. archivos de ExcelEn qué informes basados \u200b\u200ben los indicadores OLAP Cuba se crean de antemano. Como dijimos, MS Excel tiene una interfaz de programación especial (separadamente descargable o controlador incorporado) para trabajar con cubos OLAP (con SSA). Cuando se inicia MS Excel, los programas se incluyen en programas de MS VBA (tipo MACROS) que proporcionan datos de actualización en los informes; Informes si es necesario, modificado y enviado por correo (programa BLAT) a los usuarios de acuerdo con las listas de control.

Los usuarios de la red local que tienen acceso al servidor SSAS recibirán los informes "en vivo" configurados para OLAP CUBE. (En principio, ellos mismos, sin ningún correo, pueden actualizar los informes OLAP en MS Excel que se encuentran en ellos. computadoras locales). Los usuarios fuera de la red local o recibirán informes originales, pero con una funcionalidad limitada, o para ellos (después de actualizar los informes OLAP en MS Excel), se calcularán los informes especiales "muertos" que no accedan al servidor SSAS.

Evaluación de resultados

Hablamos anteriormente sobre OLTP y OLAP SYNCHRONISMO. En esta versión de la tecnología, el ciclo de actualización del cubo OLAP se realiza por la noche (por ejemplo, comienza a la 1 en punto). Esto significa que en el día laboral actual, los usuarios trabajan con los datos de ayer. Dado que OLAP no es un medio de registro (para ver el último tablero editorial), y los medios de administración (entienden la tendencia del proceso), un retraso que generalmente no es crítico. Sin embargo, si es necesario, incluso en la versión descrita de la arquitectura Cuba (MOLAP), la actualización es posible pasar varias veces al día.

El tiempo de ejecución de los procedimientos de actualización depende de las características del diseño de la OLAP-CUBE (complejidad mayor o menor, definiciones más o menos exitosas de indicadores y recortes) y en el volumen de bases de datos de sistemas OLTP externos. De acuerdo con la experiencia del procedimiento de construcción de almacenes, tome de unos pocos minutos a dos horas, el procedimiento de actualización de Cuba (proceso): de 1 a 20 minutos. Estamos hablando de cubos complejos de OLAP, uniendo decenas de etapas del tipo "asterisco", sobre docenas de "rayos" generales (recortes de controversia) para ellos, alrededor de cientos de indicadores. Evaluación de los volúmenes de bases de datos de sistemas ERP externos en los documentos de envío, estamos hablando de cientos de miles de documentos y, en consecuencia, millones de marcas registradas por año. La profundidad histórica de procesamiento, que está interesada en el usuario, fue de tres a cinco años.

La tecnología descrita se opera en varias grandes corporaciones: desde 2008 en la "Compañía de pescado rusa" (RRK) y el Mar Ruso (PM), desde 2012 en Santa Bremor (SAT). Parte de las corporaciones es la ventaja de las empresas de negociación y adquisición (RRK), otras: producción (plantas para el procesamiento de peces y mariscos RM y SAT). Todas las corporaciones son propiedades grandes que combinan varias empresas con sistemas de contabilidad de computadora independientes y diferentes, desde sistemas ERP estándar de TIPO 1C7 y 1C8 y terminan con la base de datos de DBF y Excel de "reliquia". Agregaré que la tecnología operativa descrita de OLAP-Cubes (excluyendo la fase de desarrollo), ya sea, en absoluto requiere empleados especiales, o se incluye en los Términos de cargo de un Analytics Business Analytics. La tarea de los años está girando en modo automático, todos los días que suministran varias categorías de personal corporativo con informes actuales.

Decisiones de pros y contras

Como muestra la experiencia, la opción de la solución propuesta es bastante confiable y fácil de operar. Se modifica fácilmente (conectar / deshabilitar nuevo ERP, creando nuevos indicadores y recortes, creación y modificación de informes de Excel y listas de su lista de correo) con la invariabilidad del programa de control Facubi.

MS Excel, ya que una interfaz OLAP proporciona suficiente expresividad y le permite unirse rápidamente a la tecnología OLAP a diferentes categorías de empleados de oficina. El usuario recibe informes diarias de OLAP "estándar"; El uso de la interfaz MS Excel con OLAP, puede crear independientemente informes OLAP en MS Excel. Además, el usuario puede continuar de forma independiente el estudio de la información OLAP informa utilizando las características habituales de su MS Excel.

La base de datos "refinada" del almacén, en la cual se consolidó (durante la construcción del cubo), varios sistemas de ERP heterogéneos, incluso sin ningún OLAP, le permiten resolver (en el servidor SSAS, método de las solicitudes en el idioma SQL de Transact o SP et al.) Muchas tareas de gestión de control. Recuerde, la estructura del almacén BD está unificada y sustancialmente más fácil (en términos de la cantidad de tablas y números de tablas de tablas) que la estructura de la BD del ERP original.

Notamos especialmente que en la decisión que sugerimos, es posible consolidarse en una OLAP Cuba de varios sistemas ERP. Esto le permite obtener análisis a lo largo de la celebración y mantener muchos años de continuidad en el analista al cambiar la corporación a otro sistema ERP de la cuenta, digamos al cambiar de 1C7 a 1C8.

Utilizamos el modelo Molap Cuba. Los profesionales de este modelo son la fiabilidad de la operación y el procesamiento de alta velocidad de las solicitudes de usuario. Contras - OLAP y asincronismo OLTP, así como grandes cantidades de memoria para el almacenamiento OLAP.

En conclusión, damos otro argumento a favor de OLAP, que puede haber sido más relevante para la Edad Media. Dado que su evidencia está descansando sobre el crédito. El modesto, obviamente subestimado el Matemático Británico E. CODD a fines de los años 60 desarrolló la teoría de las bases de datos relacionales. La fuerza de esta teoría fue tal que ahora, después de 50 años, ya es difícil encontrar una base de datos no relacionada y una base de datos de una base de datos que no sea SQL.

La tecnología OLTP basada en la teoría de la base de datos relacional fue la primera idea de E. CODD. De hecho, el concepto de onlap-cubos es la segunda idea expresada por él a principios de la década de 1990. Ni siquiera ser un matemático, es muy posible esperar que la segunda idea sea tan efectiva como la primera. Es decir, en términos de analíticos informáticos, la idea de OLAP será capturada pronto por el mundo y todos los demás serán suministrados. Solo porque el tema de los analistas encuentra su solución matemática exhaustiva en OLAP, y esta decisión es "adecuadamente" (Término B. Spinoza) de la tarea práctica de Analytics. "Adecuadamente" significa Spinoza, eso y Dios mismo no aparecería ...

  1. Larson B. Desarrollo de la inteligencia empresarial en Microsoft SQL Server 2005. - SPB.: "Peter", 2008.
  2. CODD E. RELACIONAL COMPLETENCIA DE LA BASE DE DATOS SUBLAGUAGES, SISTEMAS DE BASE DE DATOS, CORTANTE CIENCIA CIENCIA SIPUSIA SUMPOSIA 1972, v. 6, Anclips de Englwood, N.Y., Prentice - Hall.

En contacto con

En el artículo anterior. de este ciclo (Consulte No. 2'2005) Hablamos sobre las principales innovaciones de los servicios analíticos de SQL Server 2005. Hoy consideramos los medios para crear soluciones OLAP que se incluyen en este producto.

Brevemente sobre los conceptos básicos de OLAP

a directamente para iniciar una conversación sobre la creación de soluciones OLAP, recordamos que OLAP (procesamiento analítico en línea) es una tecnología integral de análisis de datos multidimensional, cuyo concepto se describió en 1993 por EF Koddom, el famoso autor de la Relacional modelo de datos. Actualmente, el soporte OLAP se implementa en muchos DBMS y otros instrumentos.

OLAP-CUBA

¿Qué son los datos OLAP? Como respuesta a esta pregunta, considere el ejemplo más simple. Supongamos que, en la base de datos corporativa de alguna empresa, hay un conjunto de tablas que contienen información sobre las ventas de bienes o servicios, y según las facturas, el país (país), la ciudad (país), el nombre personalizado, el país, el vendedor (ventas del gerente), ordenado. (Fecha de colocación de pedidos), CategoríaNombre (categoría de producto), nombre de producto, Nombre de Shipper (Compañía Carrier), PRIPCIONES EXTENDIDOS (pago para productos), mientras que el último de los campos listados, en realidad, es un objeto de análisis.

La selección de datos de dicha vista se puede implementar utilizando la siguiente consulta:

Seleccionar país, ciudad, personal de personal, vendedor,

Pedido, Nombre de Categoría, Nombre de Producto, Nombre de Shipper, PRIPCION EXTENDIENTE

De las facturas.

Supongamos que estamos interesados \u200b\u200ben cuál es el costo total de los pedidos realizados por los clientes de diferentes países. Para obtener una respuesta a esta pregunta, debe hacer la siguiente consulta:

Seleccione País, Suma (ExtendedPrecio) de Facturas

Grupo por país.

El resultado de esta consulta será un conjunto unidimensional de datos agregados (en este caso: montos):

País. Suma (prontio extendido)
Argentina 7327.3
Austria. 110788.4
Bélgica. 28491.65
Brasil. 97407.74
Canadá. 46190.1
DINAMARCA. 28392.32
Finlandia. 15296.35
Francia. 69185.48
209373.6
...

Si queremos saber cuál es el costo total de los pedidos realizados por los clientes de diferentes países y entregamos varios servicios de entrega, debemos ejecutar una solicitud que contenga dos parámetros en grupo de propuestas. Por:

Selecty, ShipperName, Sum (ExtendedPrecio) de Facturas

Grupo por país, ShipperName

Sobre la base de los resultados de esta consulta, puede crear una tabla de la siguiente forma:

Este conjunto de datos se denomina tabla consolidada (tabla PIVOT).

Selección, nombre de Shipper, Suma de vendedores (ExtendedPrecio) de Facturas

Grupo por país, Nombre de Shipper, Año

Sobre la base de los resultados de esta solicitud, puede construir un cubo tridimensional (Fig. 1).

Agregar parámetros adicionales para el análisis, puede crear un cubo con un número teóricamente cualquier número de mediciones, mientras que, junto con las cantidades en las células OLAP, pueden contener los resultados de calcular otros funciones agregadas (Por ejemplo, mediano, máximo, valores mínimos, el número de registros de representación inicial correspondientes a este conjunto parámetros). Campos basados \u200b\u200ben qué resultados se calculan se denominan medidas de cubo.

Jerarquía en mediciones.

Supongamos que estamos interesados \u200b\u200bno solo por el costo total de los pedidos realizados por los clientes en diferentes países, sino también el valor total de los pedidos realizados por los clientes en diferentes ciudades de un país. En este caso, puede usar el hecho de que los valores aplicados en el eje tienen diferentes niveles de detalle, esto se describe como parte del concepto de la jerarquía de cambios. Diga, en el primer nivel de la jerarquía hay países, en las segundas ciudades. Cabe señalar que desde SQL Server 2000, los servicios analíticos soportan las llamadas jerarquías desequilibradas que contienen, por ejemplo, a dichos miembros cuyos niños no están contenidos en los niveles vecinos de jerarquía o ausentes para algunos miembros del cambio. Un ejemplo típico de una jerarquía de este tipo es la consideración del hecho de que en diferentes países puede haber unidades tan administrativas-territoriales, como el personal o un área ubicada en una jerarquía geográfica entre países y ciudades (Fig. 2).

Tenga en cuenta que recientemente, las jerarquías típicas se han asignado, por ejemplo, que contienen datos geográficos o temporales, así como mantener la existencia de varias jerarquías en una dimensión (en particular, para el año calendario y fiscal).

Creando cubos OLAP en SQL Server 2005

Los cubos de SQL Server 2005 se crean utilizando SQL Server Business Intelligence Development Studio. Esta herramienta es una versión especial de Visual Studio 2005, diseñada para resolver esta clase de tareas (y si ya hay un entorno de desarrollo fijo, la lista de plantillas del proyecto se actualiza con proyectos diseñados para crear soluciones basadas en SQL Sever y sus servicios analíticos) . En particular, la plantilla del proyecto de Analysis Services está diseñada para crear soluciones basadas en servicios analíticos (Fig. 3).

Para crear un cubo OLAP, en primer lugar, debe resolverse, en función de los datos para formarlo. La mayoría de las veces, los cubos OLAP se basan en la base de los almacenes de datos relacionales con los esquemas de "Star" o "Snowflake" (nos dijeron sobre la parte anterior del artículo). En el kit de entrega de SQL, hay un ejemplo de tal almacenamiento: la base de datos de AdventureWorksDW, para usar la cual se debe encontrar la carpeta de fuentes de datos como fuente, seleccione el nuevo elemento del menú Context Fuente de datos y responda sistemáticamente a las preguntas de la Asistente (Fig. 4).

Luego, se recomienda crear una vista de origen de datos, una vista basada en la que se creará un cubo. Para hacer esto, seleccione el elemento apropiado de la carpeta Vistas de la fuente de datos y responda constantemente al asistente. El resultado de las acciones especificadas será el diagrama de datos mediante el cual se construirán las fuentes de datos, y en el esquema resultante, en lugar del original, puede especificar nombres de tablas "amigables" (Fig. 5).

El cubo descrito de esta manera se puede transferir al servidor de servicio analítico seleccionando la opción Implementar en el menú contextual del proyecto y ver sus datos (Fig. 7).

Al crear cubos, se utilizan muchas características. nueva versión SQL Server, como la presentación de fuentes de datos. El contenido de los datos de origen para la construcción del cubo, así como la descripción de la estructura del cubo, ahora se produce utilizando un amigo para muchos desarrolladores de herramientas de estudio visual, que es una ventaja considerable de la nueva versión de este producto. - Se minimiza el estudio de los desarrolladores de soluciones analíticas del nuevo kit de herramientas en este caso.

Tenga en cuenta que en la Cuba creada, puede cambiar la composición de las medidas, eliminar y agregar atributos de medición y agregar atributos calculados de miembro de medición según los atributos disponibles (Fig. 8).

Higo. 8. Añadiendo un atributo calculado

Además, en los cubos de SQL Server 2005, puede realizar la agrupación automática o la clasificación de miembros de medición mediante el valor del atributo, para determinar los enlaces entre atributos, implementar los enlaces "muchos a muchos", identificar indicadores clave de negocios, así como resolver Muchas otras tareas (detalles sobre cómo se realizan todas estas acciones, puede encontrar en sección SQL Servicios de análisis de servidores Sistema de referencia de tutoriales de este producto).

En las partes posteriores de esta publicación, continuaremos familiarizándonos con los servicios analíticos de SQL Server 2005 y descubriremos lo que ha aparecido en el área de soporte de la minería de datos.

Lo que hoy es OLAP, en general conoce a todos los expertos. Al menos, los conceptos de "OLAP" y "datos multidimensionales" están conectados constantemente en nuestra conciencia. Sin embargo, el hecho de que este tema se levante de nuevo, espero, seré aprobado por la mayoría de los lectores, ya que no está desactualizado por la idea de nada con el tiempo, debe comunicarse periódicamente con personas inteligentes o leer artículos en una buena edición. ...

Almacén de datos (lugar OLAP en estructura de información empresas)

El término "OLAP" está inextricablemente vinculado con el término "Warehouse de datos" (almacén de datos).

Damos una definición formulada por los almacenes de datos de "Founder Fountder" Bill Inmona: "Data Warehouse es un tiempo orientado al sujeto y una recopilación de datos inmutables para respaldar el proceso de tomar decisiones de gestión".

Los datos en el repositorio caen de sistemas operativos (sistemas OLTP), que están diseñados para automatizar los procesos de negocios. Además, el almacenamiento se puede reponer debido a fuentes externas, como informes estadísticos.

¿Por qué construir almacenes de datos, después de todo, contienen información redundante a sabiendas, que vive "en vivo" en bases de datos o archivos del sistema operativo? Puede responder brevemente: analizar los datos de los sistemas operativos no es directamente imposible o muy difícil. Esto se explica por varias razones, incluido el escáner de datos, almacenando en los formatos de varios DBMS y en diferentes "rincones" de la red corporativa. Pero incluso si en la empresa, todos los datos se almacenan en el servidor de la base de datos central (que es extremadamente raro), el analista casi seguramente no se averigua en sus estructuras complejas, a veces intrincadas. El autor tiene una experiencia suficientemente triste de intentos de "alimentar a los analistas hambrientos", los datos crudos de los sistemas operativos, resultó ser "no en los dientes".

Por lo tanto, la tarea del repositorio es proporcionar "materias primas" para analizar en un solo lugar y en una estructura simple y comprensible. Ralph Kimball En el prefacio de su libro "El kit de herramientas del almacén de datos" escribe que si el lector entenderá solo una cosa en la lectura de todo el libro, a saber: la estructura de almacenamiento debe ser simple, el autor considerará su tarea.

Hay otra razón por la que justifica la apariencia de un repositorio separado: las solicitudes analíticas complejas para la información operativa inhiben el trabajo actual de la empresa, bloqueando las tablas durante mucho tiempo y la captura de recursos del servidor.

En mi opinión, bajo el almacenamiento, puede entender no necesariamente una acumulación de datos gigantes: lo principal es que es conveniente para el análisis. En términos generales, un término separado: los Martes de datos (quioscos de datos) están destinados a instalaciones de almacenamiento pequeñas, pero en nuestra práctica rusa, no lo escucha a menudo.

OLAP - Herramienta de análisis cómodo

La centralización y la estructuración conveniente no es todo lo que se necesita por análisis. Todavía requiere una herramienta para ver, visualizar información. Los informes tradicionales, incluso construidos sobre la base de un solo almacenamiento, están privados de una flexibilidad. No pueden ser "Twist", "implementar" o "colapso" para obtener la presentación de datos deseada. Por supuesto, puede llamar a un programador (si quiere venir), y él (si no está ocupado) hará un nuevo informe rápidamente, digamos, durante una hora (no creo y no creo, tan rápidamente en La vida no hay nadie; le damos tres horas). Resulta que el analista puede verificar por un día no más de dos ideas. Y él (si es un buen analista), tales ideas pueden llegar a la cabeza varias por hora. Y cuanto más se ve las "secciones" y "Cuts" de estos analistas, mayores las ideas que, a su vez, requieren todos los "recortes" nuevos y nuevos para verificar. ¡Esa sería su herramienta que permitiría implementar y convertir los datos de manera simple y cómoda! Como tal herramienta y realiza OLAP.

Aunque OLAP no es un atributo necesario del almacén de datos, se usa cada vez más a menudo para analizar la información acumulada en este almacenamiento.

Los componentes incluidos en el almacenamiento típico se presentan en la FIG. uno.

Higo. 1. Estructura de almacén de datos

Los datos operativos se recopilan de varias fuentes, se limpian, se integran y se plegan en el almacenamiento relacional. Al mismo tiempo, ya están disponibles para su análisis utilizando diversos medios de creación de informes. Luego se prepara datos (total o parcialmente) para el análisis OLAP. Se pueden cargar en una base de datos especial OLAP o se deja en un almacenamiento relacional. El elemento más importante es el metadato, es decir, la información sobre la estructura, la colocación y la transformación de los datos. Gracias a ellos, se garantiza la interacción efectiva de varios componentes de almacenamiento.

Summing Up, es posible determinar OLAP como un conjunto de medios de análisis multidimensional de los datos acumulados en el repositorio. Teóricamente, las herramientas OLAP se pueden aplicar directamente a los datos operativos o sus copias exactas (para no interferir con los usuarios operativos). Pero, por lo tanto, está arriesgando a pisar el rastrillo ya descrito anteriormente, es decir, comenzar a analizar los datos operativos que no son adecuados para su análisis.

Definición y conceptos básicos OLAP

Para empezar, descifrado: OLAP es un procesamiento analítico en línea, es decir, análisis de datos operativos. 12 Los principios definitorios de OLAP formulados en 1993. E. F. CODD - Base de datos relacional "Inventor". Más tarde, su definición se volvió a trabajar en la llamada prueba FASMI, que requiere la aplicación OLAP para proporcionar la capacidad de analizar rápidamente la información multidimensional compartida ().

Prueba fasmi

Rápido. (Rápido): el análisis debe hacerse igualmente rápidamente en todos los aspectos de la información. Un tiempo de respuesta aceptable es 5 S o menos.

Análisis. (Análisis) - debería poder llevar a cabo los tipos principales de numéricos y análisis estadísticopredeterminado por el desarrollador de aplicaciones o definido arbitrariamente por el usuario.

Compartido. (Compartido): muchos usuarios deben tener acceso a los datos, es necesario monitorear el acceso a la información confidencial.

Multidimensional (Multidimensional) es la característica principal y más importante OLAP.

Información (Información) - La solicitud debe poder contactar a cualquier información necesaria, independientemente de su ubicación de volumen y almacenamiento.

OLAP \u003d Vista multidimensional \u003d CUBO

OLAP ofrece herramientas convenientes de acceso de alta velocidad, visualizando y analizando información comercial. El usuario recibe un modelo de datos natural e intuitivo, organizándolos en forma de cubos multidimensionales (cubos). Los ejes del sistema de coordenadas multidimensionales sirven como los principales atributos del proceso de negocio analizado. Por ejemplo, para las ventas, puede ser un producto, región, tipo de comprador. El tiempo se utiliza como una de las medidas. En las intersecciones de los ejes de medición (dimensiones), hay datos, caracterizando cuantitativamente el proceso: medidas (medidas). Estos pueden ser volúmenes de ventas en piezas o en términos monetarios, los restos en stock, costos, etc. La información que analiza el usuario puede "cortar" un cubo en diferentes direcciones, obtener consolidado (por ejemplo, por año) o, por el contrario, Información detallada (durante semanas) y ejerce otras manipulaciones que vendrán a la mente en el proceso de análisis.

Como medidas en una cuba tridimensional mostrada en la FIG. 2, se utilizan cantidades de ventas, y como medida: tiempo, producto y tienda. Las mediciones se presentan en ciertos niveles de agrupación: los productos se agrupan por categorías, talleres, por país y datos en el momento de las operaciones, por meses. Un poco más tarde, veremos más los niveles de agrupación (jerarquía).


Higo. 2. Ejemplo Cuba

Cubo cubo

Incluso el cubo tridimensional es difícil de mostrar en la pantalla de la computadora para que los valores de las medidas de interés sean visibles. ¿Qué podemos hablar de cubos con el número de mediciones, los tres grandes? Para visualizar los datos almacenados en Cuba, generalmente son habituales bidimensionales, es decir, representaciones tabulares, que tienen títulos complejos jerárquicos de filas y columnas.

La vista bidimensional del cubo se puede obtener al "cortar" a través de uno o más ejes (mediciones): fijamos los valores de todas las mediciones, excepto dos, y obtenemos una tabla de dos dimensiones convencional. En el eje horizontal de la tabla (encabezados de columna), se presenta una medición, en la vertical (encabezados de cadena), la otra, y en las celdas de la tabla, los valores de las medidas. En este caso, el conjunto de medidas se considera en realidad como una de las mediciones: seleccionamos una medida (y luego podemos colocar dos dimensiones en los encabezados y columnas), o mostrar varias medidas (y luego una de las tablas a Tome el nombre de las medidas, y el otro, los valores de la única medición "no adoptada").

Eche un vistazo a la Fig. 3 - Aquí hay un corte bidimensional Cuba para una medida: ventas de la unidad (unidades vendidas) y dos mediciones "indiscutibles": tienda (tienda) y tiempo (tiempo).


Higo. 3. Rebanada de cubo bidimensionales para una medida

En la Fig. 4 Muestra una sola tienda "no adoptada", pero los valores de varias medidas se muestran aquí, las ventas de la unidad (vendidas), las ventas de la tienda y el costo de la tienda (gastos de la tienda).


Higo. 4. Rebanada de cubos bidimensionales para varias medidas.

La vista bidimensional de la Cuba es posible y cuando se mantiene "continuados" y más de dos dimensiones. Al mismo tiempo, se colocarán dos o más mediciones del cubo "Corte" en los ejes de corte (líneas y columnas): vea la FIG. cinco.


Higo. 5. Rebanada de cubo bidimensionales con varias medidas en un eje

Etiquetas

Los valores, "pospuestos" a lo largo de las mediciones se denominan miembros o marcas (miembros). Las etiquetas se usan tanto para el "corte" del cubo, y para limitar (filtrado) de los datos seleccionados, cuando se encuentran en la medición restante "incomprensible", no somos todos los valores, sino su subconjunto, por ejemplo, tres ciudades de varios docena. Los valores de las etiquetas se muestran en una vista de cubos bidimensionales como encabezados de cadena y columnas.

Jerarquías y niveles.

Las etiquetas se pueden combinar en jerarquías que constan de uno o más niveles (niveles). Por ejemplo, las etiquetas de medición "Tienda" (tienda) se combinan naturalmente en una jerarquía con niveles:

País (país)

EXPRESAR

Ciudad (ciudad)

Tienda (tienda).

De acuerdo con los niveles de jerarquía, se calculan los valores agregados, como las ventas para los EE. UU. (Nivel de país) o California (nivel estatal). En una dimensión, puede implementar más de una jerarquía, digamos, por tiempo: (año, trimestre, mes, día) y (año, semana, día).

Arquitectura de aplicaciones OLAP

Todo lo que se mencionó anteriormente OLAP, de hecho, se relaciona con la presentación de datos multidimensionales. La forma en que se almacenan los datos, no se encargan de que no se preocupe si el usuario final ni los desarrolladores de herramientas al que usa el cliente.

La multidimensionalidad en las aplicaciones OLAP se puede dividir en tres niveles:

  • Representación de datos multidimensionales: herramientas de usuario final que proporcionan visualización multidimensional y manipulación de datos; La capa de representación multidimensional se abstiene de la estructura de datos físicas y percibe los datos como multidimensionales.
  • Procesamiento multidimensional: medios (idioma) de formular consultas multidimensionales (relacional tradicional lenguaje SQL Resulta que no es adecuado) y el procesador que puede procesar y ejecutar dicha solicitud.
  • Almacenamiento multidimensional - Medios organización física Datos para garantizar la ejecución efectiva de consultas multidimensionales.

Los dos primeros niveles están necesariamente presentes en todas las herramientas OLAP. El tercer nivel, aunque está generalizado, no se requiere, ya que los datos para la representación multidimensional pueden eliminarse de las estructuras relativas ordinarias; El procesador de consulta multidimensional en este caso traduce las solicitudes multidimensionales a las consultas SQL que se ejecutan por DBMS relacional.

Los productos OLAP específicos, por regla general, son un medio de representación de datos multidimensionales, un cliente OLAP (por ejemplo, tablas de pivotes en las empresas de Excel 2000 de Microsoft o PROCLARITY de la compañía Knosys), o un servidor multidimensional DBMS, OLAP Server (para obtener Ejemplo, Servidor de Oracle Express o Microsoft OLAP Services).

La capa de procesamiento multidimensional generalmente está incrustada en el cliente OLAP y / o en el servidor OLAP, pero se puede resaltar en forma pura, como el componente de servicio de tabla de pivote de Microsoft.

Aspectos técnicos del almacenamiento de datos multidimensionales.

Como se mencionó anteriormente, las herramientas de análisis OLAP pueden extraer datos y directamente de los sistemas relacionales. Tal enfoque fue más atractivo en aquellos momentos en que los servidores OLAP estaban ausentes en las hojas de precios de los principales fabricantes de DBMS. Pero hoy y Oracle, e Informix, y Microsoft ofrecen servidores OLAP completos, e incluso aquellos gerentes de TI que no les gusta reproducirse en sus redes "zoológico" de diferentes fabricantes pueden comprar (más precisamente, para aplicarse a la administración de la compañía) Servidor OLAP de la misma marca que el servidor de base de datos principal.

Los servidores OLAP, o servidores de base de datos multidimensionales, pueden almacenar sus datos multidimensionales de diferentes maneras. Antes de considerar estas formas, tenemos que hablar de tal un aspecto importanteComo el almacenamiento de agregados. El hecho es que en cualquier almacén de datos, tanto de lo habitual, como en una multidimensional, junto con los datos detallados extraídos de los sistemas operativos, se almacenan los indicadores totales (indicadores agregados, agregados), como la cantidad de volúmenes de ventas por meses, Por las categorías Bienes, etc. Los agregados se almacenan explícitamente con el único propósito, para acelerar la ejecución de las solicitudes. Después de todo, por un lado, el almacenamiento se acumula, como regla general, una gran cantidad de datos, y, por otro lado, en la mayoría de los casos, no detallados, pero los indicadores generalizados están interesados. Y si cada vez que tuviera que resumir millones de ventas individuales para el año para calcular el monto de las ventas, la velocidad más probable es que haya sido inaceptable. Por lo tanto, al cargar datos en bases de datos multidimensionales, todos los indicadores totales o su parte se calculan y guardan.

Pero, como saben, tienes que pagar por todo. Y para la velocidad de procesamiento de solicitudes en los datos totales, es necesario pagar un aumento en las cantidades de datos y tiempo en su descarga. Además, un aumento en el volumen puede ser literalmente catastrófico, en una de las pruebas estándar publicadas, un conteo completo de unidades para 10 MB de datos de origen requeridos de 2.4 GB, es decir, los datos aumentaron 240 veces. El grado de "hinchazón" de los datos al calcular las unidades depende del número de mediciones de cubo y la estructura de estas mediciones, es decir, la relación de la cantidad de "padres" y "niños" en diferentes niveles de medición. Para resolver el problema del almacenamiento de agregados, a veces se aplican esquemas complejos, lo que permite no todos los agregados posibles al calcular, para lograr un aumento significativo en el desempeño de las consultas.

Ahora sobre varias opciones de almacenamiento. Ambos datos y agregados detallados se pueden almacenar en estructuras relacionales o multidimensionales. El almacenamiento multidimensional permite que los datos sean tratados como una matriz multidimensional, lo que garantiza los mismos cálculos rápidos de los indicadores totales y varias transformaciones multidimensionales de acuerdo con cualquier medida. Hace algún tiempo, los productos OLAP apoyaron el almacenamiento relacional o multidimensional. Hoy, como regla general, el mismo producto proporciona ambos tipos de almacenamiento, así como el tercer tipo: mixto. Se aplican los siguientes términos:

  • MOLAP. (OLAP multidimensional), y los datos detallados, y los agregados se almacenan en una base de datos multidimensional. En este caso, se obtiene la mayor redundancia, ya que los datos multidimensionales contienen plenamente relacionados.
  • Rolap. (Relacional OLAP): los datos detallados permanecen donde "vivieron" inicialmente en la base de datos relacional; Los agregados se almacenan en la misma base de datos en tablas de servicios especialmente creadas.
  • Hollar (OLAP HYBRID): los datos detallados permanecen en su lugar (en la base de datos relacionales), y las unidades se almacenan en una base de datos multidimensional.

Cada uno de estos métodos tiene sus ventajas y desventajas y debe aplicarse dependiendo de las condiciones, la cantidad de datos, la potencia de los DBM relacional, etc.

Al almacenar datos en estructuras multidimensionales, se produce el problema potencial de "hinchazón" debido al almacenamiento de valores vacíos. Después de todo, si la matriz multidimensional está reservada en todas las combinaciones posibles de las marcas de medición, y solo una pequeña parte (por ejemplo, una serie de productos se venden solo en un pequeño número de regiones), entonces Bo / incluso parte del cubo volará Estar vacío, aunque el lugar será ocupado. Los productos OLAP modernos pueden hacer frente a este problema.

Continuará. En el futuro, hablaremos sobre productos OLAP específicos fabricados por los principales fabricantes.

OLAP no es un producto de software separado, no un lenguaje de programación y ni siquiera una tecnología específica. Si intenta cubrir OLAP en todas sus manifestaciones, este conjunto de conceptos, principios y requisitos que subyacen a los productos de software que facilitan el acceso a los datos. Descubrir para qué Los analistas necesitan de alguna manera especialmente facilitar Acceso a los datos.

El hecho es que los analistas son consumidores especiales de información corporativa. Análisis de tareas: encontrar regularidades en grandes matrices de datos. Por lo tanto, el analista no prestará atención a un hecho separado que el jueves se vendió el cuarto número de la contraparte de Chernov por una fiesta de tinta negra, necesitaba información. alrededor de cientos y miles Eventos similares. Los hechos individuales en la base de datos pueden estar interesados, por ejemplo, un contador o jefe del departamento de ventas, cuya competencia es la transacción. El análisis de un registro no es suficiente: para él, por ejemplo, es posible que necesiten todas las transacciones de esta rama o representación para el mes, año. Al mismo tiempo analista lanza lejos Detalles innecesarios como el comprador de la posada, su dirección exacta y su número de teléfono, el índice de contrato y similares. Al mismo tiempo, los datos que requieren análisis para trabajar deben contener necesariamente valores numéricos, esto se debe a la mayoría de las actividades de sus actividades.

Entonces, el analista necesita muchos datos, estos datos son selectivos, y también se preocupan " conjunto de atributos - Número". Este último significa que el analista trabaja con las siguientes tablas:

Aquí " País", "Producto", "Año"son atributos o mediciones, pero " Volumen de ventas"De este modo, el valor numérico o la medida. La tarea analítica, la repetición, es identificar las relaciones persistentes entre los atributos y los parámetros numéricos.. Mirando la mesa, se puede observar que se puede traducir fácilmente en tres dimensiones: en uno de los ejes que posponemos a los países, por otro lado, los bienes, en el tercero. Y los valores en esta matriz tridimensional tendremos los volúmenes de ventas correspondientes.

Presentación tridimensional de la tabla. El segmento gris se muestra que para Argentina en 1988 no hay datos

Esa es la matriz tridimensional en términos de OLAP y se llama CUBE. De hecho, desde el punto de vista de las matemáticas estrictas, tal matriz no siempre será: en esta Cuba, el número de elementos en todas las dimensiones debe ser el mismo, y no hay tales restricciones de los cubos OLAP. Sin embargo, a pesar de estos detalles, el término "Cuba OLAP" debido a su brevedad y la imagen se aceptó en general. Olap Cube no necesariamente tiene que ser tridimensional. Puede ser de dos y multidimensionales, dependiendo de la tarea siendo resuelta. Particularmente los analistas de MATE pueden necesitar aproximadamente 20 mediciones, y los productos OLAP graves están en tal cantidad y calculados. Aplicaciones de escritorio más simples Soporte en algún lugar 6 mediciones.

Mediciones Los cubos OLAP consisten en los llamados mETERS. o miembros (miembros). Por ejemplo, la medición del "país" consiste en las marcas "Argentina", Brasil, "Venezuela", etc.

No se deben llenar todos los elementos de Cuba: si no hay información sobre las ventas de productos de caucho en Argentina en 1988, el valor en la celda correspondiente simplemente no se determinará. También es absolutamente opcionalmente que la aplicación OLAP almacene los datos sin duda en una estructura multidimensional, lo principal es que para el usuario se ve así. Por cierto, son métodos especiales precisamente para el almacenamiento compacto de datos multidimensionales, "vacío" (elementos sin rellenar) en los cubos, no conducen a un tiempo de memoria inútil.

Sin embargo, el Cube en sí no es adecuado para su análisis. Si aún puede enviar o representar adecuadamente un cubo tridimensional, entonces de seis o diecieteiméteres es mucho peor. por lo tanto antes de usar de cubo multidimensional tablas bidimensionales. Esta operación se llama CUBO "CORTE". Este término, de nuevo, con forma. Analista como si toma y "corta" las mediciones de la Cuba por sus intereses. De esta manera, el analista recibe una Cuba de corte bidimensional y funciona con él. Aproximadamente los mismos loggers consideran los anillos anuales en el hechizo.

En consecuencia, solo dos dimensiones permanecen "continuadas", según el número de mediciones de tabla. Sucede, solo la medición permanece "sin cortar": si el cubo contiene varios tipos de valores numéricos, se pueden posponer una de las mediciones de la tabla.

Si aún se ve más estrechamente en la tabla, en la que se nos mostró primero, puede ver que los datos en él son más probables que no son primarios, y se obtienen como resultado suma Para elementos más pequeños. Por ejemplo, un año se divide en bloques, cuartos durante meses, meses durante semanas, semanas durante días. El país consta de regiones y regiones, desde asentamientos. Finalmente, en las propias ciudades, las áreas y los puntos de negociación específicos se pueden distinguir. Los bienes se pueden combinar en grupos de productos básicos, etc. En términos de OLAP, tales uniones de varios niveles son completamente lógicos. jerarquia. Las herramientas OLAP permiten en cualquier momento para cambiar al nivel deseado de la jerarquía. Además, como regla general, se admiten varios tipos de jerarquías para los mismos elementos: por ejemplo, un mes mes a mes o un día de decama. Los datos iniciales se toman de los niveles más bajos de la jerarquía, y luego se resumen para obtener los valores de los niveles más altos. Para acelerar el proceso de transición, los valores resumidos para diferentes niveles se almacenan en Cuba. Por lo tanto, el hecho de que del usuario se vea como un cubo, habla aproximadamente, consiste en una variedad de cubos más primitivos.

Ejemplo de jerarquía

Este es uno de los momentos sustanciales que llevaron a la aparición de OLAP - rendimiento y eficiencia. Imagine lo que sucede cuando el analista necesita recibir información, y no hay herramientas OLAP en la empresa. Un analista de forma independiente (que es poco probable) o el uso del programador hace que la consulta de SQL correspondiente y recibe los datos de interés en el informe o los exporte a la hoja de cálculo. Los problemas surgen un gran conjunto. Primero, el analista se ve obligado a participar para no trabajar con su trabajo (programación de SQL) o esperar la tarea, los programadores se realizarán, todo esto afecta negativamente la productividad del trabajo, los asaltos están aumentando, el infarto y el nivel de trazo y así. En segundo lugar, un solo informe o tabla, por regla general, no guarda a los gigantes del pensamiento y los padres del análisis ruso, y todo el procedimiento deberá repetirse una y otra vez. En tercer lugar, como ya hemos encontrado, los analistas en las triples no preguntan: necesitan todo lo inmediatamente. Esto significa (aunque la técnica y avanza con pasos de siete millas) que el servidor de la DBMS relacionales corporativos a los que se basa el analista, puede pensar en profundidad y durante mucho tiempo, bloqueando las otras transacciones.

El concepto de OLAP apareció específicamente para resolver tales problemas. Cuba Olap es esencialmente meta-informes. Corte META-INFORMES (Cuba, es decir,) para mediciones, el analista recibe, de hecho, los informes bidimensionales "ordinarios" que le interesan (esto no es necesariamente informes en la comprensión habitual de este término, estamos hablando de datos de datos. Estructuras con las mismas funciones). Las ventajas de los cubos son obvias: los datos deben solicitarse a partir de la DBM relacional solo una vez, al crear un cubo. Dado que los analistas, por regla general, no trabajen con información que se complementan y cambien "sobre la marcha", el cubo formado es relevante para un tiempo suficientemente largo. Debido a esto, no solo excluye las interrupciones en la operación del servidor DBMS relacional (no hay consultas con miles y millones de líneas de respuestas), sino que también aumenta bruscamente la velocidad de acceso a los datos para el propio analista. Además, como ya se señaló, el desempeño aumenta y contando las sumas intermedias de jerarquías y otros valores agregados en el momento de construir un cubo. Es decir, si inicialmente nuestros datos contenían información sobre los ingresos diarios de un producto en particular en una tienda por separado, al formar una aplicación OLAP de Cuba considera resultados para diferentes niveles de jerarquías (semanas y meses, ciudades y países).

Por supuesto, para el aumento de esta forma de desempeño es necesario pagar. A veces dicen que la estructura de datos simplemente "explota": el cubo OLAP puede ocupar en docenas e incluso cientos de veces más espacio que los datos de origen.

Responde a las preguntas:

    Qué cúbico OLAP?

    Qué etiquetas Medición específica? Crear ejemplos.

    Pueden ellos medidas En Cuba Olap, contienen valores no numéricos.

En la tabla de resumen estándar, los datos de origen se almacenan en un disco duro local. Por lo tanto, siempre puede administrarlos y reorganizarlos, ni siquiera tener acceso a la red. Pero esto no concierne de ninguna manera las tablas resumidas OLAP. En las mesas OLAP consolidadas, el caché nunca se almacena en un disco duro local. Por lo tanto, inmediatamente después de la desconexión de la red local, su tabla consolidada perderá el rendimiento. No podrás mudarte, no es un solo campo.

Si aún necesita analizar los datos OLAP después de desconectarse de la red, cree un cubo de datos autónomos. El cubo de datos autónomos es un archivo separado que es un caché de tabla de pivote y almacena los datos OLAP que se ven luego después de la desconexión de la red local. Los datos OLAP copiados en la tabla consolidada se pueden imprimir en el sitio http://everest.ua descrito en detalle al respecto.

Para crear un cubo de datos autónomos, primero cree una tabla OLAP consolidada. Coloque el cursor dentro de la tabla consolidada y haga clic en el botón OLAP Herramientas (Herramientas OLAP) de la configuración de la pestaña Contexto (Herramientas), que se incluye en la pestaña Contexto de la pestaña Contexto, trabaje con tablas consolidadas (herramientas pivotables). Selecciona un equipo Modo offline OLAP (Olap Offline) (Fig. 9.8).

El cuadro de diálogo Configuración de cubo autónomo OLAP aparece en la pantalla. Haga clic en el botón Crear archivo de datos sin conexión. Lanzó un asistente de creación de archivos de cubo de datos. Haga clic en el botón Siguiente para continuar con el procedimiento.

Es necesario especificar la dimensión y los niveles que se incluirán en los datos del cubo. En el cuadro de diálogo, seleccione los datos que se importarán desde la base de datos OLAP. La idea es especificar solo aquellas dimensiones que se necesitarán después de desconectar la computadora de la red local. Las más dimensiones indican, cuanto más largo sea el tamaño tendrá un cubo autónomo de datos.

Haga clic en el botón Siguiente para ir a la siguiente caja de diálogo Masters. En él, obtiene la capacidad de especificar miembros o elementos de datos que no se incluirán en el cubo. En particular, no necesitará la medida de la cantidad extendida de ventas de Internet, por lo que la casilla de verificación se descargue en la lista. La casilla de verificación Freeze indica que el elemento especificado no se importará y tomará un exceso de lugar en el disco duro local.

En la última etapa, especifique la ubicación y el nombre de los datos de CUBE. En nuestro caso, el archivo CUBE se llamará myofflinecube.cub y se ubicará en la carpeta de trabajo.

Los archivos cúbicos de datos tienen una extensión. .cachorro

Después de algún tiempo, Excel guardará el cubo autónomo de los datos en la carpeta especificada. Para probarlo, haga doble clic en el archivo, que conducirá a la generación automática del libro de trabajo de Excel, que contiene una tabla consolidada asociada con el cubo de datos seleccionado. Después de crear, puede extender el cubo de datos autónomos entre todos los usuarios interesados \u200b\u200bque trabajan en el modo de red local deshabilitado.

Después de conectarse a la red local, puede abrir un archivo independiente del cubo de datos y actualizarlo, así como la tabla de datos correspondiente. El principio principal establece que el cubo de datos autónomos se aplica solo a trabajar cuando la red local está deshabilitada, pero es obligatoria actualizada después de que se restaure la conexión. El intento de actualizar el cubo autónomo después de romper la conexión causará un fallo.



¿Te gustó el artículo? Compártelo