Kockák adatokat. Hierarchia mérésekben. Hierarchiák és szintek

04/07/2011 Derek

Ha a technológiával kapcsolatos bármely területen kellett foglalkoznia, valószínűleg hallotta a "kocka" kifejezést; Azonban a szokásos adminisztrátorok és adatbázisfejlesztők többsége ilyen tárgyakkal nem működött. A kockák hatékony adatstruktúra a többdimenziós információk gyors aggregációjához. Ha a szervezetnek nagy mennyiségű adatelemzésének elvégzéséhez szükséges, akkor az ideális megoldás lesz a kocka

Mi a kocka?

A relációs adatbázisokat ez több ezer párhuzamos tranzakció elvégzésére tervezték, miközben fenntartja a teljesítményt és az adatintegritást. A formatervezésével a relációs adatbázisok nem biztosítják az aggregációt és a nagy mennyiségű adatkeresést. A nagy mennyiségű adat összesítése és visszaállítása, a relációs adatbázisnak a lekérdezésre vonatkozó lekérdezést kell szereznie, amelyre összegyűjtött és összegyűjtött "a repülésen". Az ilyen relációs kérések nagyon drágák, mivel több vegyületen és összesített funkciókon alapulnak; Különösen hatástalan aggregált relációs kérések nagy adatgyűjtővel dolgoznak.

A kockák többdimenziós entitások, amelyek a relációs adatbázisokban meghatározott hiányt kiküszöbölik. A kocka segítségével olyan adatszerkezetet használhat, amely gyors választ ad a nagy mennyiségű aggregációval rendelkező lekérdezésekre. A kockák elvégzik ezt az "aggregációs mágiát" az adatok előgyűjtésével (mérések) több dimenzióban. A kubai előzetes aggregációját általában a feldolgozás során végzik. A kocka feldolgozásakor a lemezen lévő bináris formában tárolt adatok számított elő-aggregátumát generálja.

Cube központi tervezési adatok az OLAP adatelemző rendszer OLAP elemző SQL Server (SSA). A kockák általában a fő relációs adatbázisból épülnek, amelyet a dimenziók modellnek neveznek, de külön technikai esszenciák. A logikailag kocka olyan adatraktár, amely dimenziókból és mérésekből áll (intézkedések). A dimenzió leíró jellemzőit és hierarchiákat tartalmaz, míg a mérések a dimenziókban leírják a tényeket. A méréseket logikai kombinációkkal kombinálják, amelyeket mérési csoportoknak neveznek. A mérési csoportok dimenzióját a részletek jele alapján köti össze.

A CUBE fájlrendszer a kapcsolódó bináris fájlok sorrendjeként valósul meg. A kubai bináris architektúra megkönnyíti a nagy mennyiségű többdimenziós adatok gyors extrakcióját.

Megemlítettem, hogy a kockák a fő relációs adatbázisból épülnek, a dimenzió modellnek nevezik. A méretek modell tartalmaz relációs táblákat (tényt és dimenziót), amely megköti a kocka entitásaihoz. A ténytáblák méréseket tartalmaznak, például az eladott termék mennyiségét. A dimenziók táblázata leíró jelek, például terméknevek, dátumok és alkalmazottnevek. Jellemzően a gyár a tények és az étkezési méretek társulnak a korlátozásokat az elsődleges külső kulcsot, annak ellenére, hogy a külső gombok vannak a tényleges adatok tábla (ezt relációs kapcsolat összefügg a jele mértékét részletező Kuba, amelyet fent említettünk). Ha a dimenziós táblák közvetlenül kapcsolódnak a ténytáblához, akkor a csillagrendszer alakul ki. Ha a dimenziós táblázatok nem kapcsolódnak közvetlenül a ténytáblához, akkor a hópehely sémát kapjuk.

Felhívjuk figyelmét, hogy a dimenziók modellek az alkalmazás terjedelmétől függően vannak besorolva. Az adatkiállítás a dimenziók modellje, amely egyetlen üzleti folyamatra, például az értékesítésre vagy az állománykezelésére szolgál. Az adatraktár egy dimenziós modell, amelynek célja az összetett üzleti folyamatok fedezésére, így hozzájárul az üzleti folyamatok keresztmetszetéhez.

Szoftverkövetelmények

Most, hogy van egy alapvető megértése, amit Kuba van, és miért fontos, hogy eszközöket fogok tartalmazni, és meghívja Önt egy lépésről-lépésre túra: Építsd meg az első kockát az SSA-k segítségével. Van néhány alapvető elemei a programnak, hogy szükség van, ezért mielőtt az építőiparban az első Kuba, győződjön meg arról, hogy a rendszer megfelel a követelményeknek.

Én például a Cube „Értékesítés az interneten keresztül” fog épülni alapján AdventureWorksdw 2005 teszt tárol. Építek egy teszt kockát egy részét a táblák találhatók a teszt adatbázist, hogy hasznos lesz elemzésére az értékesítési adatok az interneten. Az 1. ábra az adatbázis táblázatok alapdiagramját mutatja. Mivel a 2005-ös verziót használom, követheti az utasításokat, alkalmazza az SQL Server 2005 vagy az SQL Server 2008 alkalmazást.

1. ábra: A kalandok részhalmazai Internetes értékesítési adatok bemutatása

Az Adventure Worksdw 2005 képzési adatbázis megtalálható a Codeplexben: MSFTDBPRODSAMPLES.CODEPLEX.COM. Keresse meg az SQL Server 2005 termékminta adatbázisai még mindig elérhető link (http://codeplex.com/mstdbprodsamples/Release/projectrelelease.aspx?releaseid\u003d4004). A képzési adatbázis tartalmazza a AdventureWorksbi.msi fájlt (http://msftdbprodsamples.codeplex.com/releases/View/4004#DownLoadIdIdIn\u003d11755).

Amint már említettük, hozzáférést kell biztosítani az SQL Server 2008 vagy 2005 példányához, beleértve az SSA-kat és az üzleti intelligencia fejlesztési stúdióját (Ajánlatok) alkatrészeit. Az SQL Server 2008-at fogom használni, így néhány finom különbséget láthat, ha az SQL Server 2005-et használja.

SSAS projekt létrehozása

Az első dolog, amit meg kell tennie, létrehoz egy SSA-projektet az ajánlatok használatával. Keresse meg az ajánlatokat a Start menüben, majd a Microsoft SQL Server 2008/2005 menüben az SQL Server Business Intelligence Fejlesztési Stúdióban. Ha erre a gombra kattint, elindítja az ajánlatokat az alapértelmezett képernyővédő képernyővel. Hozzon létre egy új SSAS projektet a fájl, az új, projekt kiválasztásával. Látni fogja az új projekt párbeszédpanelt (új projekt), amely a képernyőn jelenik meg. Kattintson az OK gombra.

A projekt létrehozásakor kattintson jobb gombbal a megoldás Explorer programban, és válassza a Tulajdonságok tulajdonságait a helyi menüben. Most válassza ki a telepítési szakasz bal oldalán a SQLMAG_MYFIRSTCUBE párbeszédablak: Property Pages és ellenőrizze a beállításokat a cél szerver és adatbázis beállításai, ahogy a képernyőn 2. Ha a munka egy elosztott SQL Server környezetben, akkor meg kell tisztázza a célkiszolgáló tulajdonság értékét, akiket a telepítéshez vezet. Kattintson az OK gombra, ha az SSA-projekt telepített telepítési beállításainak rendezése.

Az adatforrás meghatározása

Az első létrehozandó objektum az adatforrás. Az adatforrás objektum tartalmaz egy köbméteres áramköröket és adatokat, amelyeket egy köbös és az alapobjektumokban található. Az adatforrás objektumának létrehozása az ajánlatokban, használja az adatforrás varázsló adatforrásait.

Indítsa el az adatforrás varázslót egy Kattintson a jobb egérgombbal a Megoldás Explorer panel adatforrás mappájára, az új adatforrás elemről. Meg fogja találni, hogy az SSAS tárgyak létrehozása az ajánlatokban a fejlődés jellege. Először is, a varázsló megtartja Önt az objektum és az általános beállítások létrehozásának folyamatán keresztül. És akkor nyissa meg a kapott SSA-objektumot a tervezőben, és szükség esetén részletesen állítsa be. Amint átadja a meghívót, határozza meg az új kapcsolatot az adatokkal az új gomb megnyomásával. Válassza ki és hozzon létre egy új kapcsolatot a natív Oledb \\ SQL Server natív kliens 10 alapján, jelezve a kívánt SQL kiszolgálót az Ön számára, amely a kívánt adatbázis-példányt birtokolja. Az SQL Server környezetbeállításoktól függően Windows-hitelesítés vagy SQL Server használható. Nyomja meg a Test Connection gombot, hogy megbizonyosodjon arról, hogy helyesen határozza meg az adatbázishoz való kapcsolatot, majd az OK gombot.

Ezután követik a megszemélyesített információkat, amely, valamint az adatokkal való kommunikáció, attól függ, hogy az SQL Server környezet hogyan van elrendezve. A hitelfelvételi jogok a biztonsági kontextus, amelyre az SSA-k támaszkodnak, az objektumok feldolgozása. Ha a fő, az egyetlen kiszolgáló (vagy laptop) telepítését kezeli, a legtöbb olvasó, egyszerűen kiválaszthat egy opciót a Használati fiók szolgáltatás fiókjának használatához. Kattintson a Tovább gombra az adatforrás varázsló befejezéséhez, és állítsa be az AWDW2005 adatforrás nevét. Nagyon kényelmes, hogy ezt a módszert vizsgálati célokra lehet felhasználni, de valós termelési környezetben ez nem a legjobb gyakorlat - használja a szolgáltatási fiókot. Jobb meghatározni a domainfiókokat az SSA-k kapcsolati jogainak hitelfelvételhez egy adatforráshoz.

Az adatforrás ábrázolása

Az Ön által megadott adatforrás a következő lépésben az SSAS kocka építése során létre kell hoznia egy adatforrás nézetet (DSV) nézetet. A DSV lehetővé teszi az áramkör megosztását, amelyet a kocka várható, a fő adatbázis hasonló rendszeréből. Ennek eredményeként a DSV használható a fő relációs rendszer kibővítésére a kocka építkezéskor. Néhány DSV legfontosabb jellemzőit bővíteni adatforrások áramkörök elemzi kéréseket, logikai táblák közötti kapcsolatok és elemzi számított oszlopok.

Menjünk tovább, kattintson jobb gombbal a DSV mappára, és válassza ki az új adatforrás nézet elemet az új DSV nézetek varázsló elindításához. Az Adatforrás kiválasztása párbeszédpanelen válassza ki a kapcsolatot a relációs adatbázishoz, és kattintson a Tovább gombra. Select FactInternetsales, DimProduct, Dimtime, Dimcustomer asztalok, és kattintson az egyetlen nyíl gombot, hogy ezeket a táblázatokat a leírás oszlopban. Végül kattintson a Tovább gombra, és töltse ki a varázslót, az alapértelmezett nevet, és nyomja meg a Befejezés gombot.

Ebben a szakaszban kell egy DSV nézet, amely alatt található a Data Source nézetek mappát Solution Explorer. Kattintson duplán az új DSV-re a DSV konstruktor elindításához. A DSV mind a négy táblázatot meg kell látnia, amint azt a 2. ábra mutatja.

Adatbázis méretek létrehozása

Amint fentebb kifejtettem, a dimenzió leíró méréseket és hierarchiákat tartalmaz, amelyek a szintszint feletti aggregáció biztosítására szolgálnak. Meg kell értenünk az adatbázis-dimenzió és a kocka mérete közötti különbséget: az adatbázisból származó dimenzió az alapvető méretű objektumokat több kocka dimenzióra biztosítja, amelyekre épül.

Az adatbázis méretei és a kocka elegáns megoldást kínál a "szerepjáték-dimenziók" néven ismert koncepció számára. Szerepjáték dimenziók érvényesek, ha az egyetlen dimenziót kubában sokszor kell használni. A dátum kiváló példa ebben a kubai példányban: meg fogja építeni a dátum egyetlen dimenzióját, és egyszerre hivatkozik az egyes időpontokra, amelyekre az értékesítést az interneten keresztül elemezni szeretné. A naptár dátuma lesz az első dimenzió, amelyet létrehoz. Jobb egérgombbal kattintson a Megoldás Explorer méretei mappájára, és válassza az Új dimenziót a Dimension Wizard Dimension Wizard elindításához. Válassza egy meglévő táblázat és kattintson a Tovább gombra a Select Creation Method létrehozásának módja. A forrásforrás meghatározásának lépése Forrás forrásforrás Adja meg a Dimime táblázatot a fő táblázat legördülő listában, és kattintson a következő gombra. Most, a kiválasztás kiválasztás lépéseit, a SELECT dimenzióattribútumról tünetek, akkor ki kell választania az idő dimenziója attribútumokat. Válassza ki az egyes attribútumot a képernyőn megjelenő 3.

Kattintson a Tovább gombra. Az utolsó lépésben adja meg a Dim dátumot a Név mezőben, és nyomja meg a Finish gombot a méret varázsló befejezéséhez. Most meg kell néznie egy új dimenziós dimenziót, amely a Megoldások Explorer méreteiben található.

Ezután használja a Dimenziós varázslót a termékek és az ügyfél méretének létrehozásához. Végezze el ugyanazokat a lépéseket, hogy egy alapvető dimenziót hozzon létre, mint korábban. Munkavégzés a dimenzió varázsló, ellenőrizze, hogy úgy dönt, minden lehetséges jelek a Select dimenzióattribútumról lépést. Az egyéb beállítások alapértelmezett értékei meglehetősen alkalmasak egy tesztkocka példányára.

Értékesítési kocka létrehozása az interneten

Most, miután elkészítette az adatbázis dimenzióját, elkezdheti építeni egy kockát. A Megoldások Explorer, kattintson jobb gombbal a kockák mappára, és válassza az Új kocka lehetőséget a Cube Wizard Cube Master indításához. A Select Creation Method ablakban válassza a meglévő USE meglévő táblákat táblákat. Válassza ki a Talpinternetsales táblát a Mérési Csoporthoz a Select Mease Group Tables Mérési táblázatválasztási lépésekhez. Távolítsa el a jelölőnégyzetet a promóciós kulcs, a valuta kulcs, az értékesítési terület kulcs és a revíziós szám kiválasztása mellett, és kattintson a Tovább gombra.

A Meglévő méretek kiválasztása képernyőn győződjön meg róla, hogy az összes meglévő adatbázis-méret kiválasztása úgy van kiválasztva, hogy a kocka dimenzióban tovább használja őket. Amint azt szeretné, hogy ez a kocka olyan egyszerű, amennyire csak lehetséges, szüntesse meg a méret Factinternetsales a Select Új dimenziók lépést. A tatellernetsalesek dimenziójának elhagyása, akkor megteremti, hogy mit neveznek a tény vagy a degenerált dimenzió dimenziójának. A tény dimenziója az a dimenzió, amelyet a tények fő gyárával hoztak létre, szemben a hagyományos dimenziókkal.

Kattintson a Következő gombra a varázsló befejezéséhez, és írja be az "Első kockát" a Kuba Név mezőbe. Nyomja meg a Finish gombot a Cube létrehozása varázsló munkájának befejezéséhez.

A kocka telepítése és feldolgozása

Most minden készen áll az első kocka telepítésére és feldolgozására. Jobb egérgombbal kattintson az új kocka ikonra a megoldások felfedezőjében, és válassza a Folyamat lehetőséget. Látni fog egy ablakot egy üzenettel, hogy a tartalom elavult. Kattintson az Igen gombra az új kocka telepítéséhez az SSAS célkiszolgálón. A kocka telepítésekor az XML-t az ANALISIS (XMLA) fájlra küldi az SSAS célkiszolgálóhoz, amely maga a kiszolgálón lévő kockát hozza létre. Amint azt már említettük, a kubai feldolgozás betölti bináris fájljait a fő forrásból, valamint további metaadatokat, amelyeket hozzáadott (dimenzió, mérés és kocka beállítások).

Amint a telepítési folyamat befejeződött, megjelenik egy új folyamat kocka párbeszédpanel. Nyomja meg a Run gombot a CUBE feldolgozási folyamat megkezdéséhez, amely megnyitja a folyamat haladási ablakát. Ha a feldolgozás befejeződött, kattintson a Bezárás gombra (kétszer, és zárja mindkét párbeszédpanelen) befejezni a folyamatok kiépítési és feldolgozása a kocka.

Most építettél, telepítette és feldolgozta az első kockát. Megtekintheti ezt az új kockát a jobb egérgombbal a megoldás Explorer ablakban és a Böngészés kiválasztásával. Húzza a méréseket a Pivot tábla középpontjába, és a vonalak és oszlopok méretei és oszlopait az új kocka felfedezéséhez. Kérjük, vegye figyelembe, hogy a kocka milyen gyorsan dolgozik különböző aggregációval kapcsolatos kéréseket. Most megbecsülheti a korlátlan hatalmat, és azt jelenti, üzleti érték, Kuba OLAP.

Derek elkötelező ( [E-mail védett]) - Senior építész a B. I. Voyage cégnél, amely a Microsoft Partner státusza az üzleti intelligencia területén. A Cím SQL Server MVP és több Microsoft tanúsítvány

Az OLAP nem külön szoftvertermék, nem programozási nyelv, és még egy speciális technológia sem. Ha megpróbálja fedél OLAP minden megnyilvánulása, akkor ez a halmaz fogalmak, elvek és követelmények alapjául szolgáló szoftver termékek megkönnyítik az elemzők az adatokhoz való hozzáférés. Kitalál minek Az elemzőknek valahogy szükségük van megkönnyít Hozzáférés az adatokhoz.

Az a tény, hogy az elemzők a vállalati információk különleges fogyasztói. Feladatelemzés - Találjon szabályszerűségeket nagy adatgyűjtőben. Ezért az elemző nem figyel külön tény, hogy csütörtökön a negyedik száma az ügyfél Chernov eladták egy fekete tinta fél - szüksége volt információ mintegy száz és ezer Hasonló események. Az adatbázisban lévő egységes tények érdeklődhetnek például az értékesítési osztály könyvelője vagy vezetője, amelynek hatásköre a tranzakció. Az egyik rekord analitikája nem elegendő - hozzá, például szükségük lehet arra, hogy az ág minden tranzakciójához vagy képviseletére legyen szükségük a hónapra, évre. Ugyanakkor elemzője eldobja Felesleges részletek, mint a fogadó vevő, pontos címe és telefonszáma, a szerződéses index és hasonlók. Ugyanakkor az analiticseket igénylő adatoknak szükségszerűen számszerű értékeket kell tartalmazniuk - ez a tevékenységeinek legszélesebb körében van.

Tehát az elemzőnek sok adatot igényel, ezek az adatok szelektívek, és aggódnak " attribútumkészlet - szám". Ez utóbbi azt jelenti, hogy az elemző a következő táblázatokkal működik:

Itt " Ország", "Termék", "Év"Attribútumok vagy mérések, de " Értékesítési mennyiség"Ezáltal numerikus érték vagy intézkedés. Az Analytics feladat, ismétlés, az attribútumok és a numerikus paraméterek közötti tartós kapcsolatok azonosítása. Az asztalra nézve megjegyezhető, hogy könnyen lefordítható három dimenzióra: az egyik tengelyen elhalasztjuk az országokat, másrészt az áruk harmadik részében. És az értékek ebben a háromdimenziós tömbben a megfelelő értékesítési volumen lesz.

Az asztal háromdimenziós bemutatása. A szürke szegmens azt mutatja, hogy Argentína 1988-ban nincs adat

Ez az OLAP háromdimenziós tömbje, és ennek nevezik. Tény, hogy a szempontból szigorú matematika, mint a tömb nem mindig lesz: ebben a Kuba, az elemek száma minden dimenziójában kell egyeznie, és nincsenek ilyen korlátozások OLAP-kockák. Mindazonáltal ezek a részletek ellenére a "Kuba OLAP" kifejezés a rövidség és a képmód miatt általánosan elfogadott. Az OLAP kocka nem feltétlenül háromdimenziósnak kell lennie. Két- és többdimenziós lehet - a megoldandó feladat függvényében. Különösen a páros elemzőknek körülbelül 20 mérésre van szükség - és a súlyos OLAP termékek ilyen mennyiségben vannak és kiszámíthatók. Egyszerűbb asztali alkalmazások támogatják valahol 6 mérés.

Mérések Az OLAP kockák az úgynevezett pipa. vagy tagok (tagok). Például az "ország" mérése az "Argentína" jelek, Brazília, "Venezuela" és így tovább.

Nem minden Kubai elemet kell kitölteni: Ha 1988-ban az Argentínában lévő gumi termékek értékesítéséről nincs információ, a megfelelő cellában lévő érték egyszerűen nem lesz meghatározva. Ezenkívül adott esetben az OLAP alkalmazás minden bizonnyal többdimenziós struktúrában tárolja az adatokat - a legfontosabb dolog az, hogy a felhasználó számára így néz ki. By the way, pontosan speciális módszerek a többdimenziós adatok kompakt tárolására, a "vákuum" (töltetlen elemek) a kockákban nem vezethet haszontalan memória idejéhez.

A kocka azonban nem alkalmas elemzésre. Ha még mindig megfelelő módon nyújthat be vagy ábrázolhat egy háromdimenziós kockát, akkor hat - vagy nineteenimetherből sokkal rosszabb. ebből kifolyólag használat előtt A többdimenziós kockából kétdimenziós asztalok. Ezt a műveletet "vágás" kockára nevezik. Ez a kifejezés újra, formázott. Az elemző, mintha a Kuba mérései, és "csökkenti" az érdekeit. Ily módon az elemző kétdimenziós vágott kubát kap, és vele működik. Körülbelül ugyanazok a loggerek vizsgálják az éves gyűrűket a varázslaton.

Ennek megfelelően csak két dimenzió maradt "folytatódik" - a táblázatmérések számának megfelelően. Ez történik, csak a mérés továbbra is "uncut" - ha a kocka többféle számértéket tartalmaz, elhalaszthatják az asztal egyik mérésére.

Ha még mindig jobban néz ki az asztalnál, amelyet először ábrázoltunk, akkor láthatjuk, hogy az adatai a legvalószínűbbek, és ennek eredményeként összegzés Kisebb elemek esetében. Például egy év blokkokra, hónapokig, hónapokig, hetekig, hetekig. Az ország a régiókból és a településekből származó régiókból áll. Végül, maguk a városokban a területek és a specifikus kereskedési pontok megkülönböztethetők. Az áruk kombinálhatók az árucikkcsoportok és így tovább. Az OLAP tekintetében az ilyen többszintű szakszervezetek teljesen logikusak hierarchia. Az OLAP Eszközök bármikor engedélyezhetik a hierarchia kívánt szintjére való átváltást. Ráadásul, általában többféle hierarchiát is támogatott ugyanazon elemek számára: például egy hónapos hónap vagy nap-dekada nap. A kezdeti adatok a hierarchia alacsonyabb szintjétől származnak, majd összefoglalják, hogy megkapják a magasabb szintek értékeit. Az átmeneti folyamat felgyorsítása érdekében a különböző szintekre vonatkozó összegeket Kubában tárolják. Így az a tény, hogy a felhasználó úgy néz ki, mint egy kocka, nagyjából beszél, számos primitív kocka.

Példa hierarchia

Ez az egyik lényeges pillanat, amely az OLAP - teljesítmény és hatékonyság megjelenéséhez vezetett. Képzeld el, mi történik, ha az elemzőnek tájékoztatást kell kapnia, és nincsenek OLAP eszköz a vállalkozásnál. Az elemző önállóan (ami valószínűtlen) vagy a programozó használata teszi lehetővé a megfelelő SQL lekérdezést, és megkapja az érdeklődésre számot tartó adatokat a jelentésben, vagy exportálja őket a táblázatba. A problémák nagyszerűen felmerülnek. Először is, az elemző arra kényszerül, hogy ne dolgozzon munkájával (SQL programozás), vagy várjon a feladatot, a programozók elvégeznek - mindezek hátrányosan befolyásolják a munkaerő termelékenységét, a támadások emelkednek, az infarktus és a stroke szintje stb. Másodszor, egyetlen jelentés vagy táblázat, mint általában, nem mentheti meg az orosz elemzés gondolatai és atyáinak óriásait - és a teljes eljárást újra meg kell ismételni. Harmadszor, ahogy már kiderült, az elemzők a trifles nem kérdeznek - szükségük van mindenre azonnal. Ez azt jelenti, hogy (bár a technika és a hét mérföldes lépésekkel tovább halad), hogy a vállalati relációs DBMS kiszolgálója, amelyhez az elemző felhívja, mélyen és hosszú ideig gondolkodik, blokkolja a többi tranzakciót.

Az OLAP koncepciója kifejezetten megoldott az ilyen problémák megoldására. Kuba OLAP lényegében meta-jelentések. A meta-jelentések csökkentése (Kuba, azaz) a mérésekhez, az elemző valójában a "rendes" kétdimenziós jelentések, amelyek érdekeit érdekli (ez nem feltétlenül jelent meg a szokásos megértés ezen kifejezés - az adatokról beszélünk szerkezetek azonos funkciókkal). A kockák előnyei nyilvánvalóak - az adatokat csak egyszer kell kérni a relációs DBMS-től - egy kocka építése során. Mivel az elemzők általában nem működnek olyan információkkal, amelyek kiegészítik és megváltoztatják a "Repülési", a kocka által létrehozott kocka kellő hosszú ideig releváns. Ennek következtében nemcsak kizárja a relációs DBMS-kiszolgáló működésének megszakítását (a több ezer és több ezer válaszjelzések nem tartalmaznak kérdéseket), hanem élesen növeli az elemző adatához való hozzáférés sebességét is. Ezenkívül, amint azt már megjegyeztük, a teljesítmény növeli és a hierarchiák és más aggregált értékek köztes összegeit számolva a kocka építésének időpontjában. Vagyis, ha kezdetben adataink egy különálló áruház napi bevételeiről információt tartalmaznak, akkor a kubai OLAP-alkalmazás kialakításakor a kubai OLAP-alkalmazás kialakításakor a különböző hierarchiák (hetek és hónapok, városok és országok) eredményei miatt következik be.

Természetesen a teljesítmény módjának növelése érdekében meg kell fizetni. Néha azt mondják, hogy az adatszerkezet egyszerűen "felrobban" - az OLAP Cube több tucatban foglalhat, és akár több százszor több helyet foglal el, mint a forrásadatok.

Válaszolj a kérdésekre:

Mit kocka alakú Olap?

Mit címkék Speciális mérés? Készítsen példákat.

Tudnak intézkedés A kubai OLAP-ban nem számszerű értékeket tartalmaz.

OLAP adatkockák (online analitikai feldolgozás - működési adatok elemzése) lehetővé teszik a többdimenziós adatok hatékony eltávolítását és elemzését. Az egyéb adatbázisoktól eltérően az OLAP adatbázis kifejezetten az analitikai feldolgozáshoz készült, és gyorsan kivonja az összes adatkészletet. Valójában számos kulcsfontosságú különbség van a standard relációs adatbázisok, például a hozzáférés vagy az SQL Server és az OLAP adatbázisok között.

Ábra. 1. Az OLAP kocka csatlakoztatásához az Excel könyvéhez használja a csapatot Az elemzői szolgáltatásokból

Letöltés Formátumban vagy

A relációs adatbázisokban az információkat a hozzáadott, törlendő és frissítésű nyilvántartások formájában mutatják be. Az OLAP adatbázisokban csak az adatok pillanatfelvétele tárolódik. Az OLAP adatbázisban az információ egy blokk formájában archiválódik, és csak a kérésre történő kimenetre szolgál. Bár az OLAP adatbázisban új információkat adhat hozzá, a meglévő adatokat ritkán szerkesztették, és annál távolabb vannak.

A relációs adatbázisok és az OLAP adatbázis szerkezetileg különböznek egymástól. A relációs adatbázisok általában olyan táblázatokból állnak, amelyek összekapcsolódnak. Bizonyos esetekben a relációs adatbázis olyan sok asztalt tartalmaz, amelyet nagyon nehéz meghatározni, hogyan kapcsolódnak hozzá. Az OLAP adatbázisokban az egyes adatblokkok közötti kapcsolatot előre határozzák meg, és az OLAP CUBA néven ismert szerkezetben fennáll. Az adatkockákban a hierarchikus struktúra és az adatbázis-kapcsolatokkal kapcsolatos információkat tartalmazza, amelyek nagymértékben egyszerűsítik a navigációt. Ezenkívül sokkal könnyebb jelentést készíteni, ha előre tudod, ahol a megtérülő adatok helyezkednek el, és milyen más adatokkal vannak összekapcsolva.

A relációs adatbázisok és az OLAP adatbázisok közötti fő különbség az információk tárolása. A Kubában OLAP adatai ritkán képviseltetik magukat általában. Az OLAP adatkockák jellemzően előre meghatározott formátumban tartalmaznak információkat tartalmaznak. Így a kockák csoportosításának, szűrésének, válogatásának és kombinálásának műveletei az információk kitöltése előtt történnek. Ez teszi a kért adatok kitermelését és kimenetét egyszerűsített eljárással. A relációs adatbázisokkal ellentétben a képernyőn megjelenő megjelenítése előtt nincs szükség azonnali információra.

Az OLAP adatbázisokat általában az informatikai rendszergazdák hozták létre és támogatják. Ha szervezete nem rendelkezik olyan struktúrával, amely felelős az OLAP adatbázisok kezeléséért, akkor kapcsolatba léphet a relációs adatbázis adminisztrátorával a vállalati hálózatban legalább külön OLAP-megoldások végrehajtásához.

Csatlakozzon az OLAP KBA-hoz

Az OLAP adatbázis eléréséhez először csatlakozni kell az OLAP CUBA-hoz. Indítsa el az átmenetet a szalag lapra Adat. Kattintson a gombra Más forrásokból és válassza ki a parancsot a legördülő menüben Az elemzői szolgáltatásokból (1. ábra).

Az adatkapcsolat varázsló megadásakor (2. ábra). Fő feladata az, hogy segítsen létrehozni a kapcsolatot a kiszolgálóhoz, amelyet az Excel program az adatok kezelése során használ.

1. Először is ki kell adnia az Excel regisztrációs adatait. Adja meg a kiszolgáló nevét, a bejelentkezési nevét és jelszavát az adatügyi hozzáférés párbeszédpanelhez az ábrán látható módon. 2. Kattintson a gombra További. Ha Windows-fiókkal csatlakozik, állítsa be a kapcsolót Használja a Windows hitelesítést.

2. Válassza ki az adatbázist a legördülő listában, amellyel dolgozik (3. ábra). A jelenlegi példában az elemzési szolgáltatások bemutató adatbázisát használják. Az adatbázis kiválasztása után az alábbi lista meghívást kap arra, hogy importálja az összes elérhető OLAP kockát. Válassza ki a kívánt kockaadatokat, és kattintson a gombra. További.

Ábra. 3. Válasszon ki egy munkadokumentumot és az OLAP CUBE-t, amely az adatelemzést tervezi.

3. A következő párbeszédpanelen az 1. ábrán látható varázsló 4, leíró információkat kell megadnia a létrehozott kapcsolatról. Az 1. ábrán látható párbeszédpanel minden mezője. 4, nem szükséges kitölteni. Mindig figyelmen kívül hagyhatja az aktuális párbeszédpanelt anélkül, hogy kitölti, és nem befolyásolja a kapcsolatokat.

Ábra. 4. Változtassa meg a leíró kapcsolat információkat

4. Kattintson a gombra KészA kapcsolat befejezéséhez. Megjelenik egy párbeszédpanel a képernyőn. Adatok behozatala (5. ábra). Állítsa be a kapcsolót Konszolidált táblázatjelentés és kattintson az OK gombra, hogy elkezdje létrehozni a pivot táblát.

Kuba struktúra OLAP.

Az OLAP adatbázis alapjául szolgáló Pivot tábla létrehozásának folyamatában észre fogja venni, hogy a feladat területének ablaka A konszolidált asztal területei Ez különbözik a szokásos pivot asztaltól. Az oka annak, hogy a forgóasztal rendezését az OLAP Cube struktúra szerkezetének megfelelően jelenítse meg. Ahhoz, hogy az OLAP KBA-t a lehető leggyorsabban maximalizálja, meg kell ismerkedni a kölcsönhatásuk összetevőivel és módszereivel. Ábrán. A 6. ábra egy tipikus OLAP kocka alapszerkezetét mutatja.

Amint láthatja, az Olap Cube fő összetevői a dimenzió, hierarchia, szintek, tagok és intézkedések:

Dimenzió. Az elemzett adatelemek fő jellemzője. A méretek leggyakoribb példái közé tartoznak a termékek (áruk), az ügyfél (vevő) és a munkavállaló (alkalmazott). Ábrán. A 6. ábra a mérettermékek szerkezetét mutatja.
Hierarchia. Előre definiált szintű aggregáció a megadott dimenzióban. A hierarchia lehetővé teszi, hogy összefoglaló adatokat hozzon létre és elemezze azokat a struktúra különböző szintjén, amelyek nem szerepelnek ezek között a szintek között. Az 1. ábrán bemutatott példában. A 6. ábrán látható, hogy a dimenzió termékek három szinten vannak, amelyek egy hierarchia termékkategóriába tartoznak (árukkategóriák).
Szint. A szintek olyan kategóriák, amelyek összegyűjtöttek egy közös hierarchiában. Tekintsük azokat az adatmezők szintjét, amelyeket külön kell kérni és elemezni egymástól. Ábrán. 6 csak három szint: kategória (kategória), alkategória (alkategória) és terméknév (terméknév).
Tagok. Külön adatelem a dimenzióban. A tagokhoz való hozzáférést általában a méretek, hierarchiák és szintek OLAR-szerkezete révén hajtják végre. Az 1. ábrán látható példában. 6 tag van megadva a terméknév szintjén. Más szintek rendelkeznek azok tagjai, amelyek nem szerepelnek a szerkezetben.
Intézkedés - Ezek az OLAP kockák valódi adatai. Az intézkedéseket saját dimenzióikban megőrzik, amelyeket az intézkedések dimenzióinak neveznek. A dimenziók, a hierarchiák, a szintek és a tagok önkényes kombinációjával intézkedéseket kérhetnek. Hasonló eljárást neveznek "vágás" intézkedéseknek.

Most, hogy megismerte az OLAP kockák szerkezetét, vegyen egy új pillantást a Pivot tábla mezők listájára. A rendelkezésre álló mezők szervezete világossá válik, és nem okoz panaszokat. Ábrán. A 7. ábra megmutatja, hogy az OLAP-összefoglaló táblázat elemei szerepelnek a mezőlistában.

Az OLAP-összefoglaló asztal mezők listáján az intézkedések először jelennek meg, és az összegzés ikonja (Sigma) jelzi. Ezek az egyetlen olyan adatelemek, amelyek az értékterületen lehetnek. Ezután a lista jelzi az ikon képével jelzett dimenziót az asztal képével. Példánkban az ügyfél dimenzióját használják. Ezt a dimenziót számos hierarchiát fektetnek be. A hierarchia telepítése után megismerheti magát bizonyos adatszintekkel. Az OLAP kocka adatszerkezetének megtekintéséhez elegendő navigálni a Pivot tábla mezők listáján.

Az Összefoglaló OLAP táblákon kiszabott korlátozások

Az OLAP konszolidált táblázatokkal való együttműködésre emlékeztetni kell arra, hogy a konszolidált táblázat adatforrásával való kölcsönhatás az elemzési szolgáltatások OLAP környezetében történik. Ez azt jelenti, hogy az adatkocka minden viselkedési szempontja, a méretekkel kezdődően, és a kockán szereplő intézkedésekkel végződő intézkedésekkel az OLAP analitikai szolgáltatások is irányítják. Ez viszont az OLAP-összefoglaló táblázatokban végrehajtható műveletekre vonatkozó korlátozásokhoz vezet:

a helyszíni táblázat területének értékét nem lehet elhelyezni, az intézkedésektől eltérően;
nem lehet megváltoztatni az összefoglaló funkciót;
nem hozhat létre kiszámított mezőt vagy számított elemet;
a mezőnevek bármilyen változása azonnal törlődik, miután eltávolítja ezt a mezőt a konszolidált táblázatból;
nem lehet megváltoztatni az oldal mező paramétereit;
a csapat nem érhető el Előadásoldalak;
letiltott paraméter Előadásaláírásokelemek az értékek területén található mezők hiányában;
letiltott paraméter Köztes összegek a kiválasztott szűrőoldali elemeken;
nem hozzáférhetetlen paraméter Háttérvizsgálat;
kettős kattintás után csak az első 1000 bejegyzés a Cowl Table Kesh-tól visszaküldik;
nem érhető el jelölőnégyzet Optimalizálmemória.

Autonóm adatkockák létrehozása

A standard összefoglaló táblázatban a forrásadatokat helyi merevlemezen tárolják. Így mindig kezelheti őket, valamint megváltoztathatja a szerkezetet, még nem is hozzáférhet a hálózathoz. De ez semmilyen módon nem érinti az OLAP összefoglaló táblázatokat. Összefoglaló táblázatokban az OLAP gyorsítótár nem található a helyi merevlemezen. Ezért azonnal a helyi hálózatból való leválasztás után a konszolidált OLAP tábla elveszíti a teljesítményt. Nem tudsz egyetlen mezőt mozgatni egy ilyen táblázatban.

Ha még mindig meg kell vizsgálnia az OLAP adatokat a hálózati kapcsolat hiányában, hozzon létre egy autonóm adatkockát. Ez egy külön fájl, amely szerzői jogi táblázat. Ez a fájl az OLAP adatokat tárolja a helyi hálózat leválasztása után. Autonóm adatkocka létrehozásához először hozzon létre egy konszolidált OLAP táblát. Helyezze a kurzort a Pivot asztalra, és kattintson a gombra. Olap A kontextuális lapok sorozata Munka konszolidált táblázatokkal. Válassz csapatot OFFLINE OLAP mód (8. ábra).

Megjelenik egy párbeszédpanel a képernyőn. Az offline OLAP konfigurálása (9. ábra). Kattintson a gombra Hozzon létre önálló adatfájlt. A CUBE CUBE fájl első ablakának létrehozása a képernyőn megjelenik a képernyőn. Kattintson a gombra TovábbiAz eljárás folytatásához.

A második lépésben (10. ábra) határozza meg a kocka adataiban szereplő dimenziót és szinteket. A párbeszédpanelen válassza ki az OLAP adatbázisból importált adatokat. Csak azokat a méreteket kell kiemelni, amelyek a számítógép helyi hálózatából történő leválasztása után szükségesek lesznek. Minél több dimenziók jelzik, minél hosszabb ideig az autonóm kocka lesz az adatok.

Kattintson a gombra További A harmadik lépéshez való áttéréshez (11. Ebben az ablakban válassza ki a tagokat vagy az adatokat, amelyek nem szerepelnek a kockában. Ha a jelölőnégyzet nincs beállítva, a megadott elem nem importálódik, és felesleges helyet foglal el a helyi merevlemezen.

Adja meg az adatkocka helyét és nevét (12. ábra). Az adatkocki fájlok kiterjesztése. Cub.

Egy idő után az Excel megmenti az adatok autonóm kockáját a megadott mappában. A teszteléshez kattintson duplán a fájlra, amely az Excel munkakönyv automatikus generálásához vezet, amely egy konszolidált táblázatot tartalmaz a kiválasztott adatkockához. A létrehozás után kiterjesztheti az Autonóm Adatkockát az összes érdekelt felhasználó között, akik a fogyatékkal élő helyi hálózati módban dolgoznak.

Miután csatlakozott a helyi hálózathoz, megnyithatja az offline adatkocka fájlját, és frissítheti azt, valamint a megfelelő adatokat. Ne feledje, hogy bár az autonóm adatkockát hálózati hozzáférés hiányában alkalmazzák, kötelező a hálózathoz való csatlakozás visszaállítása után. Az autonóm adatkocka frissítésének kísérlete a hálózathoz való csatlakozás megszakítása után hibát okozhat.

Alkalmazza az adatkocka funkcióit a konszolidált táblázatokban

Az OLAP adatbázisokban használt kocka funkciókat egy konszolidált táblázatból indíthatjuk el. Az Excel elavult verzióiban csak az elemzési csomag felépítményének telepítése után hozzáférést kaptál az adatkockák funkcióihoz. Az Excel 2013-ban ezek a funkciók beágyazódnak a programba, ezért felhasználhatók. Ahhoz, hogy teljes mértékben megismerkedjen a képességeikkel, fontolja meg egy konkrét példát.

Az adatkocka funkcióinak egyik legegyszerűbb módja az OLAP-összefoglaló tábla átalakítása a kocka formában. Ez az eljárás nagyon egyszerű, és lehetővé teszi, hogy gyorsan megszerezze a kocka-képleteket, anélkül, hogy megteremti őket a semmiből. A legfontosabb elv az, hogy az összes sejt az Összefoglaló táblázatban az OLAP adatbázishoz kapcsolódó képletekkel helyettesítse. Ábrán. A 13. ábra az OLAP adatbázishoz tartozó összefoglaló táblázatot mutatja.

Helyezze a kurzort bárhol a pivot asztalra, kattintson a gombra Olap kontextusszalag fül Elemzés És válassza a Csapat lehetőséget Konvertálja a képletet (14. ábra).

Ha a Pivot tábla tartalmaz egy jelentésszűrőt, a képernyőn megjelenő párbeszédpanel jelenik meg. 15. Ebben az ablakban adja meg, hogy át kell-e átalakítani a képletek legördülő adatszűrőket. Pozitív válasz esetén a legördülő listák törlődnek, és a statikus képletek megjelennek. Ha tovább kívánja használni a legördülő listákat a Pivot táblázat tartalmának megváltoztatásához, akkor állítsa vissza az egyetlen párbeszédpanelt jelölőnégyzetet. Ha kompatibilis módban konszolidált táblázatban dolgozik, az adatszűrőket automatikusan átalakítják a képletre, előzetes figyelmeztetés nélkül.

Néhány másodperc elteltével az összefoglaló táblázat helyett a képletek megjelennek, amelyeket adatkockákban végeznek, és kimennek a szükséges információk Excel ablakában. Kérjük, vegye figyelembe, hogy a korábban alkalmazott stílusokat eltávolítják (16. ábra).

Ábra. 16. Vessen egy pillantást a képlet sorára: a sejtekben tartalmazza az adatkocka képletét

Tekintettel arra, hogy az általad megtekintett értékek most nem része a Pivot táblaobjektumnak, hozzáadhat oszlopokat, húrokat és számított elemeket, kombinálhatják őket más külső forrásokkal, valamint változtassa meg a jelentést a legtöbb szempontból, beleértve a húzó képleteket.

Számítás hozzáadása az OLAP-összefoglaló táblázatokhoz

Az Excel korábbi verzióiban az OLAP-összefoglaló táblázatokban az egyéni számítástechnika nem engedélyezett. Ez azt jelenti, hogy az OLAP összefoglaló táblázatokat lehetetlen volt egy kiegészítő elemzéseket. Hasonlóképpen, az a hagyományos összefoglaló táblázatokat, hogy fogadja el a számított mezők és elemek (a részleteket lásd; mielőtt tovább olvasod, győződjön meg arról, hogy Ön ismeri ezt az anyagot).

Az Excel 2013-ban az új OLAP eszközök megjelentek - számítható intézkedések és többdimenziós kifejezések számított elemei. Most nem korlátozódik az OLAP CUBA által nyújtott intézkedések és elemek használatára az adatbázis-adminisztrátor által biztosított. További elemzési funkciókat kaphat az egyéni számítástechnika létrehozásával.

Ismerkedés az MDX-vel.Ha egy Pivot tábla OLAP CUBE használatával elküldi az MDX lekérdezési adatbázist (többdimenziós kifejezések - többdimenziós kifejezések). Az MDX egy lekérdezési nyelv, amelyet többdimenziós forrásokból származó adatok (például az OLAP kockákból) kapnak. Az OLAP-összefoglaló táblázat megváltoztatása vagy frissítése esetén a megfelelő MDX kéréseket az OLAP adatbázis továbbítja. A lekérdezés eredményeit visszaadják az Excelbe, és megjelennek a Pivot asztalterületen. Ez biztosítja annak lehetőségét, hogy az OLAP adatokkal való együttműködés lendületes másolat nélkül dolgozik.

A multidimenzionális kifejezések számított intézkedéseinek és elemeinek létrehozásakor az MDX nyelvi szintaxisát használják. Ezzel a szintaxissal a konszolidált táblázat interakciót biztosít az OLAP adatbázis-kiszolgáló részének számításával. A könyvben figyelembe vett példák az Excel 2013 új jellemzőit mutató alapvető MDX struktúrákon alapulnak. Ha összetett számítható intézkedéseket és többdimenziós kifejezéseket kell létrehoznia, időt kell töltenie az MDX képességek mélyebb tanulmányozására.

Számított intézkedések létrehozása.A számított intézkedés a számított mező OLAP verziója. Az ötlet az, hogy hozzon létre egy új adatmező alapján néhány matematikai műveleteket végezni tekintetében meglévő OLAP területeken. Az 1. ábrán bemutatott példában. 17., egy konszolidált OLAP táblát használnak, amely magában foglalja az áruk listáját és mennyiségét, valamint mindegyik értékesítéséből származó jövedelmet. Új intézkedést kell hozzáadnia, amely kiszámítja az áruk átlagos árát.

Elemzés Munka konszolidált táblázatokkal. A legördülő menüben Olap Kiválaszt (18. ábra).

Ábra. 18. Válassza ki a menüpontot. A többdimenziós kifejezés számított mértéke

Megjelenik egy párbeszédpanel a képernyőn. Számított intézkedés létrehozása (19. ábra).

Kovesd ezeket a lepeseket:

2. Válasszon ki egy olyan intézkedési csoportot, amelyben új számított intézkedés lesz. Ha ez nem történik meg, az Excel automatikusan új intézkedést fog bevezetni az első hozzáférhető intézkedési csoportban.

3. A területen Többdimenziós kifejezés (MDX) Írja be a kódot, amely új módot tartalmaz. A bemeneti folyamat felgyorsításához használja a balkezes listát a számításokban használt meglévő intézkedések kiválasztásához. Kattintson duplán a tervezőre, hogy hozzáadja a többdimenziós expressziós mezőbe. Az árukegység értékesítésének átlagos árának kiszámításához a következő multidimenzionális expressziót alkalmazzuk:

4. Kattintson az OK gombra.

Jegyezze fel a gombot Ellenőrizze az MDX-tamely az ablak jobb oldalán található. Kattintson erre a gombra a többdimenziós kifejezés szintaxisának helyességének ellenőrzéséhez. Ha a szintaxis hibákat tartalmaz, a megfelelő üzenet jelenik meg.

Új számított intézkedés létrehozása után lépjen a listára. A konszolidált asztal területei és válassza ki (20. ábra).

A kiszámított intézkedés köre csak az aktuális könyvre vonatkozik. Más szóval, a kiszámított intézkedések nem közvetlenül az OLAP Server Kubában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a gyakorlatban, hacsak nem nyitja meg a munkakönyv megosztását, vagy nem közzéteszi az interneten.

A többdimenziós kifejezések számított elemeinek létrehozása.A többdimenziós kifejezés számított eleme a szokásos számított elem OLAP verziója. Az ötlet az, hogy új adatokat hozzanak létre a meglévő OLAP elemek tekintetében végrehajtott matematikai műveletek alapján. Az 1. ábrán bemutatott példában. 22, egy konszolidált OLAP táblát használnak, beleértve a 2005-2008-as értékesítési információkat (negyedévente lebontva). Tegyük fel, hogy az első és a második negyedévéhez kapcsolódó adatok összesítését kell végrehajtania, létrehozva az első félév első felét (az év első felében). A harmadik és a negyedik negyedévhez kapcsolódó adatokat is ötvözi, miután az év második felét (az év második felében) új elemet alakított ki.

Ábra. 22. Új számított elemeket fogunk hozzáadni a többdimenziós kifejezések, az év első felében és az év második felében

Helyezze a kurzort bárhol a konszolidált asztalra, és válassza ki a kontextus fület Elemzés A kontextuális lapokból Munka konszolidált táblázatokkal. A legördülő menüben Olap Kiválaszt A többdimenziós kifejezés számított eleme (23. ábra).

Megjelenik egy párbeszédpanel a képernyőn. (24. ábra).

Ábra. 24. Ablak Számított elem létrehozása

Kovesd ezeket a lepeseket:

1. Adja meg a kiszámított azonos nevet.

2. Válassza ki a szülő hierarchiáját, amelyre új számított elemeket hoznak létre. Az építkezésen Szülői elem Név Minden. Ennek a konfigurációnak köszönhetően az Excel hozzáférést kap a szülőhierarchia minden eleméhez, amikor kiszámítja a kifejezést.

3. Az ablakban Többdimenziós kifejezés Adja meg a többdimenziós kifejezés szintaxisát. A kis idő megmentéséhez használja a megjelenített listát a többdimenziós kifejezésekben használt meglévő elemek kiválasztásához. Kattintson duplán a kiválasztott elemre, és az Excel hozzáadja az ablakhoz. Többdimenziós kifejezés. Az 1. ábrán bemutatott példában. 24, az első és a második negyedév összegét kiszámítják:

..&& +

.. && +

.. && + …

4. Kattintson az OK gombra. Az Excel megjeleníti a többdimenziós expresszió leginkább létrehozott számított elemét a konszolidált táblázatban. Az 1. ábrán látható módon. 25, az új számított elem a konszolidált táblázat más számított elemeivel együtt jelenik meg.

Ábrán. A 26. ábra egy hasonló eljárást szemléltet, amelyet az éves elem kiszámított elemének létrehozására használnak.

Megjegyzés: Az Excel nem is próbálja eltávolítani a többdimenziós expresszió kezdeti elemeit (27. ábra). A Pivot tábla még mindig megjeleníti a 2005-2008-as számú rekordot negyedéves lebomlással. Ebben az esetben ez nem ijesztő, de a legtöbb forgatókönyvben el kell rejtenie az "extra" elemeket a konfliktusok elkerülése érdekében.

Ábra. 27. Az Excel megjeleníti a többdimenziós expresszió létrehozott számított elemét a forráselemekkel. De még mindig jobb, ha eltávolítjuk a forráselemeket a konfliktusok elkerülése érdekében.

Ne feledje: A számított elemek csak az aktuális munkakönyvben találhatók. Más szóval, a kiszámított intézkedések nem közvetlenül az OLAP Server Kubában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a kiszámított intézkedéshez vagy a kiszámított elemhez, hacsak nem nyitja meg a munkakönyv megosztását, vagy nem közzéteszi az interneten.

Meg kell jegyezni, hogy a szülőhierarchiában vagy az OLAP CUBA szülőelemének változása esetén a többdimenziós kifejezés számított eleme megszűnik a funkcióinak elvégzéséhez. Ez az elem újbóli létrehozásához szükséges.

OLAP Computing Management.Az Excel támogatja az interfészt, amely lehetővé teszi az OLAP-összefoglaló táblázatban szereplő többdimenziós kifejezések számított intézkedéseinek és elemeit. Helyezze a kurzort bárhol a konszolidált asztalra, és válassza ki a kontextus fület Elemzés A kontextuális lapokból Munka konszolidált táblázatokkal. A legördülő menüben Olap Kiválaszt Számítástechnika. Az ablakban A számítástechnika kezelése Három gomb áll rendelkezésre (28. ábra):

Teremt. Új számított intézkedés vagy számított elem létrehozása egy többdimenziós kifejezés.
Változás. A kiválasztott számítás módosítása.
Töröl. A kiválasztott számítás törlése.

Ábra. 28. párbeszédpanel Számítástechnika

Elemzés elvégzése "Mi, ha" az OLAP adatok szerint.Az Excel 2013-ban elemezheti az OLAP-összefoglaló táblázatokban található adatokat. Az új funkciónak köszönhetően megváltoztathatja az értékeket a konszolidált táblázatban, és újra kiszámolja az intézkedéseket és az elemeket a végrehajtott változások alapján. Ön is terjesztheti a változásokat az Olap Cube-hoz. A "Mi, ha" elemzés elemzésének kihasználásához hozzon létre egy konszolidált OLAP táblát, és válassza ki a kontextusfület Elemzés Munka konszolidált táblázatokkal. A legördülő menüben Olap Válassz csapatot Elemzés "Mi az, ha" –> Tartalmazzon egy elemzést "Mi az, ha" (29. ábra).

Mostantól a konszolidált táblázat értékeit módosíthatja. A kiválasztott érték megváltoztatásához a Pivot táblázatban kattintson jobb gombbal arra, és válassza ki az elemet a helyi menüben. (30. ábra). Az Excel újra végrehajtja a konszolidált táblázat összes számítását, figyelembe véve az alkalmazott szerkesztéseket, beleértve a számított intézkedéseket és a többdimenziós kifejezések számított elemeit.

Ábra. 30. Válassza ki Figyelembe véve a váltást a pivot asztal kiszámításakorA konszolidált táblázat módosítása

Alapértelmezésben elvégzett módosításokat a konszolidált táblázat az elemzés üzemmódban „hogy ha a” helyi. Ha az OLAP kiszolgáló módosítását szeretné osztani, válassza ki a módosítások közzétételét. Válasszon egy kontextusfület ElemzésA kontextuális lapok sorában Munka konszolidált táblázatokkal. A legördülő menüben Olap Válassza ki az elemeket Elemzés "Mi az, ha" – > Közzéteszi a változást(31. ábra). Ennek eredményeként a végrehajtás a parancs, a „fordított” bekapcsolja az OLAP szerver, ami azt jelenti, terjesztésének lehetőségét változások az OLAP forrás kocka. (Terjesztésére változások az OLAP szerver, akkor szükség van a megfelelő jogosultsága a szerver. Kapcsolat az adatbázis-kezelő, amely segít abban, hogy jogosultsága az OLAP adatbázis rögzítési mód.)

A megjegyzést Jelen, Alexander könyv alapján írják. . 9. fejezet.

E munka részeként a következő kérdéseket fogják figyelembe venni:

Mi az Olap-Cuba?
Mik azok az intézkedések, mérések, hierarchiák?
Milyen típusú műveleteket lehet végrehajtani az OLAP kockákon?

Olapku

Az OLAP fő posztulátuma az adatok bemutatásában többdimenziós. Az OLAP terminológiában a kocka fogalmát vagy a hypercube-t használják a többdimenziós diszkrét adatterület leírására.

Kocka alakú Ez egy többdimenziós adatszerkezet, amelyből az elemző felhasználó kérhet információt. A kockák tényekből és mérésekből származnak.

Tények - Ezek olyan tárgyak és események adatai, amelyek elemzésre kerülnek. Az egyik típusú formanyomtatvány tényei (intézkedések). Az intézkedés a kockacella értéke.

Mérések - Ezek olyan adatelemek, amelyekre az elemzés megtörtént. Az ilyen elemek gyűjteménye mérési attribútumot generál (például a hét napjai egy attribútummérést képezhetnek "Idő"). A kereskedelmi vállalkozások üzleti elemzésének feladatai során az ilyen kategóriák "Idő", "Értékesítés", "áruk", "ügyfelek", "munkavállalók", "Alkalmazottak", "földrajzi hely", gyakran mérések. A mérések a leggyakrabban a logikai kategóriákat képviselő hierarchikus struktúrák, amelyekre a felhasználó elemezheti a tényleges adatokat. Minden hierarchia lehet egy vagy több szint. Tehát a "földrajzi hely" mérés hierarchiája is tartalmazhat: "Ország - terület - város". Az időhierarchiában lehetséges, hogy kiemeljük például a szintek ilyen szekvenciáját: A mérés több hierarchiával rendelkezhet (az egyik mérés minden hierarchiája a mérési táblázatnak ugyanolyan kulcs-attribútuma van).

A kocka tényleges adatokat tartalmazhat egy vagy több ténytábláról, és leggyakrabban több mérést tartalmaz. Bármely konkrét kocka rendszerint különleges elemzési irányokat tartalmaz.

Az 1. ábra egy olyan kocka példát mutat, amelynek célja az olajfinomító termékek értékesítésének elemzése egyes régiókban. Ez a kocka három dimenzióval (idő, termék és régió) és egy intézkedés (értékesítés, pénzben kifejezve). A megfelelő kocka sejtek (cella) tárolódnak. Mindegyik cellát egyedileg azonosítja a tuple nevű mérések tagjainak. Például egy sejtben található a bal alsó sarokban a Kuba (mező értéke $ 98.399), adja meg a tuple [2005 júliusában a Távol-Keleten, a gázolaj]. Itt az értéke $ 98.399 mutatja az értékesítési volumen (pénzben kifejezve) a dízelmotor a Távol-Keleten, 2005. július.

Érdemes figyelmet fordítani arra is, hogy egyes sejtek nem tartalmaznak értékeket: ezek a sejtek üresek, mert a tények táblázat tartalmaz adatokat számukra.

Ábra. egy. Kocka információval a kőolajtermékek értékesítéséről különböző régiókban

Az ilyen kockák létrehozásának végső célja az, hogy minimalizálja a szükséges információk feldolgozási idejét, amely kivonja a szükséges információkat a tényleges adatokból. A feladat végrehajtásához Kuba általában előre kiszámított végső adatokat tartalmaz, hívják aggregációk (aggregációk). Azok. A kocka az adatteret több, mint a tényleges - logikus, számított pontok. Számítsa ki a tényleges értékeken alapuló logikai térben lévő pontok értékeit, lehetővé teszi az aggregációs funkciókat. A legegyszerűbb aggregációs funkciók összegek, max, min, szám. Így például, a MAX funkció, a kocka megadott Például meg lehet állapítani, ha egy dízel eladások csúcs következett be a Távol-Keleten, stb

A többdimenziós kockák egy másik konkrét jellemzője a koordináták származási pontjának meghatározásának összetettsége. Például, hogyan kell beállítani a 0 pontot a "termék" vagy a "régiók" mérésére? A probléma megoldása egy speciális attribútum bevezetése, amely ötvözi az összes mérőelemet. Ez az attribútum (automatikusan létrehozott) csak egy elemet tartalmaz - minden ("ALL"). Az egyszerű aggregációs funkciók esetében például az összeg, az elem mindegyike megegyezik a mérés tényleges térének összes elemének értékének összegével.

A többdimenziós adatmodell fontos fogalma egy alterület, vagy megvesztegetés (Sub Cube). A megvesztegetés része a teljes kocka térben egy bizonyos többdimenziós alak formájában a kocka belsejében. Mivel a többdimenziós kubai tér diszkréten és korlátozott, a megvesztegetés is diszkrét és korlátozott.

OLAP kockákkal kapcsolatos műveletek

Az OLAP kocka felett a következő műveletek végezhetők el:

vágott;
forgás;
konszolidáció;
részletezés.

Szelet (2. ábra) magántulajdonban van. Ez az az eljárás kialakítására egy részhalmazát egy többdimenziós adatok tömböt megfelelő egyetlen érték egy vagy több mérési elemek, amelyek nem szerepelnek ezen alcsoportjában. Például, hogy megtudja, hogy a kőolajtermékek értékesítését csak egy bizonyos régióban, nevezetesen az URALS-ben is elősegítették, meg kell jegyezni az "URAL" elemet, és kivonja a megfelelő részhalmazot a kockától.

Ábra. 2. Élvezze OLAP KUBA-t

Forgás (3. ábra) - A jelentésben szereplő mérések helyének módosítása vagy a megjelenített oldalon. Például a forgatás működése lehet a táblázat vonalak és oszlopainak permutációjában. Ezenkívül az adatkocka forgatása az extra keretmérések áthelyezése a megjelenített oldalon bemutatott mérési helyre, és fordítva.

Mi az OLAP ma, általában minden szakértő ismeri. Legalábbis az "OLAP" és a "többdimenziós adatok" fogalma folyamatosan kapcsolódik a tudatunkban. Mindazonáltal az a tény, hogy ez a téma újra felemelkedik, remélem, a legtöbb olvasó hagyja jóvá, mivel nem elavult az idő múlásával, rendszeresen kommunikálni az intelligens emberekkel, vagy olvasta a cikkeket egy jó kiadásban ...

Adatraktár (OLAP helyszín a vállalkozás információs struktúrájában)

Az "OLAP" kifejezés elválaszthatatlanul kapcsolódik az "Adatraktár" kifejezéssel (adatraktár).

Adunk egy definíciót, amelyet az "apa-alapító" adatraktárok Bill Inmona: "Az adatraktár egy tárgyorientált, kötődő idő és változatlan adatgyűjtés, amely támogatja az irányítási döntések meghozatalának folyamatát."

A tároló adatai az operatív rendszerekből (OLTP rendszerek), amelyek az üzleti folyamatok automatizálására szolgálnak. Ezenkívül a tárolást külső források, például statisztikai jelentések miatt feltöltheti.

Miért építsenek adatraktárakat - végül is, tartalmaznak tudatosan redundáns információkat, amelyek "élőben" élnek adatbázisokban vagy operációs rendszerfájlokban? Röviden válaszolhat: Elemezze az operatív rendszerek adatait nem lehetetlen vagy nagyon nehéz. Ezt különféle okokkal magyarázza, beleértve az adatok szkennert, tárolja őket a különböző DBMS formátumában és a vállalati hálózat különböző "sarkaiban". De még akkor is, ha a vállalatban az összes adatot a központi adatbázis-kiszolgálón (ami rendkívül ritka) tárolja, az elemző szinte biztosan nem találja meg komplex, néha bonyolult struktúráikat. A szerző kellően szomorú tapasztalat próbálkozások, hogy „feed” éhes elemzők „nyers” adatok a működő rendszerből - kiderült, hogy „nem a fogakat.”

Így a tároló feladata, hogy "nyersanyagokat" biztosítson egy helyen és egy egyszerű, érthető szerkezetben. Ralph Kimball a "The Data Warehouse Toolkit" könyve elrendezésében azt írja, hogy ha az olvasó csak egy dolgot fog megérteni az egész könyv olvasása, nevezetesen: A tárolási struktúra egyszerűnek kell lennie, a szerző meg fogja venni a feladatait.

Van egy másik ok, ami igazolja a különálló tárhely megjelenését - komplex analitikai kérelmek a működési információk gátolja a vállalat jelenlegi munkáját, blokkolja a táblázatokat hosszú ideig, és rögzíti a kiszolgáló erőforrásait.

Véleményem szerint a tárolás alatt nem feltétlenül egy óriási adatfelhalmozódás - a legfontosabb az, hogy kényelmes az elemzéshez. Általánosságban elmondható, hogy egy különálló kifejezést (adat kioszkokat) kis tárolóeszközökre szánnak, de orosz gyakorlatunkban gyakran nem hallja.

OLAP - Kényelmes elemző eszköz

A központosítás és a kényelmes strukturálás nem minden, amire szükség van az Analytics által. Még mindig szükségessé teszi az információk megtekintéséhez, megjelenítéséhez. A hagyományos jelentések, még egyetlen tárolás alapján is épültek, megfosztják az egyik rugalmasságot. Nem lehet "csavarok", "telepítve" vagy "összeomlás", hogy megkapja a kívánt adatremenet. Természetesen hívhat egy programozót (ha el akar jönni), és ő (ha nem foglalt) gyorsan új jelentést fog tenni - azt mondja, hogy egy óra (nem hiszem, és nem hiszem, hogy nem hiszek - olyan gyorsan Az élet nincs senki; adjunk neki három órát). Kiderül, hogy az elemző egy napot nem lehet több, mint két ötlet. És ő (ha jó elemzője), az ilyen ötletek több óránként jönnek a fejbe. És minél inkább az elemzők "szakaszai" és "vágásai" látják, annál nagyobb az ötletek, amelyek viszont minden új és új "vágást" kell ellenőrizni. Ez lenne az a szerszáma, amely lehetővé tenné az adatok telepítését és megfordítását egyszerűen és kényelmes! Mint egy eszköz, és elvégzi az OLAP-t.

Bár az OLAP nem szükséges az adatraktár szükséges attribútuma, egyre gyakrabban használják a tárolás során felhalmozott információk elemzését.

A tipikus tárolásban szereplő alkatrészeket az 1. ábrán mutatjuk be. egy.

Ábra. 1. Adatraktárszerkezet

Működési adatokat gyűjtenek a különböző forrásokból származó, megtisztított, integrált és hajtogatják relációs tárolás. Ugyanakkor már rendelkezésre állnak az elemzéshez különböző építési jelentések felhasználásával. Ezután az adatok (teljesen vagy részben) készültek az OLAP elemzéshez. Ezek egy speciális OLAP adatbázisba vagy egy relációs tárolóban maradhatnak. A legfontosabb elem a metaadatok, azaz az adatok szerkezetéről, elhelyezéséről és átalakításáról. Köszönjük, hogy a különböző tárolókomponensek hatékony kölcsönhatása biztosított.

Összefoglalva, lehetséges meghatározni az OLAP-t, mint a tárolóban felhalmozott adatok többdimenziós elemzésének eszközét. Elméletileg az OLAP eszközöket közvetlenül alkalmazhatják a működési adatokhoz vagy azok pontos másolatához (úgy, hogy ne zavarja az operatív felhasználókat). De tehát kockáztatjuk, hogy lépjünk a fent leírt rake-ra, azaz elindítjuk az olyan működési adatok elemzését, amelyek nem alkalmasak az elemzésre.

Meghatározás és alapfogalmak OLAP

Meg kell kezdeni, megfejtés: OLAP online analitikai feldolgozás, azaz működési adatelemzés. 12 Az OLAP 1993-ban megfogalmazott elvei. E. F. CODD - "Inventor" relációs adatbázis. Később ő meghatározása, újrafeldolgozásra úgynevezett FASMI vizsgálat, amely előírja, hogy az OLAP alkalmazás, amely képes gyorsan elemezni a megosztott többdimenziós adatok ().

Teszt faszi

Gyors. (Gyors) - Az elemzést az információ minden szempontjából egyaránt gyorsan meg kell tenni. Elfogadható válaszidő 5 s vagy kevesebb.

Elemzés. (Elemzés) - Lehetővé kell tenni az alkalmazásfejlesztő vagy az önkényesen meghatározott felhasználó által előre meghatározott numerikus és statisztikai elemzés fő típusait.

Megosztott. (Megosztott) - sok felhasználónak hozzáférést kell biztosítania az adatokhoz, szükség van a bizalmas információkhoz való hozzáférésre.

Többdimenziós (Többdimenziós) a fő, legjelentősebb OLAP jellemző.

Információ (Információ) - A kérelemnek képesnek kell lennie arra, hogy hozzáférjen a szükséges információkhoz, függetlenül annak mennyiségétől és tárolási helyétől.

OLAP \u003d többdimenziós nézet \u003d kocka

Az OLAP kényelmes nagysebességű hozzáférési eszközöket, megtekintést és elemzést biztosít az üzleti információknak. A felhasználó természetes, intuitív adatmodellt kap, multidimenziós kockák (kockák) formájában szervez. A többdimenziós koordináta-rendszer tengelyei az elemzett üzleti folyamat fő jellemzői. Például az értékesítéshez, lehet egy termék, régió, vevő típus. Az időt az egyik mérésként használják. A mérő tengelyek (dimenziók) metszéspontjaiban vannak adat, kvantitatív módon jellemezve a folyamat - intézkedések (intézkedések). Ezek lehetnek értékesítési volumen darabokban vagy monetáris szempontból, a fennmaradó raktáron, a költségekben stb. A felhasználó elemző információ "vágni" egy kockát különböző irányokban, beszerezni konszolidált (például évről évre), vagy éppen ellenkezőleg, Részletes (hetekig) információt és más manipulációkat gyakorolnak, amelyek az elemzési folyamat során el fognak gondolkodniuk.

Mint az 1. ábrán bemutatott háromdimenziós kuba intézkedéseként. 2, értékesítési összegeket használnak, és mérési idő, termék és üzlet. A méréseket a csoportosítás bizonyos szintjén mutatják be: az árukat kategóriák, üzletek országonként csoportosítják, és a műveletek idején - hónapokig. Egy kicsit később megnézzük a csoportosítás (hierarchia) szintjét.

Ábra. 2. Példa Kuba

Kocka kocka

Még a háromdimenziós kocka is nehéz megjeleníteni a számítógép képernyőjén, hogy az érdeklődésre számot tartó értékek láthatóak legyenek. Mit tudunk beszélni a kockákról a mérések számával, a nagy három? A Kubában tárolt adatok vizualizálása általában szokásos kétdimenziós, azaz táblák, ábrázolások, amelyek komplex hierarchikus sorok és oszlopok.

A kocka kétdimenziós nézete a "vágás" segítségével egy vagy több tengelyen (mérésekkel): Megjavítjuk az összes mérés értékeit, kivéve kettőt, és egy hagyományos kétdimenziós táblát kapunk. A vízszintes tengelyen az asztal (oszlop fejlécét), egy mérés nem kerül bemutatásra, a függőleges (string fejlécek) - a többi, és a táblázatban sejtek - az értékeket az intézkedéseket. Ebben az esetben az intézkedések halmaza valójában az egyik mérésnek tekinthető - egy intézkedést választunk (és akkor két dimenziót helyezhetünk el a fejlécekben és oszlopokban), vagy több intézkedést mutatunk (és akkor az egyik táblázat tengelye Vegye figyelembe az intézkedések nevét, és a másik - az egyetlen "nem elfogadott" mérés értékeit).

Vessen egy pillantást az 1. ábrán. 3 - Itt van egy kétdimenziós vágott Kuba egyik intézkedés - az értékesítési egységárak (értékesített egységek) és két „vitathatatlan” mérések - Store (áruház) és az idő (Time).

Ábra. 3. Kétdimenziós kocka szelet egy intézkedéshez

Ábrán. A 4. ábrán csak egy „nem fogadta el” mérés - Store, de az értékek több intézkedés itt jelennek meg - az értékesítési egységárak (eladták), Store értékesítési és Store Költség (áruház kiadások).

Ábra. 4. Kétdimenziós kocka szelet több intézkedéshez

A Kuba kétdimenziós nézete lehetséges, és ha a "folytatás" marad, és több mint két dimenzió. Ugyanakkor a "vágott" kocka két vagy több mérése kerül a vágási tengelyekre (vonalak és oszlopok) - lásd az 1. ábrát. öt.

Ábra. 5. Kétdimenziós kocka szelet több méréssel egy tengelyen

Címkék

A mérések mentén "elhalasztott" értékeket tagok vagy jelek (tagok) nevezik. A címkéket a kocka "vágása", mind a kiválasztott adatok korlátozására (szűrés) használják - ha a mérés során fennmaradó "érthetetlen", akkor nem minden érték, hanem részhalmazuk, például három város több tucat. A címkék értékei kétdimenziós kocka nézetben jelennek meg, mint karakterláncok és oszlopok.

Hierarchiák és szintek

A címkék egy vagy több szintből álló hierarchiákká kombinálhatók (szintek). Például a "Store" (Store) mérési címkék természetesen kombinálhatók a szintekkel rendelkező hierarchiába:

Ország (ország)

ÁLLAPOT

Város (város)

Tárolja (tárolja).

A hierarchiaszintekkel összhangban az összesített értékeket kiszámítják, például az USA (országszint) vagy a kaliforniai (állami szint) értékesítése. Egy dimenzióban több hierarchia - azt mondhatja, hogy időben: (év, negyed, hónap, nap) és (év, hét, nap).

OLAP alkalmazási architektúra

Mindaz, amit az OLAP felett említettek, valójában a többdimenziós adatremenethez kapcsolódnak. Az adatok tárolása, nagyjából beszélve, nem érdekli, ha a végfelhasználó, sem az eszközfejlesztők, amelyekre az ügyfél használ.

Az OLAP alkalmazások többdimenzióssága három szintre osztható:

Többdimenziós adatok ábrázolás - végfelhasználói eszközök, amelyek többdimenziós vizualizációt és adatkezelést biztosítanak; A többdimenziós ábrázolási réteget elterjedt a fizikai adatszerkezetből, és az adatokat többdimenziós módon érzékeli.
A többdimenziós lekérdezések megfogalmazásának többdimenziós feldolgozása (nyelv) (a hagyományos SQL relációs nyelv nem alkalmas) és a processzor, amely képes feldolgozni és végrehajtani az ilyen kérést.
Többdimenziós tárolás - olyan fizikai adatszervezés eszközei, amelyek biztosítják a többdimenziós kérelmek hatékony végrehajtását.

Az első két szint feltétlenül jelen van az összes OLAP eszközben. A harmadik szint, bár széles körben elterjedt, nem szükséges, mivel a többdimenziós ábrázolásra vonatkozó adatok eltávolíthatók a szokásos relációs struktúrákból; A többdimenziós lekérdezési processzor ebben az esetben többdimenziós kéréseket fordít a relációs DBMS által végrehajtott SQL lekérdezésekre.

A specifikus OLAP termékek általában többdimenziós adatrekeráció, OLAP kliens (például az Excel 2000 A Microsoft, a Társaság Knosys-i verziója) vagy a DBMS, OLAP kiszolgáló (a Példa, Oracle Express Server vagy Microsoft OLAP szolgáltatások).

A többdimenziós feldolgozó réteg általában beágyazódik az OLAP kliensbe és / vagy az OLAP kiszolgálóba, de tiszta formában, például a Microsoft Pivot asztali szolgáltatási összetevőjének kiemelésére szolgál.

Műszaki szempontok a többdimenziós adattárolás

Amint azt már említettük, az OLAP elemző eszközök kivonhatják az adatokat és közvetlenül a relációs rendszerektől. Az ilyen megközelítés vonzóbb volt azokban az idõkben, amikor az OLAP szerverek hiányoztak a vezető DBMS gyártók árlapaiban. De ma és az Oracle és Informix és a Microsoft-hez teljes körű OLAP szerverek, és még azok az informatikai vezetők, akik nem szeretik tenyészteni a hálózatokat „állatkert” a különböző gyártók is megvásárolható (pontosabban kell alkalmazni a cég vezetése) Az OLAP kiszolgáló ugyanazt a márkát, mint a fő adatbázis-kiszolgáló.

Az OLAP szerverek vagy a többdimenziós adatbázis-kiszolgálók különböző módon tárolhatják többdimenziós adataikat. Ezen módon figyelembe véve az aggregátumok tárolásának egyik fontos szempontról beszélnünk kell egy ilyen fontos szempontról. A tény az, hogy minden adattárház - mind a szokásos, és egy többdimenziós - együtt részletes kinyert adatokat működési rendszerek, a teljes indikátorok (aggregált indikátorok, aggregátumok) vannak tárolva, mint például az összeg az értékesítés volumen hónappal, kategóriák szerint áruk stb. Az aggregátumok egyértelműen tárolják az egyetlen célt - felgyorsítani a kérelmek végrehajtását. Végül is, egyrészt a tárolási felhalmozódik, általában nagyon nagy mennyiségű adat, másrészt a legtöbb esetben, nem részletes, de általánosított mutatók érdeklődnek. És ha minden alkalommal, amikor kellene összefoglalni millió egyedi értékesítési évre kiszámításához az értékesítési összeg, a sebesség valószínűleg elfogadhatatlan lett volna. Ezért az adatok többdimenziós adatbázisokba való betöltésekor az összes teljes mutatót vagy részét kiszámítják és megmentik.

De, mint tudod, mindent kell fizetned. És a teljes adatok feldolgozási kéréseinek sebessége, szükség van a letöltésükre vonatkozó adatok és idő mennyiségének növekedésére. Ráadásul a volumen növekedése szó szerint katasztrofális - az egyik közzétett szabványos vizsgálat során a 10 MB forrásadatok teljes számlálása 2,4 GB, azaz az adatok 240-szer emelkedtek! A mértéke „megduzzad” adatok kiszámítása során egységek számától függ a kocka mérések és a szerkezet ezen mérések, azaz, az arány a száma „apák” és „gyermek” a különböző szinteken a mérést. A probléma megoldása érdekében a tárolás aggregátumok, olykor összetett rendszereket alkalmaznak, így nem az összes lehetséges aggregátumok kiszámítása során, hogy jelentős növekedés a lekérdezések teljesítményét.

Most a különböző tárolási lehetőségekről. Mind a részletes adatok, mind az aggregátumok relációs vagy többdimenziós struktúrákban tárolhatók. Többdimenziós tároló lehetővé teszi az adatok kell kezelni, mint egy többdimenziós tömbben, ezáltal biztosítva az azonos gyors számításokat a teljes mutatók és különböző többdimenziós transzformációk bármelyike \u200b\u200bszerinti mérési. Néhány évvel ezelőtt az OLAP termékek támogatták a relációs vagy többdimenziós tárolást. Ma, mint általában, ugyanaz a termék biztosítja mindkét típusú tárolót, valamint a harmadik típusát - vegyes. A következő kifejezéseket alkalmazzák:

Molap. (Többdimenziós OLAP) - és részletes adatok, valamint az aggregátumok többdimenziós adatbázisban vannak tárolva. Ebben az esetben a legnagyobb redundanciát kapják meg, mivel a többdimenziós adatok teljesen relációs.
Rolap. (Relációs OLAP) - Részletes adatok továbbra is ott maradnak, ahol "éltek" kezdetben a relációs adatbázisban; Az aggregátumok ugyanabban az adatbázisban vannak tárolva, speciálisan létrehozott szolgáltatási táblákban.
HOLAP. (Hybrid OLAP) - A részletes adatok a helyén maradnak (a relációs adatbázisban), és az egységek többdimenziós adatbázisban vannak tárolva.

Mindegyik módszer előnye és hátrányai vannak, és a feltételek függvényében - az adatok mennyiségétől, a relációs DBMS hatalmát stb.

A többdimenziós struktúrákban lévő adatok tárolásakor a "duzzanat" probléma az üres értékek tárolása miatt következik be. Végül is, ha a többdimenziós tömb a mérési jelek minden lehetséges kombinációján van fenntartva, és csak egy kis rész (például számos terméket csak kis számú régióban értékesítenek), aztán a kocka Bo / akár a kocka része legyen üres, bár a hely elfoglalt. A modern OLAP termékek képesek megbirkózni ezzel a problémával.

Folytatjuk. A jövőben a vezető gyártók által gyártott speciális OLAP termékekről beszélünk.