A rubel árfolyamának idősorát tartalmazó Olap-kocka. Egy informatikus szemszögéből. Mi az elemzés és miért van rá szükség?

/ Kubista módon. OLAP kockák alkalmazása nagyvállalatok vezetési gyakorlatában

osztálytársak

Konsztantyin Tokmacsev, rendszerépítész

Kubista stílusban.
OLAP kockák alkalmazása nagyvállalatok vezetési gyakorlatában

Talán elmúlt az az idő, amikor egy vállalat számítási erőforrásait csak információk rögzítésére és számviteli jelentések rögzítésére fordították. Ugyanakkor a vezetői döntések „szemből” születtek az irodákban, értekezleten, értekezleten. Talán Oroszországban itt az ideje, hogy a vállalati számítástechnikai rendszereket visszahelyezzék fő erőforrásukba - a menedzsment problémák megoldása a számítógépen regisztrált adatok alapján

Az üzleti elemzés előnyeiről

A vállalatirányítási körben a „nyers” adatok és a kezelt objektumot befolyásoló „karok” között „teljesítménymutatók” - KPI-k találhatók. Egyfajta „műszerfalat” alkotnak, amely a vezérelt objektum különféle alrendszereinek állapotát tükrözi. Egy vállalat informatív teljesítménymutatókkal való felszerelése, számításuk és a kapott értékek nyomon követése egy üzleti elemző munkája. A vállalatok jelentős segítséget nyújthatnak az elemző munka megszervezésében automatizált szolgáltatások elemzés, mint például az MS segédprogram SQL Server Az Analysis Services (SSAS) és fő funkciója az OLAP kocka.

Itt még egy pontot kell kiemelni. Tegyük fel, hogy az amerikai hagyomány szerint az OLAP-kockákkal való munkavégzésre összpontosító specialitást BI-nek (Business Intelligence) hívják. Nem lehetnek illúziók arról, hogy az amerikai BI megfelel az orosz „üzleti elemzőnek”. Nem sértődj meg, de üzleti elemzőnk gyakran „alulkönyvelő” és „alulprogramozó”, homályos tudású, csekély fizetésű szakember, akinek valóban nincs saját eszköze és módszertana.

A BI-szakember valójában alkalmazott matematikus, magasan képzett szakember, aki modern matematikai módszereket használ a vállalat arzenáljához (ezt nevezték Operations Research). A BI jobban megfelel a „rendszerelemző” szakterületnek, amely egykor a Szovjetunióban volt, és a Moszkvai Állami Egyetem Számítógépes Matematikai és Matematikai Karán végzett. M.V. Lomonoszov. Az OLAP kocka és elemzési szolgáltatások ígéretes alapjává válhatnak egy orosz üzleti elemző munkahelyének, talán némi továbbképzést követően az amerikai BI irányába.

IN utóbbi időbenÚjabb káros tendencia alakult ki. A specializációnak köszönhetően elveszett a kölcsönös megértés a vállalati alkalmazottak különböző kategóriái között. Egy könyvelő, menedzser és programozó, mint „hattyú, rák és csuka” I.A. meséjében. Krylov, különböző irányokba húzzák a vállalatot.

A könyvelő a jelentésekkel van elfoglalva, mind jelentésben, mind dinamikában nem kapcsolódnak közvetlenül a vállalat üzleti folyamatához.

A menedzser elfoglalt az üzleti folyamat saját részével, de nem tudja globálisan, a vállalat egészének szintjén értékelni tevékenységének eredményeit és kilátásait.

Végül a programozó, aki egykor (képzettségének köszönhetően) a tudomány szférájától az üzleti szféráig haladó műszaki ötletek karmestere volt, a könyvelő és menedzser fantáziájának passzív végrehajtójává vált, így nem már ritka, hogy a vállalatok informatikai részlegét könyvelők hajtják, és általában mindenki, akihez nem lusta. A kezdeményezés hiánya, az írástudatlan, de viszonylag jól fizetett 1C programozó igazi csapás az orosz vállalatok számára. (Majdnem mint egy hazai futballista.) Az úgynevezett „közgazdászok és jogászok”-ról már nem is beszélek;

Tehát a programozási és számviteli alapismeretekben jártas, tudásintenzív SSAS apparátussal felszerelt üzleti elemző pozíciója képes megszilárdítani a vállalat munkáját az üzleti folyamat elemzésével és előrejelzésével kapcsolatban.

Az OLAP kockák előnyei

OLAP kocka az modern gyógymód a vállalati számítógépes rendszer adatbázisának elemzése, amely lehetővé teszi, hogy a hierarchia minden szintjén a munkavállalók rendelkezésére álljon a szükséges mutatókészlet, amely jellemzi a vállalat termelési folyamatát. A lényeg nem csak az, hogy az MDX-kocka kényelmes felülete és rugalmas lekérdezési nyelve (MultiDimensional eXpressions) lehetővé teszi a szükséges analitikai mutatók megfogalmazását és kiszámítását, hanem az a figyelemre méltó gyorsaság és egyszerűség, amellyel az OLAP-kocka ezt megteszi. Ezenkívül ez a sebesség és egyszerűség bizonyos határokon belül nem függ a számítások összetettségétől és az adatbázis méretétől.

Néhány bevezető az OLAP-ba
kockát az MS Excel „pivot táblája” adhat meg. Ezek az objektumok hasonló logikával és hasonló interfészekkel rendelkeznek. De ahogy a cikkből kiderül, az OLAP funkcionalitása összehasonlíthatatlanul gazdagabb, a teljesítmény pedig összehasonlíthatatlanul magasabb, így a „pivot tábla” továbbra is helyi asztali termék marad, míg az OLAP vállalati szintű termék.

Miért alkalmas az OLAP kocka olyan jól analitikai problémák megoldására? Az OLAP kocka úgy van kialakítva, hogy az összes lehetséges szakaszon minden mutató előre kiszámított (egészben vagy részben), és a felhasználó csak a szükséges mutatókat (mértékeket) és méreteket (méreteket) tudja „kihúzni” a egérrel, és a program újra tudja rajzolni a táblázatokat.

Az összes lehetséges elemzés minden szekcióban egyetlen hatalmas mezőt alkot, vagy inkább nem egy mezőt, hanem csak egy többdimenziós OLAP-kockát. Bármilyen kérést is intéz a felhasználó (menedzser, üzleti elemző, ügyvezető) az analitikai szolgáltatáshoz, a válaszadás gyorsaságát két dolog magyarázza: egyrészt a szükséges elemzés könnyen megfogalmazható (vagy név szerint kiválasztható egy listából, vagy megadható egy képlet az MDX nyelvben ), másodszor, általában már ki van számítva.

Az analitika megfogalmazása háromféleképpen lehetséges: vagy adatbázismező (vagy inkább raktármező), vagy kocka tervezési szinten definiált számítási mező, vagy MDX nyelvi kifejezés, amikor interaktívan dolgozik a kockával.

Ez az OLAP kockák számos vonzó tulajdonságát jelenti. Lényegében megszűnik az akadály a felhasználó és az adatok között. Az akadályt egy alkalmazásprogramozó jelenti, akinek először is meg kell magyaráznia a problémát (feladatot kell kitűznie). Másodszor, meg kell várnia, amíg az alkalmazásprogramozó létrehoz egy algoritmust, megírja és hibakeresi a programot, majd esetleg módosítja. Ha sok alkalmazott van, és az igényeik változatosak és változékonyak, akkor alkalmazásprogramozók egész csapatára van szükség. Ebben az értelemben egy OLAP-kocka (és egy képzett üzleti elemző) egy egész csapat alkalmazás-programozót helyettesít az analitikai munkában, ahogy egy nagy teljesítményű kotrógép egy kotrógép-kezelővel egy egész csapat migráns munkás lapáttal helyettesít egy árokásásnál!

Ezzel párhuzamosan a kapott analitikai adatok egy másik nagyon fontos minősége is megvalósul. Mivel az egész cégnek csak egy OLAP kocka van, i.e. Ez ugyanaz a mező, ahol az elemzők mindenki számára elérhetők, ami kiküszöböli az adatok bosszantó eltéréseit. Amikor egy menedzsernek ugyanazt a feladatot több független munkatársnak kell feltennie a szubjektivitás tényezőjének kiküszöbölése érdekében, de mégis különböző válaszokat hoznak, amit mindenki vállalkozik valamilyen módon megmagyarázni stb. Az OLAP kocka biztosítja az analitikai adatok egységességét különböző szinteken vállalati hierarchia, azaz. ha egy vezető részletezni akar egy számára érdekes mutatót, akkor minden bizonnyal eljut azokhoz az alacsonyabb szintű adatokhoz, amelyekkel a beosztottja dolgozik, és pontosan ez lesz az az adat, amely alapján a magasabb szintű mutatót kiszámították. , és nem valami más adat, más módon, máskor kapott stb. Vagyis az egész vállalat ugyanazt az elemzést látja, de az összesítés különböző szintjein.

Mondjunk egy példát. Tegyük fel, hogy egy kezelő kezeli a követeléseket. Amíg a lejárt követelések KPI-je zöld, ez azt jelenti, hogy minden normális, és nincs szükség kezelési lépésekre. Ha a szín sárgára vagy pirosra változott, akkor valami nem stimmel: értékesítési részlegenként levágjuk a KPI-ket, és azonnal „pirossal” látjuk a részlegeket. A következő részben a menedzserek - és az eladó, akinek ügyfelei le vannak maradva a fizetéssel, az azonosításra kerül. (Továbbá a késedelmes törlesztések összege megosztható ügyfelek szerint, feltételek szerint stb.) A társaság vezetője bármilyen szinten közvetlenül kapcsolatba léphet a jogsértőkkel. De általában ugyanazt a KPI-t (a hierarchia szintjein) látják mind az osztályvezetők, mind az értékesítési vezetők. A helyzet korrigálása érdekében tehát nem is kell a „szőnyegre hívásra” várniuk... Természetesen magának a KPI-nek nem kell feltétlenül a lejárt fizetések összegének lennie – lehet a a késedelmes fizetések súlyozott átlagos időtartama, vagy általában a követelések forgási üteme.

Vegyük észre, hogy az MDX nyelv összetettsége és rugalmassága a gyors (néha azonnali) eredményekkel együtt lehetővé teszi számunkra (a fejlesztési és hibakeresési szakaszok figyelembevételével) olyan összetett vezérlési problémák megoldását, amelyek egyébként nem merültek volna fel. az alkalmazásprogramozók bonyolultságára és a megfogalmazás kezdeti bizonytalanságára. (Hosszú határidők az alkalmazásprogramozók számára az analitikai problémák megoldására a rosszul értelmezett megfogalmazások és a programok hosszas módosításai miatt, amikor a feltételek megváltoznak a gyakorlatban.)

Arra is figyeljünk, hogy a cég minden dolgozója az általános területről pontosan azt a termést gyűjtse össze egy OLAP elemzővel, amilyenre szüksége van a munkájához, és ne elégedjen meg azzal a „csíkkal”, amit a kommunálisan neki vágnak. „standard jelentések”.

Az OLAP kockával kliens-szerver módban történő munkavégzéshez használható többfelhasználós felület lehetővé teszi, hogy minden dolgozó, másoktól függetlenül, saját (akár saját készítésű bizonyos készségekkel) analitikai blokkokat (jelentéseket), amelyek definiálásuk után automatikusan frissülnek – vagyis mindig naprakészek.

Vagyis az OLAP-kocka lehetővé teszi, hogy az analitikai munkát (amelyet valójában nemcsak a recepciós elemzők végeznek, hanem a vállalat szinte minden alkalmazottja, még a logisztikusok és az egyenlegeket és szállítmányokat irányító menedzserek is) szelektívebbé tegyük, „nem általánosságban” , ami feltételeket teremt a munka javításához és a termelékenység növeléséhez.

Bevezetésünket összefoglalva megjegyezzük, hogy az OLAP kockák használata többel növelheti egy vállalat gazdálkodását. magas szintű. Az analitikai adatok egységessége a hierarchia minden szintjén, megbízhatóságuk, összetettségük, a mutatók létrehozásának és módosításának egyszerűsége, egyedi beállítások, nagy sebesség Az adatfeldolgozás, és végül az alternatív elemzési utak támogatására fordított pénz- és időmegtakarítás (alkalmazásprogramozók, alkalmazottak független számításai) lehetőséget ad az OLAP-kockák használatára az orosz nagyvállalatok gyakorlatában.

OLTP + OLAP: vázlat visszacsatolás a vállalatirányítási láncban

Most nézzük meg az OLAP kockák általános elképzelését és alkalmazási helyét a vállalati menedzsment láncban. Az OLAP (OnLine Analytical Processing) kifejezést Edgar Codd brit matematikus vezette be a korábban bevezetett OLTP (OnLine Transactions Processing) kifejezése mellé. Erről később lesz szó, de E. Codd természetesen nem csak a terminusokat, hanem az OLTP és az OLAP matematikai elméleteit is javasolta. Anélkül, hogy belemennénk a részletekbe, a modern értelmezés szerint az OLTP egy relációs adatbázis, amely információrögzítési, tárolási és visszakeresési mechanizmusnak tekinthető.

Megoldás módszertana

Az ilyen ERP-rendszerek (Enterprice Resource Planning), mint például az 1C7, 1C8, MS Dynamics AX, felhasználó-orientált szoftverfelületekkel (dokumentumok bevitele és szerkesztése stb.) és relációs adatbázissal (DB) rendelkeznek az információk tárolására és visszakeresésére, amelyet ma a következő képvisel: szoftvertermékek, mint például az MS SQL Server (SS).

Vegye figyelembe, hogy az ERP-rendszer adatbázisában regisztrált információk valóban nagyon értékes erőforrások. Nem csak az a lényeg, hogy a nyilvántartott információk biztosítsák a társaság aktuális dokumentumáramlását (bizonylatok kinyerése, helyesbítése, kinyomtatási és egyeztetési képesség stb.), és ne csak a pénzügyi kimutatások (adók, könyvvizsgálat stb.) számítási képességét biztosítsák. ). Vezetési szempontból sokkal fontosabb, hogy az OLTP rendszer (relációs adatbázis) valóban naprakész legyen. digitális modell vállalati tevékenység teljes méretben.

A folyamat irányításához azonban nem elegendő az ezzel kapcsolatos információk regisztrálása. A folyamatot a folyamat előrehaladását jellemző numerikus mutatók (KPI-k) rendszerében kell bemutatni. Ezenkívül a mutatók számára elfogadható értéktartományokat kell meghatározni. És csak akkor, ha a mutató értéke a megengedett intervallumon kívül esik, akkor ellenőrzési műveletet kell végrehajtani.

Az irányítás ilyen logikáját (vagy mitológiáját) tekintve mind az ókori görög filozófus, Platón, aki megalkotta a kormányos (kibernóz) képét, aki az evezőre támaszkodik, amikor a csónak letér az irányról, és Norbert Wiener amerikai matematikus, aki a számítógépes korszak előestéjén megalkotta a kibernetika tudományát.

Az OLTP módszerrel történő információrögzítés szokásos rendszerén kívül szükségünk van egy másik rendszerre - egy elemző rendszerre összegyűjtött információkat. Ez a kiegészítő, amely a vezérlőkörben a felügyelet és a vezérlőobjektum közötti visszacsatolás szerepét tölti be, egy OLAP rendszer vagy röviden egy OLAP kocka.

Mint szoftver megvalósítás Az OLAP-ban figyelembe vesszük az MS Analysis Services segédprogramot, amely az MS SQL Server (rövidítve SSAS) szabványos szállításának része. Vegyük észre, hogy E. Codd terve szerint az OLAP kockának az analitikában ugyanolyan átfogó cselekvési szabadságot kell biztosítania, mint az OLTP rendszernek és a relációs adatbázisnak (SQL Server) az információk tárolása és visszakeresése során.

OLAP logisztika

Most nézzük a konkrét konfigurációt külső eszközök, alkalmazási programok és technológiai műveletek, amelyeken az OLAP kocka automatizált működése alapul.

Feltételezzük, hogy a vállalat ERP rendszert használ, például 1C7 vagy 1C8, amelyen belül a szokásos módon rögzítik az információkat. Ennek az ERP-rendszernek az adatbázisa egy bizonyos szerveren található, és az MS SQL Server támogatja.

Azt is feltételezzük, hogy egy másik szerveren van telepítve szoftver, beleértve az MS Analysis Services (SSAS) segédprogrammal rendelkező MS SQL Servert, valamint az MS SQL Server Management Studio, MS C#, MS Excel és MS Visual Studio alkalmazásokat. Ezek a programok együtt alkotják a szükséges kontextust: az OLAP-kockák fejlesztője számára szükséges eszközöket és felületeket.

Az SSAS szerveren van egy szabadon terjesztett, blat nevű program, amelyet (paraméterekkel) innen hívnak parancssorés postai szolgáltatást nyújt.

Alkalmazotti munkaállomásokon, belül helyi hálózat, többek között MS Excel programok (legalább 2003-as verziók) vannak telepítve, valamint adott esetben egy speciális illesztőprogram, amely biztosítja, hogy az MS Excel együttműködjön az MS Analysis Services szolgáltatással (kivéve, ha a megfelelő illesztőprogram már benne van az MS Excelben).

A határozottság kedvéért feltételezzük, hogy az alkalmazottak munkaállomásai rendelkeznek operációs rendszer Windows XP és szervereken - Windows Server 2008. Ezenkívül az MS SQL Server 2005 használható SQL Serverként, az Enterprise Edition (EE) vagy a Developer Edition (DE) verzióval a kiszolgálóra az OLAP kockával együtt. Ezekben a kiadásokban lehetőség van az ún. „félig additív intézkedések”, azaz a közönséges összegeken kívüli további összesített függvények (statisztika) (például szélsőség vagy átlag).

OLAP kocka tervezés (OLAP kubizmus)

Ejtsünk néhány szót magáról az OLAP-kocka kialakításáról. A statisztika nyelvén az OLAP-kocka teljesítménymutatók összessége, amelyeket minden szükséges szakaszban kiszámítanak, például a szállítási mutatót vevők, áruk, dátumok szerinti szakaszokban stb. Az OLAP-kockákkal foglalkozó orosz szakirodalomban az angolról való közvetlen fordítás miatt a mutatókat „méréseknek”, a szakaszokat pedig „dimenzióknak” nevezik. Ez egy matematikailag helyes, de szintaktikailag és szemantikailag nem túl sikeres fordítás. Az orosz „measure”, „dimension”, „dimension” szavak jelentése és írásmódja szinte megegyezik, míg az angol „measure” és „dimension” eltér mind helyesírási, mind jelentési szempontból. Ezért előnyben részesítjük a hagyományos orosz statisztikai „mutató” és „kivágás” kifejezéseket, amelyek jelentésükben hasonlóak.

Az OLAP-kocka szoftveres megvalósítására számos lehetőség van az adatok rögzítésére szolgáló OLTP-rendszerrel kapcsolatban. Csak egy sémát fogunk figyelembe venni, a legegyszerűbb, legmegbízhatóbb és leggyorsabb.

Ebben a kialakításban az OLAP és az OLTP nem osztja meg a táblákat, és az OLAP elemzés a lehető legrészletesebben kerül kiszámításra a kocka frissítési (folyamat) szakaszában, amely megelőzi a használati szakaszt. Ezt a sémát MOLAP-nak (Multidimensional OLAP) hívják. Hátránya az ERP-vel való aszinkronitás és a magas memóriaköltségek.

Bár formálisan egy OLAP-kockát fel lehet építeni az összes (ezer) ERP-rendszer relációs adatbázis-táblázatának adatforrásként és azok összes (több száz) mezőjéből indikátorként vagy szakaszként, a valóságban ezt nem szabad megtenni. Viszont. A kockába való betöltéshez célszerűbb külön adatbázist készíteni, amelyet „kirakatnak” vagy „raktárnak” neveznek.

Több ok is rákényszerít bennünket erre.

Először, egy OLAP-kockát valós adatbázistáblákhoz kötve minden bizonnyal létrejön technikai problémák. A táblázatban lévő adatok megváltoztatása kiválthatja a kocka frissítését, és a kocka frissítése nem feltétlenül gyors folyamat, így a kocka folyamatos újjáépítés állapotában lesz; Ugyanakkor a kockafrissítési eljárás blokkolhatja (olvasáskor) az adatbázistáblák adatait, lelassítva a felhasználók munkáját az adatok ERP rendszerben történő rögzítésében.
Másodszor, A túl sok mutató és vágás drámaian megnöveli a kocka tárolóterületét a szerveren. Ne felejtsük el, hogy az OLAP-kocka nemcsak a forrásadatokat tárolja, mint az OLTP-rendszerben, hanem az összes lehetséges szakaszon (sőt az összes szekció összes kombinációján) összesített mutatót is. Emellett ennek megfelelően lelassul a kocka frissítési sebessége, végső soron az elemzések és az ezek alapján készült felhasználói jelentések elkészítésének, frissítésének sebessége is.
Harmadszor, túl sok mező (jelzők és szakaszok) problémákat okoz az OLAP fejlesztői felületén, mert az elemek listája hatalmas lesz.
Negyedszer, Az OLAP kocka nagyon érzékeny az adatintegritás megsértésére. A kocka nem építhető fel, ha a kulcsadatok nem a kocka mezőkapcsolatok felépítésében meghatározott hivatkozáson találhatók. Az ideiglenes vagy állandó integritássértések és az üres mezők gyakoriak az ERP rendszer adatbázisában, de ez egyáltalán nem alkalmas az OLAP számára.

Azt is hozzáteheti, hogy az ERP rendszernek és az OLAP kockának különböző szervereken kell elhelyezkednie a terhelés megosztásához. De ha vannak közös táblák az OLAP-hoz és az OLTP-hez, akkor a hálózati forgalom problémája is felmerül. Gyakorlatilag megoldhatatlan problémák merülnek fel ilyenkor, amikor több, egymástól eltérő ERP rendszert (1C7, 1C8, MS Dynamics AX) kell egyetlen OLAP kockába összevonni.

Valószínűleg továbbra is halmozhatjuk a technikai problémákat. De ami a legfontosabb, ne feledje, hogy az OLTP-vel ellentétben az OLAP nem az adatok rögzítésének és tárolásának eszköze, hanem egy elemző eszköz. Ez azt jelenti, hogy nincs szükség „piszkos” adatok feltöltésére és letöltésére az ERP-ből az OLAP-ba „csak abban az esetben”. Ellenkezőleg, először ki kell dolgozni egy koncepciót a vállalat menedzselésére, legalább a KPI rendszer szintjén, majd meg kell tervezni egy alkalmazás adattárházat (raktárt), amely ugyanazon a szerveren található, mint az OLAP-kocka, és tartalmaz egy kis , a menedzsmenthez szükséges finomított adatmennyiség az ERP-ből.

A rossz szokások népszerűsítése nélkül az OLTP-vel kapcsolatos OLAP-kocka a jól ismert „még mindig”-hoz hasonlítható, amelyen keresztül a valódi regisztráció „erjesztett tömegéből” egy „tiszta terméket” vonnak ki.

Tehát azt kaptuk, hogy az OLAP adatforrása egy speciális adatbázis (raktár), amely ugyanazon a szerveren található, mint az OLAP. Ez általában két dolgot jelent. Először is speciális eljárásoknak kell lenniük, amelyek ERP-adatbázisokból raktárt hoznak létre. Másodszor, az OLAP kocka aszinkron az ERP rendszereivel.

A fentiek figyelembevételével a számítási folyamat architektúra következő változatát javasoljuk.

Megoldás architektúra

Tegyük fel, hogy egy bizonyos vállalatnak (holdingnak) sok ERP rendszere található különböző szervereken, amelyek elemzési adatait egy OLAP-kockán belül szeretnénk konszolidálni. Hangsúlyozzuk, hogy az ismertetett technológiában az ERP rendszerek adatait raktárszinten kombináljuk, az OLAP kocka kialakítását változatlanul hagyva.

Az OLAP szerveren képfájlokat (üres másolatokat) készítünk ezen ERP rendszerek adatbázisairól. Időnként (éjszakánként) végrehajtjuk a megfelelő aktív ERP-adatbázisok részleges replikációját ezekre az üres másolatokra.

Ezután elindul az SP (tárolt eljárás), amely ugyanazon az OLAP szerveren, hálózati forgalom nélkül, az ERP rendszer adatbázisainak részleges replikái alapján létrehoz (vagy feltölt) egy raktárt (raktárt) - az OLAP kocka adatforrását.

Ezután elindul a standard eljárás a kocka raktári adatok felhasználásával történő frissítésére/építésére (Folyamatművelet az SSAS felületen).

Nézzük meg a technológia néhány vonatkozását. Milyen munkát végeznek az SP-k?

A részleges replikáció eredményeként az aktuális adatok az OLAP-kiszolgálón lévő ERP-rendszerek képében jelennek meg. A részleges replikációt egyébként kétféleképpen lehet végrehajtani.

Először is, az ERP rendszer adatbázisában lévő összes táblából csak azokat másolják át a részleges replikáció során, amelyek a raktár felépítéséhez szükségesek. Ezt a táblanevek rögzített listája vezérli.

Másodszor, a részleges replikáció azt is jelentheti, hogy a tábla nem minden mezője másolódik, hanem csak azok, amelyek részt vesznek a raktár felépítésében. A másolandó mezők listája vagy megadásra kerül, vagy dinamikusan jön létre az SP-ben a másolat képében (ha nem minden mező szerepel kezdetben a táblázat másolatában).

Természetesen nem lehet teljes táblasorokat másolni, hanem csak új rekordokat lehet hozzáadni. Ez azonban komoly kellemetlenségeket okoz az ERP-revíziók „visszamenőleges” elszámolása során, ami a valós rendszerekben gyakran előfordul. Így könnyebb minden további nélkül átmásolni az összes rekordot (vagy frissíteni a „farkat” egy bizonyos dátumtól kezdve).

Ezután az SP fő feladata az ERP rendszer adatainak raktár formátumba konvertálása. Ha csak egy ERP rendszer van, akkor az átalakítás feladata elsősorban a szükséges adatok másolása, esetleg újraformázása. De ha több különböző felépítésű ERP rendszert kell összevonni ugyanabban az OLAP kockában, akkor az átalakítások bonyolultabbá válnak.

A több különböző ERP rendszer egy kockában való összevonásának feladata különösen nehéz, ha az objektumok halmazai (árukönyvtárak, vállalkozók, raktárak stb.) részben átfedik egymást, az objektumok jelentésük azonos, de természetesen eltérően íródnak le a könyvtárakban különböző rendszerek(kódok, azonosítók, nevek stb. értelmében).

Valójában egy nagy holdingban egy ilyen kép alakul ki, amikor több, azonos típusú, önállóan működő társasága megközelítőleg ugyanazon a területen végez megközelítőleg azonos típusú tevékenységet, de saját és nem egyeztetett regisztrációs rendszert alkalmaz. Ebben az esetben az adatok raktárszintű konszolidálásakor nem nélkülözheti a segédleképezési táblákat.

Fordítsunk egy kis figyelmet a raktári tárolási architektúrára. Az OLAP kocka sémát jellemzően „csillag” formájában ábrázolják, azaz. mint adattábla, amelyet könyvtárak „sugarai” vesznek körül - másodlagos kulcsértékek táblázatai. A táblázat a „mutatók” blokkja; Ebben az esetben a címtár lehet tetszőleges kiegyensúlyozatlan fa vagy kiegyensúlyozott hierarchia, például áruk vagy vállalkozók többszintű osztályozása. Egy OLAP-kockában a raktárból származó adattábla numerikus mezői automatikusan „mutatókká” (vagy mértékekké) válnak, a szakaszok (vagy dimenziók) pedig másodlagos kulcstáblázatok segítségével határozhatók meg.

Ez egy vizuális „pedagógiai” leírás. Valójában egy OLAP-kocka architektúrája sokkal összetettebb lehet.

Először is, egy raktár több „csillagból” állhat, amelyek esetleg közös könyvtárakon keresztül kapcsolódnak egymáshoz. Ebben az esetben az OLAP-kocka több kocka (több adatblokk) uniója lesz.

Másodszor, egy csillag „sugara” nem csak egy könyvtár lehet, hanem egy teljes (hierarchikus) fájlrendszer.

Harmadszor, a meglévő dimenziószakaszok alapján az OLAP fejlesztői felület eszközeivel új hierarchikus szakaszok definiálhatók (mondjuk kevesebb szinttel, eltérő szintsorrenddel stb.)

Negyedszer, a meglévő indikátorok és szakaszok alapján, MDX nyelvi kifejezések segítségével új mutatók (számítások) definiálhatók. Fontos megjegyezni, hogy az új kockák, új mutatók, új szakaszok automatikusan teljesen integrálódnak az eredeti elemekkel. Azt is meg kell jegyezni, hogy a rosszul megfogalmazott számítások és a hierarchikus szakaszok jelentősen lelassíthatják az OLAP kocka működését.

MS Excel, mint interfész az OLAP-pal

Külön érdekesség az OLAP kockákat tartalmazó felhasználói felület. A legteljesebb interfészt természetesen maga az SSAS segédprogram biztosítja. Ez magában foglal egy OLAP kocka fejlesztői eszközkészletet, egy interaktív jelentéstervezőt és egy ablakot az OLAP kockával való interaktív munkavégzéshez, MDX nyelvű lekérdezések használatával.

Magán az SSAS-on kívül számos olyan program létezik, amely interfészt biztosít az OLAP-nak, kisebb-nagyobb mértékben lefedi a funkcionalitásukat. De van köztük egy, amelynek véleményünk szerint tagadhatatlan előnyei vannak. Ez az MS Excel.

Az MS Excel-lel való interfészt egy speciális illesztőprogram biztosítja, amely külön letölthető vagy az Excel disztribúció része. Nem fedi le az összes OLAP funkcionalitást, de az MS Excel verziószámának növekedésével ez a lefedettség egyre szélesebb lesz (például az MS Excel 2007-ben úgy tűnik grafikus kép KPI, ami nem volt az MS Excel 2003-ban stb.).

Természetesen a meglehetősen teljes funkcionalitás mellett az MS Excel fő előnye ennek a programnak a széleskörű elterjedése, valamint az irodai felhasználók elsöprő számú ismeretsége. Ebben az értelemben, a többi interfész-programtól eltérően, a cégnek nem kell semmit sem vásárolnia, és senkit sem kell tovább képeznie.

Az MS Excel, mint az OLAP-pal való interfész nagy előnye, hogy az OLAP-jelentésben kapott adatokat önállóan tovább tudja feldolgozni (vagyis az OLAP-ból nyert adatok továbbtanulmányozása ugyanazon Excel más lapjain, már nem OLAP-eszközök használatával, hanem szokásos Excel eszközök használatával).

Facubi éjszakai kezelési ciklus

Most leírjuk az OLAP működés napi (éjszakai) számítási ciklusát. A számítás a C# 2005 nyelven írt és Task Scheduler-en keresztül elindított facubi program vezérlése alatt történik egy raktárral és SSAS-szal rendelkező szerveren. Kezdetben a facubi felmegy az Internetre, és leolvassa az aktuális árfolyamokat (egy pénznemben számos mutatót ábrázol). Ezután hajtsa végre a következő lépéseket.

Először a facubi olyan SP-ket indít el, amelyek a helyi hálózaton elérhető különböző ERP-rendszerek (holding elemek) adatbázisainak részleges replikációját végzik. A replikáció, mint mondtuk, előre elkészített „háttérre” - az SSAS-kiszolgálón található távoli ERP-rendszerek képeire - történik.

Másodszor, az SP-n keresztül leképezés történik az ERP-replikákról a raktári tárolóra - egy speciális DB-re, amely az OLAP-kockaadatok forrása és az SSAS-kiszolgálón található. Ebben az esetben három fő feladatot oldanak meg:

ERP adatok a szükséges kockaformátumokhoz igazítva; Táblákról és táblázatmezőkről is beszélünk. (Néha a szükséges táblázatot „módosítani” kell, mondjuk több MS Excel-lapból.) A hasonló adatok eltérő formátumúak lehetnek a különböző ERP-kben, például az 1C7 könyvtárak kulcsazonosító mezőinek 36 számjegyű karakterkódja 8 hosszúságú. , és _idrref mezők az 1С8 könyvtárakban – 32 hosszúságú hexadecimális számok;
feldolgozás során logikai adatellenőrzés (beleértve a hiányzó adatok helyére alapértelmezett „defaultok” írását, ahol lehetséges) és integritás-ellenőrzés, pl. az elsődleges és másodlagos kulcsok jelenlétének ellenőrzése a megfelelő osztályozókban;
kódkonszolidáció objektumok, amelyeknek ugyanaz a jelentése a különböző ERP-kben. Például a különböző ERP-k címtárainak megfelelő elemei azonos jelentéssel bírhatnak, mondjuk ugyanazt a partnert jelentik. A kódok konszolidálásának problémáját leképezési táblák felépítésével oldják meg, ahol ugyanazon objektumok különböző kódjait egyesítik.

Harmadszor, a facubi elindítja a szabványos eljárást a Process kocka adatok frissítésére (az SSAS segédprogramokból).

Az ellenőrző listák szerint a facubi e-maileket küld a feldolgozási lépések előrehaladásáról.

A facubi végrehajtása után a Task Scheduler számos programot elindít excel fájlokat, amelyben az OLAP kocka indikátorok alapján előre elkészítik a riportokat. Mint mondtuk, az MS Excelnek van egy különlegessége szoftver interfész(külön letölthető vagy beépített illesztőprogram) az OLAP kockákkal való munkához (SSAS-szal). Az MS Excel indításakor bekapcsolnak az MS VBA programok (például makrók), amelyek biztosítják a jelentések adatainak frissítését; a riportokat szükség esetén módosítjuk és ellenőrző listák szerint postai úton (blat program) küldjük el a felhasználóknak.

Az SSAS-kiszolgálóhoz hozzáféréssel rendelkező helyi hálózati felhasználók „élő” jelentéseket kapnak az OLAP-kockához konfiguráltan. (Elvileg ők maguk, mindenféle levél nélkül frissíthetik a náluk lévő OLAP-jelentéseket MS Excelben helyi számítógépek.) A helyi hálózaton kívüli felhasználók vagy eredeti jelentéseket kapnak, de korlátozott funkcionalitással, vagy számukra (az OLAP jelentések MS Excelben történő frissítése után) speciális „halott” jelentéseket számítanak ki, amelyek nem érik el az SSAS szervert.

Az eredmények értékelése

Fentebb beszéltünk az OLTP és az OLAP aszinkronjáról. A szóban forgó technológiai változatban az OLAP kocka frissítési ciklus éjszaka történik (mondjuk hajnali 1-kor kezdődik). Ez azt jelenti, hogy az aktuális munkanapon a felhasználók a tegnapi adatokkal dolgoznak. Mivel az OLAP nem rögzítési eszköz (nézze meg a dokumentum legfrissebb változatát), hanem felügyeleti eszköz (értse a folyamat trendjét), az ilyen késés általában nem kritikus. Szükség esetén azonban még a kocka architektúra (MOLAP) leírt változatában is naponta többször is elvégezhető a frissítés.

A frissítési eljárások végrehajtási ideje az OLAP kocka tervezési jellemzőitől (több-kevesebb bonyolultság, többé-kevésbé sikeres indikátorok és szekciók meghatározása), valamint a külső OLTP rendszerek adatbázisainak mennyiségétől függ. A tapasztalatok szerint a raktárépítési folyamat több perctől két óráig tart, a kockafrissítési eljárás (Process) 1-20 percig tart. Összetett OLAP kockákról beszélünk, amelyek több tucat csillag típusú struktúrát egyesítenek, több tucat közös „sugarról” (referencia szakaszról) és több száz indikátorról. Külső ERP rendszerek adatbázisainak mennyiségét a szállítási dokumentumok alapján becsülve évente több százezer dokumentumról és ennek megfelelően több millió terméksorról beszélünk. A felhasználót érdeklő történelmi feldolgozási mélység három-öt év volt.

A leírt technológiát számos nagyvállalat alkalmazza: 2008 óta a Russian Fish Company (RRK) és az Russian Sea Company (RM), 2012 óta a Santa Bremor cég (SB). Egyes vállalatok elsősorban kereskedelmi és beszerző cégek (PPC), mások termelő vállalatok (hal- és tenger gyümölcsei feldolgozó üzemek a Moldovai Köztársaságban és a Fehérorosz Köztársaságban). Valamennyi vállalat nagy holding, amely több vállalatot egyesít független és különféle számítógépes könyvelési rendszerekkel - a szabványos ERP-rendszerektől, mint az 1C7 és 1C8, a DBF és Excel alapú „relic” könyvelési rendszerekig. Hozzáteszem, hogy az OLAP kockák üzemeltetésének leírt technológiája (a fejlesztési szakasz figyelembevétele nélkül) vagy egyáltalán nem igényel speciális alkalmazottakat, vagy egy főállású üzleti elemző feladata. A feladat évek óta automatikusan fut, és a vállalati alkalmazottak különböző kategóriáinak napi rendszerességgel látja el az aktuális jelentéseket.

A megoldás előnyei és hátrányai

A tapasztalat azt mutatja, hogy a javasolt megoldás meglehetősen megbízható és könnyen használható. Könnyen módosítható (új ERP-k csatlakoztatása/lekapcsolása, új indikátorok és szekciók létrehozása, Excel jelentések és levelezési listáik létrehozása és módosítása) változatlanság nélkül vezérlő program facubi.

Az MS Excel, mint interfész az OLAP-pal, kellő kifejezőképességet biztosít, és lehetővé teszi a különböző kategóriájú irodai alkalmazottak számára, hogy gyorsan megismerjék az OLAP technológiát. A felhasználó napi „standard” OLAP jelentéseket kap; az MS Excel interfész OLAP használatával, önállóan tud OLAP jelentéseket készíteni MS Excelben. Ezenkívül a felhasználó önállóan folytathatja az OLAP-jelentésekben található információk feltárását rendszeres funkciók az MS Excel.

A „finomított” raktári adatbázis, melyben (a kocka építése során) több heterogén ERP rendszer konszolidálódik, akár OLAP nélkül is, lehetővé teszi a megoldást (SSAS szerveren, a Transact SQL-ben lekérdezési módszerrel vagy SP metódussal). stb.) számos alkalmazott menedzsment probléma. Emlékezzünk vissza, hogy a raktári adatbázis-struktúra egységes és sokkal egyszerűbb (a táblák számát és a táblamezők számát tekintve), mint az eredeti ERP adatbázis-struktúrái.

Külön megjegyezzük, hogy a javasolt megoldásunkban lehetőség van különböző ERP-rendszerek egy OLAP-kockában történő összevonására. Ez lehetővé teszi a teljes holdingra vonatkozó elemzések beszerzését és az elemzések hosszú távú folytonosságának fenntartását, amikor egy vállalat egy másik számviteli ERP rendszerre költözik, például amikor 1C7-ről 1C8-ra lép át.

A MOLAP kocka modellt használtuk. Ennek a modellnek az előnyei a működési megbízhatóság és a felhasználói kérések gyors feldolgozása. Hátrányok: Az OLAP és az OLTP aszinkron, valamint nagy mennyiségű memória az OLAP tárolására.

Végezetül, itt van egy másik érv az OLAP mellett, amely alkalmasabb lehetett a középkorban. Mert bizonyító ereje a tekintélyen nyugszik. Egy szerény, egyértelműen alulértékelt brit matematikus, E. Codd a 60-as évek végén dolgozta ki a relációs adatbázisok elméletét. Ennek az elméletnek akkora ereje volt, hogy most, 50 év után már nehéz nem relációs adatbázist és az SQL-től eltérő adatbázis-lekérdező nyelvet találni.

A relációs adatbázisok elméletén alapuló OLTP technológia volt Codd első ötlete. Valójában az OLAP-kockák koncepciója a második ötlete, amelyet a 90-es évek elején fogalmazott meg. Még matematikus nélkül is számíthat arra, hogy a második ötlet ugyanolyan hatékony lesz, mint az első. Vagyis a számítógépes elemzés szempontjából az OLAP-ötletek hamarosan átveszik a világot, és kiszorítják az összes többit. Egyszerűen azért, mert az analitika témaköre az OLAP-ban találja meg átfogó matematikai megoldását, és ez a megoldás „megfelelő” (B. Spinoza kifejezése) az analitika gyakorlati problémájának. A „megfelelően” azt jelenti Spinozában, hogy Isten maga sem gondolhatott volna jobbat...

Larson B. Üzleti elemzés fejlesztése in Microsoft SQL Szerver 2005. – Szentpétervár: „Péter”, 2008.
Codd E. Az adatbázis-alnyelvek relációs teljessége, Data Base Systems, Courant Computer Science Sumposia Series 1972, v. 6, Englwood cliffs, N.Y., Prentice – Hall.

Az OLAP (Online Analytical Processing) adatkockák lehetővé teszik a többdimenziós adatok hatékony kinyerését és elemzését. Más típusú adatbázisoktól eltérően az OLAP adatbázisokat kifejezetten analitikai feldolgozásra és mindenféle adatkészlet gyors kinyerésére tervezték. Valójában számos lényeges különbség van a szabványos relációs adatbázisok, például az Access vagy az SQL Server és az OLAP adatbázisok között.

Rizs. 1. Csatlakozás kocka OLAP az Excel-munkafüzethez használja a parancsot Az Analytics szolgáltatásokból

Töltse le a jegyzetet a vagy a

A relációs adatbázisokban az információk rekordok formájában jelennek meg, amelyeket egymás után hozzáadnak, törölnek és frissítenek. Az OLAP adatbázisok csak tárolnak pillanatfelvétel adat. Az OLAP-adatbázisban az információk egyetlen adatblokkként archiválódnak, és csak igény szerinti kimenetre szolgálnak. Bár hozzá lehet adni egy OLAP adatbázishoz új információk, a meglévő adatokat ritkán szerkesztik, még kevésbé törlik.

A relációs adatbázisok és az OLAP adatbázisok szerkezetileg különböznek egymástól. A relációs adatbázisok jellemzően egymáshoz kapcsolódó táblák halmazából állnak. Egyes esetekben egy relációs adatbázis annyi táblát tartalmaz, hogy nagyon nehéz meghatározni, hogyan kapcsolódnak egymáshoz. Az OLAP-adatbázisokban az egyes adatblokkok közötti kapcsolatokat előre meghatározzák, és az OLAP-kockáknak nevezett struktúrában tárolják. Az adatkockák teljes információt tárolnak az adatbázis hierarchikus felépítéséről és kapcsolatairól, ami nagyban leegyszerűsíti a navigációt. Emellett sokkal egyszerűbb riportokat készíteni, ha előre tudja, hogy a kinyert adatok hol találhatók, és milyen egyéb adatok vannak hozzárendelve.

A fő különbség a relációs adatbázisok és az OLAP adatbázisok között az információ tárolásának módja. Az OLAP-kockában lévő adatok ritkán jelennek meg általános nézet. Az OLAP adatkockák jellemzően előre megtervezett formátumban tartalmazzák az információkat. Így az adatok kockákban történő csoportosítása, szűrése, rendezése és egyesítése műveletei az információkkal való feltöltést megelőzően kerülnek végrehajtásra. Ez a lehető legegyszerűbbé teszi a kért adatok lekérését és megjelenítését. A relációs adatbázisokkal ellentétben nincs szükség az információk megfelelő rendszerezésére a képernyőn való megjelenítés előtt.

Az OLAP adatbázisokat általában informatikai rendszergazdák hozzák létre és tartják karban. Ha a szervezete nem rendelkezik olyan struktúrával, amely az OLAP-adatbázisok kezeléséért felelős, akkor a relációs adatbázis-adminisztrátorhoz fordulhat, és kérheti a megvalósítást. vállalati hálózat legalább néhány OLAP megoldást.

Csatlakozás OLAP adatkockához

Az OLAP-adatbázis eléréséhez először kapcsolatot kell létesítenie az OLAP-kockával. Először lépjen a Szalag fülre Adat. Kattintson a gombra Más forrásokbólés válassza ki a parancsot a legördülő menüből Az Analytics szolgáltatásokból(1. ábra).

Amikor kiválasztja az Adatkapcsolat varázsló megadott parancsát (2. ábra). Fő feladata, hogy segítsen a szerverrel való kapcsolat kialakításában, amelyet az Excel az adatkezelés során használ majd.

1. Először meg kell adnia az Excel regisztrációs adatait. Adja meg a kiszolgáló nevét, a bejelentkezési nevet és az adathozzáférési jelszót a párbeszédpanel mezőiben, amint az ábra mutatja. 2. Kattintson a gombra Következő. Ha fiókjával csatlakozik Windows bejegyzések, majd állítsa be a kapcsolót Használja a Windows hitelesítést.

2. A legördülő listából válassza ki azt az adatbázist, amellyel dolgozni fog (3. ábra). A jelenlegi példa az Analysis Services Tutorial adatbázist használja. Miután kiválasztotta ezt az adatbázist, az alábbi lista kéri, hogy importálja a benne elérhető összes OLAP-kockát. Válassza ki a kívánt adatkockát és kattintson a gombra Következő.

Rizs. 3. Válasszon ki egy működő adatbázist és OLAP kocka amelyeket adatelemzéshez kíván használni

3. A következő varázsló párbeszédpanelen, az ábrán látható. 4, meg kell adnia leíró információkat a létrehozandó kapcsolatról. ábrán látható párbeszédpanel összes mezője. 4, nem kötelező kitölteni. Az aktuális párbeszédablakot mindig figyelmen kívül hagyhatja kitöltése nélkül, és ez semmilyen módon nem befolyásolja a kapcsolatot.

Rizs. 4. Módosítsa a kapcsolatleíró információkat

4. Kattintson a gombra Kész a kapcsolat létrehozásának befejezéséhez. Egy párbeszédpanel jelenik meg a képernyőn Adatok importálása(5. ábra). Állítsa be a kapcsolót PivotTable jelentésés kattintson az OK gombra a pivot tábla létrehozásának megkezdéséhez.

OLAP kocka szerkezet

Amikor pivot táblát hoz létre egy OLAP adatbázisból, észre fogja venni, hogy a munkaablak ablaka Pivot tábla mezői más lesz, mint egy normál pivot tábla esetében. Ennek oka a PivotTable elrendezésében rejlik, hogy pontosan tükrözze a hozzá csatolt OLAP-kocka szerkezetét. Ahhoz, hogy a lehető leggyorsabban navigálhasson egy OLAP-kockán, alaposan meg kell ismerkednie az összetevőivel és azok interakciójával. ábrán. A 6. ábra egy tipikus OLAP-kocka alapvető felépítését mutatja.

Mint látható, az OLAP-kocka fő összetevői a dimenziók, a hierarchiák, a szintek, a tagok és a mértékek:

Méretek. Az elemzett adatelemek főbb jellemzői. Gyakori példák a dimenziókra: Termékek, Ügyfél és Alkalmazott. ábrán. A 6. ábra a Termékek dimenzió felépítését mutatja.
Hierarchiák. Szintek előre meghatározott összesítése egy adott dimenzióban. A hierarchia lehetővé teszi összefoglaló adatok létrehozását és elemzését a struktúra különböző szintjein anélkül, hogy belemélyedne az e szintek közötti kapcsolatokba. ábrán látható példában. A 6. ábra szerint a Termékek dimenziónak három szintje van, amelyek a termékkategóriák egyetlen hierarchiájába vannak összesítve.
Szintek. A szintek olyan kategóriák, amelyek egy közös hierarchiába vannak összesítve. Tekintse a rétegeket adatmezőknek, amelyek egymástól függetlenül lekérdezhetők és elemezhetők. ábrán. 6 csak három szint van: Kategória, Alkategória és Terméknév.
tagok. Egyetlen elem adatok a dimenzión belül. A tagokhoz általában egy dimenziókból, hierarchiákból és szintekből álló OLAP-struktúrán keresztül lehet hozzáférni. ábra példájában. A Terméknév szinthez 6 tag van meghatározva. A többi szintnek saját tagjai vannak, amelyek nem jelennek meg a szerkezetben.
Intézkedések- ez valós adat OLAP kockákban. A mérések saját méretükben vannak tárolva, amelyeket mértékdimenzióknak nevezünk. A mértékek lekérdezhetők a dimenziók, hierarchiák, szintek és tagok bármilyen kombinációjával. Ezt az eljárást „szeletelési” intézkedéseknek nevezik.

Most, hogy ismeri az OLAP-kockák szerkezetét, nézzük meg újra a kimutatás mezőlistáját. A rendelkezésre álló mezők elrendezése egyértelművé válik, és nem okoz panaszt. ábrán. A 7. ábra azt mutatja, hogy a mezőlista hogyan ábrázolja az OLAP pivot tábla elemeit.

Az OLAP PivotTable mezőinek listájában a mértékek jelennek meg először, és egy összeg ikon (szigma) jelzi őket. Csak ezek az adatelemek lehetnek a VALUE régióban. A listában utánuk a táblázat képpel ellátott ikonnal jelzett méretek találhatók. Példánk az Ügyfél dimenziót használja. Ez a dimenzió számos hierarchiát tartalmaz. A hierarchia kiterjesztése után megtekintheti az egyes adatszinteket. Egy OLAP-kocka adatszerkezetének megtekintéséhez egyszerűen navigáljon a pivot tábla mezőinek listájában.

Az OLAP Pivot Tables korlátai

Amikor az OLAP-kimutatástáblákkal dolgozik, ne feledje, hogy az Analysis Services OLAP-környezetében használja a kimutatás-adatforrást. Ez azt jelenti, hogy az adatkocka minden viselkedési aspektusát, a dimenzióktól kezdve a kockában szereplő mérőszámokig, szintén az OLAP analitikai szolgáltatások vezérlik. Ez viszont az OLAP pivot táblákon végrehajtható műveletek korlátozásához vezet:

A kimutatástáblázat ÉRTÉKEK területén a mértékeken kívül nem helyezhet el mezőket;
az összegzéshez használt függvényt nem lehet megváltoztatni;
Nem hozhat létre számított mezőt vagy számított tételt;
A mezőnevek módosításai azonnal törlésre kerülnek, miután a mezőt eltávolították a pivot táblából;
Az oldalmező paramétereinek módosítása nem megengedett;
parancs nem elérhető Megmutatoldalakat;
opció letiltva Megmutataláírásokatelemeket ha az értékterületen nincsenek mezők;
opció letiltva Részösszegek a szűrő által kiválasztott oldalelemek szerint;
paraméter nem elérhető Háttérkér;
az ÉRTÉKEK mezőben való dupla kattintás után csak az első 1000 rekord ad vissza a pivot tábla gyorsítótárából;
jelölőnégyzet letiltva Optimalizálásmemória.

Autonóm adatkockák létrehozása

Egy szabványos pivot táblában a forrásadatok a helyi merevlemezen tárolódnak. Így mindig kezelheti őket, és megváltoztathatja a szerkezetet, még a hálózathoz való hozzáférés nélkül is. De ez semmiképpen sem vonatkozik az OLAP összefoglaló táblákra. Az OLAP pivot táblákban a gyorsítótár nem a helyi merevlemezen található. Ezért közvetlenül a helyi hálózatról való leválasztás után az OLAP pivot tábla nem fog működni. Egy ilyen táblázatban egyetlen mezőt sem fog tudni áthelyezni.

Ha továbbra is elemeznie kell az OLAP-adatokat, amikor nem csatlakozik hálózathoz, hozzon létre egy offline adatkockát. Ez egy külön fájl, amely a pivot tábla gyorsítótárát képviseli. Ez a fájl olyan OLAP-adatokat tárol, amelyeket a rendszer a helyi hálózatról való leválasztás után tekint meg. Önálló adatkocka létrehozásához először hozzon létre egy OLAP pivot táblát. Helyezze a kurzort a pivot táblába, és kattintson a gombra OLAP eszközök kontextuális lap Elemzés, amely a környezetfüggő lapok készletében található Munka a kimutatástáblákkal. Válasszon ki egy csapatot Offline OLAP mód(8. ábra).

Egy párbeszédpanel jelenik meg a képernyőn Beállítások elemre akkumulátor élettartama OLAP(9. ábra). Kattintson a gombra Offline adatfájl létrehozása. A képernyőn megjelenik a Data Cube File Creation Wizard első ablaka. Kattintson a gombra Következő az eljárás folytatásához.

A második lépésben (10. ábra) jelölje meg azokat a méreteket és szinteket, amelyeket az adatkocka tartalmazni fog. A párbeszédpanelen ki kell választania az OLAP adatbázisból importálni kívánt adatokat. Csak azokat a méreteket kell kiválasztani, amelyekre a számítógép helyi hálózatról való leválasztása után szükség lesz. Minél több dimenziót ad meg, annál nagyobb lesz az autonóm adatkocka.

Kattintson a gombra Következő hogy folytassa a harmadik lépéssel (11. ábra). Ebben az ablakban ki kell választani azokat a tagokat vagy adatelemeket, amelyek nem fognak szerepelni a kockában. Ha a jelölőnégyzet nincs bejelölve, a megadott elem nem lesz importálva, és felesleges helyet foglal el a helyi merevlemezen.

Adja meg az adatkocka helyét és nevét (12. ábra). Az adatkocka fájlok kiterjesztése .cub.

Egy idő után az Excel elmenti az offline adatkockát a megadott mappába. A teszteléshez kattintson duplán a fájlra, amely automatikusan létrehoz egy Excel-munkafüzetet, amely a kiválasztott adatkockához társított pivot táblát tartalmaz. Létrehozása után az offline adatkockát szétoszthatja minden érdeklődő felhasználó számára, aki offline LAN módban dolgozik.

Miután csatlakozott a helyi hálózathoz, megnyithatja az offline adatkockafájlt, és frissítheti azt, valamint a megfelelő adattáblázatot. Kérjük, vegye figyelembe, hogy bár az offline adatkockát akkor használják, amikor nincs hálózati hozzáférés, de igen kötelező a hálózati kapcsolat helyreállítása után frissül. Az offline adatkocka frissítésének kísérlete a hálózati kapcsolat megszakadása után hibához vezet.

Adatkocka függvények használata pivot táblákban

Az OLAP-adatbázisokban használt adatkocka-függvények pivot táblából is futtathatók. IN elavult verziók Az Excelben csak az Analysis Pack bővítmény telepítése után férhetett hozzá az adatkocka funkciókhoz. Az Excel 2013-ban ezek a funkciók be vannak építve a programba, ezért használhatók. Ahhoz, hogy teljes mértékben megértsük képességeiket, nézzünk meg egy konkrét példát.

Az egyik legtöbb egyszerű módokon Az adatkocka funkcióinak elsajátítása magában foglalja az OLAP pivot tábla adatkocka-képletekké alakítását. Ez az eljárás nagyon egyszerű, és lehetővé teszi az adatkocka-képletek gyors beszerzését anélkül, hogy azokat a semmiből hozná létre. Kulcs elv- cserélje ki a pivot tábla összes celláját az OLAP adatbázishoz kapcsolódó képletekre. ábrán. A 13. ábra egy OLAP adatbázishoz társított pivot táblát mutat.

Vigye a kurzort a pivot táblázat bármely pontjára, kattintson a gombra OLAP eszközök környezetfüggő szalaglap Elemzésés válassz egy csapatot Konvertálás képletekre(14. ábra).

Ha a kimutatástáblázat jelentésszűrő mezőt tartalmaz, az 1. ábrán látható párbeszédpanel jelenik meg a képernyőn. 15. Ebben az ablakban megadhatja, hogy az adatszűrő legördülő listáit képletté kívánja-e alakítani. Ha a válasz igen, a legördülő listák törlődnek, és helyette statikus képletek jelennek meg. Ha a jövőben legördülő listák használatával kívánja módosítani a pivot tábla tartalmát, törölje a jelölést a párbeszédpanel egyetlen négyzetéből. Ha kompatibilitási módban dolgozik egy kimutatáson, az adatszűrők automatikusan képletté alakulnak, előzetes figyelmeztetés nélkül.

Néhány másodperc múlva a kimutatás helyett olyan képletek jelennek meg, amelyek az adatkockákon futnak, és kimenetet biztosítanak az Excel ablakban. szükséges információkat. Kérjük, vegye figyelembe, hogy ez eltávolítja a korábban alkalmazott stílusokat (16. ábra).

Rizs. 16. Vessen egy pillantást a képletsorra: a cellák az adatkocka képleteket tartalmazzák

Mivel a megtekintett értékek már nem részei a kimutatásobjektumnak, hozzáadhat oszlopokat, sorokat és számított tagokat, és kombinálhatja őket más külső források, és módosítsa a jelentést is a legtöbbvel különböző módokon, beleértve a húzó és ejtő képleteket.

Számítások hozzáadása az OLAP pivot táblákhoz

IN korábbi verziók Az Excel OLAP pivot táblái nem tettek lehetővé egyéni számításokat. Ez azt jelenti, hogy nem lehetett hozzáadni egy további elemzési szintet az OLAP-pivotTable-okhoz ugyanúgy, mint a számított mezők és tagok hozzáadása a szokásos kimutatásokhoz (további információért kérjük, győződjön meg róla, hogy ismeri ezt az anyagot, mielőtt folytatná olvasás ).

Az Excel 2013 új OLAP-eszközöket – számított mértékeket és számított MDX-tagokat – vezet be. Már nem korlátozódik a DBA által biztosított OLAP-kockában lévő mértékek és tagok használatára. kapsz további funkciók elemzés egyéni számítások létrehozásával.

Bevezetés az MDX-be. Ha kimutatástáblát használ egy OLAP-kockával, akkor MDX (Multidimensional Expressions) lekérdezéseket ad ki az adatbázisnak. Az MDX egy lekérdezési nyelv, amelyet többdimenziós forrásokból (például OLAP-kockákból) származó adatok lekérésére használnak. Amikor egy OLAP-pivotTable-t módosítanak vagy frissítenek, a megfelelő MDX-lekérdezések elküldésre kerülnek az OLAP-adatbázisba. A lekérdezés eredménye visszakerül az Excelbe, és megjelenik a kimutatásterületen. Ez lehetővé teszi az OLAP-adatokkal való munkát a pivot tábla gyorsítótárának helyi másolata nélkül.

Számított mértékek és MDX-tagok létrehozásakor MDX nyelvi szintaxist kell használnia. Ezzel a szintaxissal a pivot tábla lehetővé teszi, hogy a számítások együttműködjenek az OLAP adatbázis-háttérrendszerrel. A könyvben tárgyalt példák alapvető MDX-terveken alapulnak, amelyek újat mutatnak be Excel függvények 2013. Ha összetett számított mértékeket és MDX-tagokat kell létrehoznia, időt kell szánnia az MDX képességeinek mélyebbre ásására.

Számított mértékek létrehozása. A számított mérték a számított mező OLAP verziója. Az ötlet egy új adatmező létrehozása a meglévő OLAP mezőkön végrehajtott néhány matematikai művelet alapján. ábrán látható példában. 17. pontja alapján egy OLAP összesítő táblázatot használnak, amely tartalmazza az áruk listáját és mennyiségét, valamint az egyes áruk értékesítéséből származó bevételeket. Hozzá kell adnunk egy új mérőszámot, amely kiszámítja a cikk egységenkénti átlagárát.

Elemzés Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök elem kiválasztása (18. ábra).

Rizs. 18. Válasszon ki egy menüpontot MDX Számított mérték

Egy párbeszédpanel jelenik meg a képernyőn Hozzon létre egy számított mértéket(19. ábra).

Kövesse az alábbi lépéseket:

2. Válassza ki azt a mértékcsoportot, amelyben az új számított mérték található. Ha ezt nem teszi meg, az Excel automatikusan az első elérhető mértékcsoportba helyezi az új mértéket.

3. A terepen MDX kifejezés(MDX) Írja be az új mértéket meghatározó kódot. A beviteli folyamat felgyorsításához használja a bal oldali listát a számításokhoz használandó meglévő mértékek kiválasztásához. Kattintson duplán a kívánt mértékre, hogy hozzáadja az MDX mezőhöz. A következő MDX-et használják az átlagos egységértékesítési ár kiszámításához:

4. Kattintson az OK gombra.

Ügyeljen a gombra Ellenőrizze az MDX-et, amely az ablak jobb alsó részén található. Kattintson erre a gombra az MDX szintaxis helyességének ellenőrzéséhez. Ha a szintaxis hibákat tartalmaz, megjelenik egy üzenet.

Miután befejezte az új számított mérték létrehozását, lépjen a listára Pivot tábla mezőiés válassza ki (20. ábra).

A számított mérték hatóköre csak az aktuális munkafüzetre vonatkozik. Más szavakkal, a számított mértékek nem közvetlenül az OLAP-kiszolgálókockában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a kiszámított mértékhez, hacsak nem nyitja meg általános hozzáférés a munkafüzetbe, különben nem teszi közzé az interneten.

Számított MDX-tagok létrehozása. Az MDX-számított tag egy normál számított tag OLAP-változata. Az ötlet egy új adatelem létrehozása a meglévő OLAP-elemeken végrehajtott néhány matematikai művelet alapján. ábrán látható példában. 22, OLAP pivot tábla használatos, amely tartalmazza a 2005–2008 közötti időszakra vonatkozó értékesítési információkat (negyedéves bontásban). Tegyük fel, hogy egy új elem, az első félév létrehozásával szeretné összesíteni az első és a második negyedév adatait. A harmadik és negyedik negyedévre vonatkozó adatokat is kombináljuk, új elemet alkotva az év második felében.

Rizs. 22. Új MDX számított tagokat fogunk hozzáadni az év első feléhez és az év második feléhez

Helyezze a kurzort bárhová a kimutatásban, és válassza ki a környezetfüggő lapot Elemzés kontextuális lapok készletéből Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök elem kiválasztása MDX számítógépes tag(23. ábra).

Egy párbeszédpanel jelenik meg a képernyőn (24. ábra).

Rizs. 24. Ablak Számított tétel létrehozása

Kövesse az alábbi lépéseket:

1. Adjon nevet a számított mértéknek!

2. Válassza ki azt a szülőhierarchiát, amelyhez új számított tagokat hoz létre. Beállítások elemre Szülő elemértéket rendeljen hozzá Minden. Ennek köszönhetően Excel beállítások egy kifejezés kiértékelésekor hozzáfér a szülőhierarchia összes eleméhez.

3. Az ablakban MDX kifejezésÍrja be az MDX szintaxist. Időt takaríthat meg a bal oldali lista segítségével az MDX-ben használni kívánt meglévő tagok kiválasztásához. Kattintson duplán a kiválasztott elemre, és az Excel hozzáadja az ablakhoz MDX kifejezés. ábrán látható példában. 24, az első és a második negyedév összegét számítják ki:

..&& +

.. && +

.. && + …

4. Kattintson az OK gombra. Az Excel megjeleníti az újonnan létrehozott MDX számított tagot a kimutatásban. ábrán látható módon. A 25. ábra szerint az új számított elem a többi számított elemmel együtt megjelenik a kimutatásban.

ábrán. A 26. ábra egy hasonló folyamatot szemléltet az év második felében számított tétel létrehozásához.

Figyeljük meg, hogy az Excel meg sem kísérli az eredeti MDX-tagok eltávolítását (27. ábra). A PivotTable továbbra is a 2005–2008-as évekhez tartozó rekordokat jeleníti meg negyedévenkénti bontásban. Ebben az esetben ez nem nagy baj, de a legtöbb esetben el kell rejteni az „extra” elemeket a konfliktusok elkerülése érdekében.

Rizs. 27. Az Excel a létrehozott MDX számított tagot eredeti tagként jeleníti meg. De még mindig jobb az eredeti elemek törlése az ütközések elkerülése érdekében

Ne feledje: A számított tagok csak az aktuális munkafüzetben találhatók. Más szavakkal, a számított mértékek nem közvetlenül az OLAP-kiszolgálókockában jönnek létre. Ez azt jelenti, hogy senki sem férhet hozzá a számított mértékhez vagy a számított taghoz, hacsak meg nem osztja a munkafüzetet vagy közzé nem teszi az interneten.

Vegye figyelembe, hogy ha egy OLAP-kockában a szülő hierarchia vagy a szülőelem megváltozik, az MDX által számított elem már nem működik. Ezt az elemet újra kell létrehoznia.

OLAP számítások kezelése. Az Excel olyan felületet biztosít, amely lehetővé teszi a számított mértékek és MDX-tagok kezelését az OLAP pivot táblákban. Helyezze a kurzort bárhová a kimutatásban, és válassza ki a környezetfüggő lapot Elemzés kontextuális lapok készletéből Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök elem kiválasztása Számításkezelés. Az ablakban Számításkezelés Három gomb áll rendelkezésre (28. ábra):

Teremt. Hozzon létre egy új számított mértéket vagy számított MDX-tagot.
Változás. Módosítsa a kiválasztott számítást.
Töröl. Törölje a kiválasztott számítást.

Rizs. 28. Párbeszédpanel Számításkezelés

Végezzen „mi lenne, ha” elemzést az OLAP-adatokon. Az Excel 2013-ban elvégezheti az OLAP kimutatástábláiban található adatok „mi lenne, ha” elemzését. Ennek köszönhetően új lehetőség megváltoztathatja az értékeket a kimutatásban, és újraszámíthatja a mértékeket és a tagokat az alapján végrehajtott változtatások. A változtatásokat az OLAP-kockába is visszaterjesztheti. A mi lenne, ha elemzési képességeinek kihasználásához hozzon létre egy OLAP-pivotTable-t, és válassza ki a környezetfüggő lapot Elemzés Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök válassza ki a csapatot Mi lenne, ha elemzés –> Mi lenne, ha elemzés engedélyezése(29. ábra).

Ettől kezdve megváltoztathatja a pivot tábla értékeit. A kiválasztott érték módosításához a kimutatásban kattintson rá a jobb gombbal, és válassza ki az elemet a helyi menüből (30. ábra). Az Excel újra futtatja a kimutatás összes számítását az Ön által végzett módosításokkal, beleértve a számított mértékeket és a számított MDX-tagokat is.

Rizs. 30. Válasszon ki egy elemet Vegye figyelembe a változást a pivot tábla kiszámításakor hogy módosítsa a pivot táblát

Alapértelmezés szerint a PivotTable-ban végzett szerkesztések a Mi-ha elemzési módban helyiek. Ha a módosításokat az OLAP-kiszolgálóra szeretné terjeszteni, válassza ki a módosítások közzétételére szolgáló parancsot. Válassza ki a környezetfüggő lapot Elemzés kontextuális lapok készletében található Munka a kimutatástáblákkal. A legördülő menüben OLAP eszközök elemek kiválasztása Mi lenne, ha elemzés – > Módosítások közzététele(31. ábra). A parancs futtatása engedélyezi a visszaírást az OLAP-kiszolgálón, ami azt jelenti, hogy a változtatások továbbíthatók a forrás OLAP-kockára. (Az OLAP-kiszolgáló módosításainak terjesztéséhez rendelkeznie kell a megfelelő jogosultságokkal a kiszolgáló eléréséhez. Forduljon az adatbázis-adminisztrátorhoz, hogy segítsen megszerezni az OLAP-adatbázis írási hozzáférési engedélyeit.)

A jegyzet Jelen, Alexander könyve alapján készült. . 9. fejezet

A sorozat előző cikkében (lásd: 2’2005) az SQL Server 2005 elemző szolgáltatásainak főbb újításairól volt szó. Ma közelebbről megvizsgáljuk a termékben található OLAP-megoldások létrehozására szolgáló eszközöket.

Röviden az OLAP alapjairól

Mielőtt az OLAP-megoldások létrehozására szolgáló eszközökről kezdenénk beszélni, ne feledjük, hogy az OLAP (On-Line Analytical Processing) egy összetett, többdimenziós adatelemzési technológia, amelynek koncepcióját E.F. Codd, a híres szerző írta le 1993-ban. relációs modell adat. Jelenleg az OLAP-támogatás számos DBMS-ben és más eszközben van megvalósítva.

OLAP kockák

Mi az OLAP adat? A kérdés megválaszolásához fontolja meg legegyszerűbb példa. Tételezzük fel, hogy egy adott vállalkozás vállalati adatbázisában van egy táblakészlet, amely az áruk vagy szolgáltatások értékesítésével kapcsolatos információkat tartalmaz, és ezek alapján jött létre egy Számlák nézet Ország (ország), Város (város), Ügyfélnév mezőkkel. (az ügyfél cég neve), Salesperson (értékesítési menedzser), OrderDate (a rendelés leadásának dátuma), CategoryName (termékkategória), ProductName (terméknév), ShipperName (fuvarozó cég), ExtendedPrice (áru fizetése), míg a e mezők közül az utolsó az elemzés tárgya.

Az adatok kiválasztása egy ilyen nézetből a következő lekérdezéssel végezhető el:

SELECT Ország, Város, Ügyfélnév, Értékesítő,

Rendelés dátuma, Kategórianév, Terméknév, Szállítónév, ExtendedPrice

A számláktól

Tegyük fel, hogy a különböző országokból érkező ügyfelek által leadott megrendelések összértéke érdekel bennünket. Ahhoz, hogy választ kapjon erre a kérdésre, a következő kérést kell benyújtania:

SELECT Country, SUM (ExtendedPrice) FROM számlák

CSOPORTOK Országonként

A lekérdezés eredménye az összesített adatok egydimenziós halmaza lesz (in ebben az esetbenösszegek):

Ország	SZUM (kiterjesztett ár)
Argentína	7327.3
Ausztria	110788.4
Belgium	28491.65
Brazília	97407.74
Kanada	46190.1
Dánia	28392.32
Finnország	15296.35
Franciaország	69185.48
	209373.6
	...

Ha meg akarjuk tudni a különböző országokból érkező vásárlók által leadott és különböző szállítószolgálatok által kiszállított megrendelések összköltségét, akkor le kell futtatnunk egy lekérdezést, amely két paramétert tartalmaz a GROUP BY záradékban:

VÁLASSZA KI a számlák közül az országot, a szállító nevét, a SZÁMÁT (ExtendedPrice).

CSOPORT ORSZÁG SZERINT, Szállító neve

A lekérdezés eredménye alapján létrehozhat egy táblázatot, amely így néz ki:

Ezt az adathalmazt pivot táblának nevezzük.

Ország, Szállítónév, Értékesítő SUM (Kibővített Ár) KIVÁLASZTÁSA SZÁMLÁBÓL

CSOPORT ORSZÁG, Szállító neve, év SZERINT

A lekérdezés eredményei alapján háromdimenziós kocka szerkeszthető (1. ábra).

Hozzáadás további lehetőségek az elemzéshez elméletileg tetszőleges számú dimenziójú kockát készíthetünk, és az összegekkel együtt az OLAP-kocka cellái tartalmazhatják egyéb aggregált függvények számítási eredményeit (például átlag, maximum, minimális értékeket, az eredeti ábrázolás rekordjainak száma, megfelelő ezt a készletet paraméterek). Azokat a mezőket, amelyekből az eredményeket számítják, kocka mértékeknek nevezzük.

Hierarchiák a dimenziókban

Tegyük fel, hogy nem csak az ügyfelek által leadott megrendelések összértéke érdekel bennünket különböző országokban, hanem az ugyanazon ország különböző városaiban lévő ügyfelek által leadott megrendelések teljes költsége is. Ebben az esetben kihasználhatja azt a tényt, hogy a tengelyeken ábrázolt értékek különböző részletezésűek – ez a változtatások hierarchiájának fogalmán belül van leírva. Tegyük fel, hogy az országok a hierarchia első szintjén, a városok a másodikon helyezkednek el. Vegye figyelembe, hogy az SQL Server 2000-től kezdve az elemzési szolgáltatások támogatják az úgynevezett kiegyensúlyozatlan hierarchiákat, amelyek például olyan tagokat tartalmaznak, amelyek „gyermekei” nem találhatók a hierarchia szomszédos szintjein, vagy hiányoznak a változás egyes tagjainál. Egy ilyen hierarchia tipikus példája annak a ténynek a figyelembe vétele, hogy a különböző országokban lehetnek közigazgatási-területi egységek, például egy állam vagy régió, amelyek az országok és városok közötti földrajzi hierarchiában helyezkednek el (2. ábra).

Megjegyzendő, hogy az utóbbi időben elterjedt a tipikus hierarchiák megkülönböztetése, például a földrajzi vagy időbeli adatokat tartalmazó hierarchiák megkülönböztetése, valamint több hierarchia egy dimenzióban való meglétének támogatása (különösen a naptári és a pénzügyi év vonatkozásában).

OLAP-kockák létrehozása SQL Server 2005-ben

Az SQL Server 2005 kockák a következővel jönnek létre SQL használatával Szerver Business Intelligence Development Studio. Ez az eszköz a Visual Studio 2005 speciális verziója, amelyet a megoldásra terveztek ebből az osztályból feladatokat (és ha már telepített fejlesztői környezettel rendelkezik, akkor a projektsablonok listája olyan projektekkel bővül, amelyek célja az SQL Severen és annak elemző szolgáltatásain alapuló megoldások létrehozása). Az Analysis Services Project sablon különösen az elemzési szolgáltatásokon alapuló megoldások létrehozására szolgál (3. ábra).

Egy OLAP-kocka létrehozásához először el kell döntenie, hogy milyen adatokat kíván létrehozni. Az OLAP kockák leggyakrabban csillag- vagy hópehely sémákkal ellátott relációs adattárházak alapján épülnek fel (a cikk előző részében beszéltünk róluk). Az SQL csomag tartalmaz egy példát egy ilyen tárolóra: az AdventureWorksDW adatbázis, amelynek forrásként való használatához meg kell találnia a Data Sources mappát a Solution Explorerben, válassza a helyi menüÚj adatforrás, és következetesen válaszoljon a megfelelő varázsló kérdéseire (4. ábra).

Ezután ajánlatos létrehozni egy adatforrás-nézetet, amelyen a kocka létrejön. Ehhez ki kell választania a megfelelő helyi menüelemet az Adatforrás nézetek mappában, és következetesen meg kell válaszolnia a varázsló kérdéseire. Ezeknek a műveleteknek az eredménye egy adatséma lesz, melynek segítségével az adatforrások reprezentációja épül fel, és az így létrejövő sémában az eredetiek helyett „barátságos” táblaneveket adhatunk meg (5. ábra). .

Az így leírt kockát a projekt helyi menüjének Telepítés opciójának kiválasztásával és adatainak megtekintésével átvihetjük az analitikai szolgáltatások szerverére (7. ábra).

Jelenleg sok funkciót használnak a kockák létrehozásakor új verzió SQL Server, például az adatforrás nézet. A kocka felépítéséhez szükséges forrásadatok leírása, valamint a kocka szerkezetének leírása immár a sok fejlesztő által ismert Visual Studio eszközzel történik, ami jelentős előnye ennek a terméknek az új verziójának - a Ebben az esetben minimálisra csökkentik az új eszközök tanulmányozását az analitikai megoldások fejlesztői által.

Vegye figyelembe, hogy a létrehozott kockában módosíthatja a mértékek összetételét, törölheti és hozzáadhatja a dimenzióattribútumokat, valamint hozzáadhatja a dimenziótagok számított attribútumait a meglévő attribútumok alapján (8. ábra).

Rizs. 8. Adjon hozzá egy számított attribútumot

Ezenkívül az SQL Server 2005 kockákban is végrehajthat automatikus csoportosítás vagy a dimenziótagok rendezése attribútumértékek szerint, az attribútumok közötti kapcsolatok meghatározása, a sok-sok kapcsolatok megvalósítása, a kulcsfontosságú üzleti mutatók meghatározása és sok más feladat (lásd az SQL Server Analysis című részt az összes ilyen művelet elvégzésének részleteiért: Services Tutorial súgórendszer ennek a terméknek).

A kiadvány további részeiben folytatjuk az SQL Server 2005 elemző szolgáltatásainak felfedezését, és megtudjuk, milyen újdonságok vannak az adatbányászati támogatás területén.

OLAP (On-Line Analytical Processing) Az elektronikus analitikai adatfeldolgozás olyan módszere, amely az adatok hierarchikus kategóriákba rendezését mutatja be előre kiszámított összegek felhasználásával. Az OLAP adatok hierarchikusan vannak rendezve, és kockákban, nem pedig táblázatokban tárolódnak. Az OLAP-kockák egy többdimenziós adatkészlet, amelynek tengelyei paramétereket és cellákat tartalmaznak, amelyek paraméterfüggő összesített adatokat tartalmaznak. A kockákat összetett többdimenziós elemzésre tervezték nagy kötetek adatok, mert csak összefoglaló eredményeket adnak a jelentésekhez, a nagyszámú egyedi rekord helyett.

Az OLAP fogalmát a híres adatbázis-kutató és a relációs adatmodell szerzője, E. F. Codd írta le 1993-ban. Jelenleg az OLAP támogatás számos DBMS-ben és más eszközben van megvalósítva.

Az OLAP-kocka kétféle adatot tartalmaz:

· összértékek, értékek, amelyekre összesíteni kívánja, reprezentálja számított adatmezők;

· leíró információkat reprezentáló mérések vagy méretek. A leíró információk jellemzően részletezettségi szintekre vannak rendezve. Például: „Év”, „Negyed”, „Hónap” és „Nap” az „Idő” dimenzióban. A mezők részletezettségi szintjei szerinti rendszerezése lehetővé teszi a jelentéskészítő felhasználók számára, hogy megválasszák a megtekinteni kívánt részletességi szintet, kezdve a magas szintű összefoglaló adatokkal, majd a részletesebb nézetig, és fordítva.

A Microsoft Query eszközök lehetővé teszik OLAP-kockák létrehozását is olyan lekérdezésekből, amelyek relációs adatbázis-adatokat töltenek be, mint pl. Microsoft Access, ebben az esetben a lineáris tábla strukturális hierarchiává (kockává) alakul.

Az OLAP kocka létrehozása varázsló egy beépített Microsoft Query eszköz. Relációs adatbázison alapuló OLAP-kocka létrehozásához a varázsló futtatása előtt végre kell hajtania a következő lépéseket.

1. Határozza meg az adatforrást (lásd: 6.1. ábra).

2. C Microsoft segítségével Lekérdezés lekérdezés létrehozásához, amely csak azokat a mezőket tartalmazza, amelyek egy OLAP-kocka adatmezői vagy dimenziómezői lesznek, ha egy kockában egy mezőt többször használnak, akkor azt a szükséges számú alkalommal szerepeltetni kell a lekérdezésben.

3. A lekérdezés-létrehozó varázsló utolsó lépésében állítsa a kapcsolót az elemre OLAP-kocka létrehozása innen ennek a kérésnek (lásd 6.2. ábra), vagy a kérés közvetlenül a Lekérdezés menü segítségével történő létrehozása után Fájl válassz egy csapatot Hozzon létre OLAP-kockát, amely után elindul az OLAP kocka létrehozása varázsló.

Az OLAP-kocka létrehozása varázsló három lépésből áll.

A varázsló első lépésénél (lásd 6.6. ábra) a adatmezők– számított mezők, amelyekhez összértéket kell meghatározni.

Rizs. 6.6. Adatmezők meghatározása

A varázsló a várt számított mezőket (általában numerikus mezőket) a lista elejére helyezi, ellenőrzi, és meghatározza ezeknek a mezőknek az eredményül kapott függvényét, általában - Összeg. Az adatmezők kiválasztásakor legalább egy mezőt ki kell választani számított mezőként, és legalább egy mezőt ki kell hagyni a méret meghatározásához.

at OLAP létrehozása kocka, négy összefoglaló függvényt használhat - Összeg, Szám(értékek száma), Minimális, Maximális numerikus mezőkhöz és egy függvényhez Szám minden más területen. Ha ugyanabban a mezőben több különböző összegző függvényt szeretne használni, akkor azt a mezőt a szükséges számú alkalommal szerepeltetni kell a lekérdezésben.

A számított mező neve egy oszlopban megváltoztatható Adatmező neve.

A varázsló második lépésében meghatározzák a leíró adatokat és azok méreteit (lásd 6.7. ábra). Mérési mező kiválasztásához a listából kell kiválasztania Forrás mezők húzza a kívánt méretmezőt legfelső szint a listára Mérések jelű területre Húzza ide a mezőket a méretek létrehozásához. OLAP-kocka létrehozásához meg kell határoznia legalább egy dimenziót. A varázsló ugyanabban a lépésében a helyi menü segítségével módosíthatja a dimenzió vagy a szintmező nevét.

Rizs. 6.7. Dimenziómezők meghatározása

Az elszigetelt vagy különálló adatokat tartalmazó, hierarchiába nem tartozó mezők egyszintű dimenzióként definiálhatók. A kocka azonban hatékonyabb lesz, ha néhány mezőt szintekbe rendeznek. Ha egy dimenzió részeként szeretne szintet létrehozni, húzzon egy mezőt a listából Forrás mezők olyan mezőn, amely dimenzió vagy szint. A részletesebb információkat tartalmazó mezőket tovább kell helyezni alacsony szintek. Például a 6.7. ábrán a mező Munkakör a mező szintje Osztály neve.

Ha egy mezőt alacsonyabb vagy magasabb szintre szeretne mozgatni, át kell húznia egy alacsonyabb vagy magasabb mezőbe a dimenzión belül. A szintek megjelenítéséhez vagy elrejtéséhez használja a vagy a gombokat.

Ha dátum- vagy időmezőket használ legfelső szintű dimenzióként, az OLAP kocka varázsló automatikusan létrehozza a szinteket ezekhez a dimenziókhoz. A felhasználó ezután kiválaszthatja, hogy mely szintek jelenjenek meg a jelentésekben. Kiválaszthat például heteket, negyedéveket és éveket vagy hónapokat (lásd: 6.7. ábra).

Ne feledje, hogy a varázsló csak akkor hoz létre automatikusan szinteket a dátum- és időmezőkhöz, ha létrehoz egy legfelső szintű dimenziót; Ha ezeket a mezőket egy dimenzió alszintjeként adja hozzá, az automatikus szintek nem jönnek létre.

A varázsló harmadik lépésében meghatározásra kerül a varázsló által létrehozott kocka típusa, három lehetőség közül választhat (lásd 6.8. ábra).

Rizs. 6.8. A létrehozandó kocka típusának kiválasztása a varázsló harmadik lépésében

· Az első két lehetőség egy kocka létrehozását jelenti minden egyes jelentés megnyitásakor (ha a kockát Excelből nézzük, akkor pivot tábláról beszélünk). Ebben az esetben a kérelemfájl és a fájl kocka definíciók *.oqy, amely a kocka létrehozására vonatkozó utasításokat tartalmazza. Az *.oqy fájl megnyitható Excel program jelentéseket készíthet a kocka alapján, és ha módosítania kell a kockán, a Lekérdezés megnyitásával újra futtassa a Kocka létrehozása varázslót.

Alapértelmezés szerint a kockadefiníciós fájlok, mint a lekérdezési fájlok, az Application Data\Microsoft\Que-ries felhasználói profilmappájában tárolódnak. *.oqy fájl mentésekor szabványos mappa, a kockadefiníciós fájl neve megjelenik a lapon OLAP kockákúj lekérdezés megnyitásakor a Microsoft Queryben vagy parancs kiválasztásakor Hozzon létre egy kérést(menü Adat, almenü Külső adatok importálása) Microsoft Excelben.

· A kockatípus harmadik opciójának kiválasztása esetén A kocka összes adatát tartalmazó kockafájl mentése, a rendszer lekéri a kocka összes adatát, és létrejön egy * kiterjesztésű kockafájl a felhasználó által megadott helyen .kölyök, amelyben ezeket az adatokat tárolják. Teremtés ezt a fájlt nem történik meg azonnal a gomb megnyomásakor Kész; a fájl akkor jön létre, amikor a kockadefiníciót fájlba menti, vagy amikor jelentést hoz létre a kocka alapján.

A kocka típusának megválasztását több tényező határozza meg: a kocka által tartalmazott adatok mennyisége; a kocka alapján létrehozandó jelentések típusa és összetettsége; rendszererőforrások (memória és lemezterület) stb.

Külön fájl A kocka *.cub-ot a következő esetekben kell létrehozni:

1) gyakran változó interaktív jelentések esetén, feltéve, hogy elegendő lemezterület;

2) amikor el kell mentenie a kockát hálózati szerver hogy hozzáférést biztosítson a többi felhasználó számára a jelentések készítésekor. A kockafájl adott adatokat szolgáltathat a forrásadatbázisból, miközben kihagyja azokat az érzékeny vagy érzékeny adatokat, amelyekhez meg akarja akadályozni, hogy más felhasználók hozzáférjenek.

Talán egyesek számára kissé egzotikusnak tűnik az OLAP technológia (On-line Analytic Processing) használata riportok készítésekor, így számukra az OLAP-CUBE használata egyáltalán nem tartozik a legfontosabb követelmények közé a költségvetés és a vezetői számvitel automatizálása során.

Valójában nagyon kényelmes többdimenziós CUBE használata a vezetői jelentéskészítés során. A költségvetési formátumok fejlesztése során találkozhat a többváltozós űrlapok problémájával (erről bővebben a 8. „Költségvetés beállításának technológiája egy vállalatnál” című könyvben, valamint a „Vállalati könyvelés beállítása és automatizálása” című könyvben olvashat.

Ez annak köszönhető, hogy a hatékony irányítás a vállalatok egyre részletesebb vezetői beszámolót igényelnek. Vagyis a rendszer egyre több különböző analitikai szakaszt használ (in információs rendszerek az analitikát referenciakönyvek határozzák meg).

Ez természetesen oda vezet, hogy a vezetők minden őket érdeklő analitikai szekcióban jelentést szeretnének kapni. Ez azt jelenti, hogy a jelentéseket valahogy „lélegezni” kell. Más szóval azt mondhatjuk, hogy ebben az esetben arról beszélünk, hogy ugyanaz a jelentés különböző elemzési szempontokból adjon információt. Ezért a statikus jelentések sok modern vezetőnek már nem felelnek meg. Szükségük van arra a dinamikára, amelyet egy többdimenziós CUBE tud nyújtani.

Így az OLAP technológia már a modern és jövőbeli információs rendszerek kötelező elemévé vált. Ezért a szoftvertermék kiválasztásakor figyelni kell arra, hogy az OLAP technológiát használ-e.

Sőt, meg kell tudni különböztetni a valódi KOCKÁKAT az utánzatoktól. Az egyik ilyen szimuláció a pivot táblák az MS Excelben. Igen, ez az eszköz úgy néz ki, mint egy CUBE, de valójában nem az, mivel ezek statikus, nem dinamikus táblázatok. Ezen túlmenően, sokkal rosszabb a lehetőségük arra, hogy hierarchikus könyvtárak elemeiből készítsenek jelentéseket.

A CUBE használatának relevanciájának megerősítésére a vezetői jelentéskészítés során egy egyszerű példát hozhatunk az értékesítési költségvetésre. A vizsgált példában a következő elemzési részek relevánsak a vállalat számára: termékek, fióktelepek és értékesítési csatornák. Ha ez a három elemzés fontos a vállalat számára, akkor az értékesítési költségvetés (vagy jelentés) több változatban is megjeleníthető.

Megjegyzendő, hogy ha három elemző szakasz alapján hoz létre költségvetési sorokat (mint a vizsgált példában), akkor ez meglehetősen összetett létrehozást tesz lehetővé. költségvetési modellekés készítsen részletes jelentéseket a CUBE segítségével.

Például egy értékesítési költségvetés összeállítható egyetlen elemzés (könyvtár) használatával. A „Termékek” elemzése alapján felépített értékesítési költségvetés példája itt található 1. ábra.

Rizs. 1. Példa egy értékesítési költségvetésre, amely az OLAP-CUBE „Termékek” elemzése alapján készült

Ugyanaz az értékesítési költségvetés két elemzés (könyvtár) segítségével összeállítható. A két „Termékek” és „Ágazatok” elemzése alapján felépített értékesítési költségvetés példája itt található. 2. ábra.

Rizs. 2. Példa egy értékesítési költségvetésre, amely az INTEGRAL szoftvercsomag OLAP-CUBE-jában található két „Termékek” és „Ágazatok” elemzése alapján készült

Ha részletesebb riportok készítésére van szükség, akkor ugyanaz az értékesítési költségvetés három elemzéssel (könyvtárral) összeállítható. Példa egy értékesítési költségvetésre, amely három elemzés alapján: „Termékek”, „Ágazatok” és „Értékesítési csatornák” található 3. ábra.

Rizs. 3. Példa egy értékesítési költségvetésre, amely az INTEGRAL szoftvercsomag OLAP-CUBE-jában található három elemzés „Termékek”, „Ágazatok” és „Értékesítési csatornák” alapján készült

Emlékeztetni kell arra, hogy a jelentések generálására használt CUBE lehetővé teszi az adatok különböző sorrendben történő megjelenítését. On 3. ábra Az értékesítési költségvetés először termékenként, majd ágazatonként, majd értékesítési csatornánként „bővül”.

Ugyanazok az adatok eltérő sorrendben is bemutathatók. On 4. ábra ugyanaz az értékesítési költségvetés „bővül” először termékenként, majd értékesítési csatornánként, majd ágazatonként.

Rizs. 4. Példa egy értékesítési költségvetésre, amely az INTEGRAL szoftvercsomag OLAP-CUBE-jában található három elemzési elem „Termékek”, „Elosztási csatornák” és „Árak” alapján épül fel.

On 5. ábra ugyanazt az értékesítési költségvetést először fiókok, majd termékek, majd értékesítési csatornák „bontják ki”.

Rizs. 5. Példa egy értékesítési költségvetésre, amely az „INTEGRAL” OLAP-CUBE szoftvercsomagban található három elemzési elem „ágak”, „termékek” és „értékesítési csatornák” alapján készült.

Valójában ez még nem minden lehetséges opciók az értékesítési költségvetés visszavonása.

Ezenkívül figyelni kell arra a tényre, hogy a KUB lehetővé teszi a könyvtárak hierarchikus felépítésével való munkát. A bemutatott példákban a hierarchikus címtárak a „Termékek” és a „Terjesztési csatornák”.

A felhasználó szemszögéből ő az ebben a példában több vezetői jelentést kap (lásd Rizs. 1-5), és a beállítások szempontjából szoftver termék- ez egy jelentés. Egyszerűen a CUBE használatával többféleképpen is megtekintheti.

Természetesen a gyakorlatban nagyon sok lehetőség van a különböző vezetői jelentések kiadására, ha cikkük egy vagy több elemzőn alapul. Maga az elemzési készlet pedig a felhasználók részletszükségleteitől függ. Igaz, nem szabad elfelejteni, hogy egyrészt minél nagyobb az elemző, annál részletesebb jelentéseket lehet készíteni. Másrészt ez azt jelenti, hogy a pénzügyi költségvetés-tervezési modell összetettebb lesz. Mindenesetre, ha van KUB, a cégnek lehetősége lesz belenézni a szükséges riportokba különféle lehetőségeket, az érdeklődésre számot tartó elemző szakaszoknak megfelelően.

Szükséges megemlíteni az OLAP-CUBE néhány további funkcióját.

Egy többdimenziós hierarchikus OLAP-CUBE-ban több dimenzió van: sortípus, dátum, sorok, 1. könyvtár, 2. könyvtár és 3. könyvtár (lásd. Rizs. 6). Természetesen a jelentés annyi gombot jelenít meg referenciakönyvekkel, amennyi a költségvetési sorban található maximális mennyiség segédkönyvek. Ha egyetlen költségvetési soron sincs egyetlen referenciakönyv sem, akkor a jelentésben nem lesz egyetlen hivatkozási könyv gomb sem.

Kezdetben az OLAP-CUBE minden dimenzió mentén épül fel. Alapértelmezés szerint a jelentés elkészítésekor a méretek pontosan azokon a területeken helyezkednek el, amelyeken látható 6. ábra. Vagyis egy dimenzió, például a „Dátum” a függőleges méretek területén található (méretek az oszlop területén), a „Sorok”, „1. könyvtár”, „2. könyvtár” és „3. könyvtár” méretek a vízszintes méretek területe (méretek a területsorokban), a „Sor típusa” dimenzió pedig a „ki nem bontott” méretek területén (méretek az oldal területén). Ha egy dimenzió az utolsó területen található, akkor a jelentésben szereplő adatok nem „bővülnek” az adott dimenzióban.

Ezen méretek mindegyike elhelyezhető a három terület bármelyikében. A mérések átvitele után a jelentés azonnal átépül, hogy megfeleljen az új mérési konfigurációnak. Például felcserélheti a dátumot és a sorokat referenciakönyvekkel. Vagy áthelyezheti az egyik referenciakönyvet a függőleges mérési területre (lásd. Rizs. 7). Más szóval, „csavarhatja” a jelentést az OLAP-CUBE-ban, és kiválaszthatja a felhasználó számára legkényelmesebb jelentéskimeneti opciót.

Rizs. 7. Példa egy jelentés újraépítésére az INTEGRAL szoftvercsomag mérési konfigurációjának megváltoztatása után

A mérési konfiguráció megváltoztatható a fő CUBE űrlapon vagy a változástérkép-szerkesztőben (lásd. Rizs. 8). Ebben a szerkesztőben az egérrel is áthúzhatja a méréseket egyik területről a másikra. Ezenkívül egy területen a méréseket felcserélheti.

Ezenkívül ugyanabban a formában beállíthat néhány mérési paramétert. Minden dimenziónál testreszabhatja az összegek helyét, az elemek rendezési sorrendjét és az elemek nevét (lásd. Rizs. 8). Azt is megadhatja, hogy melyik elem neve jelenjen meg a jelentésben: rövidített (Name) vagy teljes (FullName).

Rizs. 8. Az INTEGRAL szoftvercsomag mérési térképszerkesztője

A mérési paramétereket közvetlenül mindegyikben szerkesztheti (lásd. Rizs. 9). Ehhez kattintson a mérés neve melletti gombon található ikonra.

Rizs. 9. Példa az 1. címtár szerkesztésére Termékek és szolgáltatások itt

Ezzel a szerkesztővel kiválaszthatja a jelentésben megjeleníteni kívánt elemeket. Alapértelmezés szerint minden elem megjelenik a jelentésben, de szükség esetén egyes elemek vagy mappák elhagyhatók. Ha például csak egy termékcsoportot kell megjelenítenie a jelentésben, akkor a mérésszerkesztőben törölnie kell az összes többi jelölését. Ezt követően a jelentés csak egy termékcsoportot fog tartalmazni (lásd. Rizs. 10).

Ebben a szerkesztőben az elemeket is rendezheti. Ezenkívül az elemek átrendezhetők különféle módokon. Egy ilyen átcsoportosítás után a jelentés azonnal újjáépül.

Rizs. 10. Példa a kimenetre az INTEGRAL szoftvercsomagban csak egy termékcsoport (mappa) jelentésében

A dimenziószerkesztőben gyorsan létrehozhat saját csoportokat, az ott található könyvtárakból elemeket húzhat át stb. Alapértelmezés szerint csak az Egyéb csoport jön létre automatikusan, de más csoportok is létrehozhatók. Így a dimenziószerkesztő segítségével beállíthatja, hogy a referenciakönyvek mely elemei és milyen sorrendben jelenjenek meg a jelentésben.

Meg kell jegyezni, hogy az összes ilyen átrendezést nem rögzítik. Vagyis a jelentés bezárása vagy újraszámítása után minden könyvtár megjelenik a jelentésben a beállított módszertannak megfelelően.

Valójában az összes ilyen változtatást kezdetben a vonalak felállításakor meg lehetett volna tenni.

A korlátozások segítségével például azt is megadhatja, hogy mely elemek vagy könyvtárcsoportok jelenjenek meg a jelentésben, és melyek ne.

Jegyzet: ennek a cikknek a témáját részletesebben tárgyaljuk a workshopokon "Vállalkozás költségvetésének kezelése"És "A vezetői számvitel szervezése és automatizálása" a cikk szerzője, Alexander Karpov vezette.

Ha a felhasználónak szinte rendszeresen csak bizonyos elemeket vagy könyvtármappákat kell megjelenítenie a jelentésben, akkor érdemes ezeket a beállításokat előre elvégezni a jelentéssorok létrehozásakor. Ha a felhasználó számára fontosak a jelentésekben a címtárelemek különféle kombinációi, akkor a módszertan beállításakor nem kell semmilyen korlátozást beállítani. Az összes ilyen korlátozás gyorsan konfigurálható a mérésszerkesztővel.