Számított táblázatok esetei és használati esetek
Az adatfolyamokban
Mi az a számított tábla?
A tábla egy adatfolyamban létrehozott lekérdezés adatkimenetét jelöli az adatfolyam frissítése után. A forrásból származó adatokat, és opcionálisan a rá alkalmazott átalakításokat jelöli. Előfordulhat, hogy olyan új táblákat szeretne létrehozni, amelyek egy korábban beolvasott tábla függvényei.
Bár meg lehet ismételni a táblát létrehozó lekérdezéseket, és új átalakításokat alkalmazni rájuk, ennek a megközelítésnek hátrányai vannak: az adatok kétszer töltődnek be, és az adatforrás terhelése megkétszereződik.
A számított táblák mindkét problémát megoldják. A számított táblák hasonlóak a többi táblához, mivel adatokat kapnak egy forrásból, és további átalakításokat alkalmazhat a létrehozásukhoz. Az adatok azonban a használt tárolási adatfolyamból származnak, nem pedig az eredeti adatforrásból. Vagyis korábban egy adatfolyam hozta létre őket, majd újra felhasználták őket.
A számított táblák úgy hozhatók létre, hogy ugyanabban az adatfolyamban hivatkoznak egy táblára, vagy egy másik adatfolyamban létrehozott táblára hivatkoznak.
Miért érdemes számított táblát használni?
Az összes átalakítási lépés végrehajtása egy táblában lassú lehet. Ennek a lassulásnak számos oka lehet – előfordulhat, hogy az adatforrás lassú, vagy az éppen végzett átalakításokat két vagy több lekérdezésben kell replikálni. Előnyös lehet, ha először betölti az adatokat a forrásból, majd újra felhasználja egy vagy több táblában. Ilyen esetekben két táblát hozhat létre: az egyiket az adatforrásból, a másikat pedig egy számított táblát, amely több átalakítást alkalmaz az adatfolyam által használt data lake-be írt adatokra. Ez a változás növelheti az adatok teljesítményét és újrafelhasználhatóságát, így időt és erőforrásokat takaríthat meg.
Ha például két tábla átalakítási logikájának egy részét is megosztja, számított tábla nélkül, az átalakítást kétszer kell elvégezni.
Ha azonban számítási táblát használ, akkor az átalakítás közös (megosztott) része egyszer lesz feldolgozva, és az Azure Data Lake Storage-ban lesz tárolva. A fennmaradó átalakítások ezután a közös átalakítás kimenetéből lesznek feldolgozva. Összességében ez a feldolgozás sokkal gyorsabb.
A számított táblák egy helyet biztosítanak az átalakítás forráskódjaként, és felgyorsítják az átalakítást, mert csak egyszer kell elvégezni, nem pedig többször. Az adatforrás terhelése is csökken.
Példaforgatókönyv számított tábla használatára
Ha összesített táblát készít a Power BI-ban az adatmodell felgyorsításához, létrehozhatja az összesített táblát úgy, hogy az eredeti táblára hivatkozik, és további átalakításokat alkalmaz rá. Ezzel a módszerrel nem kell replikálnia az átalakítást a forrásból (az eredeti táblából származó részből).
Az alábbi ábrán például egy Rendelések tábla látható.
Ebből a táblából származó hivatkozással számítási táblát hozhat létre.
Képernyőkép arról, hogyan hozhat létre számított táblát az Orders táblából. Először kattintson a jobb gombbal az Orders (Rendelések) táblára a Lekérdezések panelen, majd válassza a Hivatkozás lehetőséget a legördülő menüből. Ez a művelet létrehozza a számított táblát, amelyet itt "Rendelések összesítve"-re neveznek át.
A számított tábla további átalakításokkal is rendelkezhet. A Group By használatával például összesítheti az adatokat az ügyfél szintjén.
Ez azt jelenti, hogy a Rendelések összesített tábla adatokat kap a Rendelések táblából, és nem az adatforrásból. Mivel a szükséges átalakítások némelyike már megtörtént a Rendelések táblában, a teljesítmény jobb, az adatátalakítás pedig gyorsabb.
Számított tábla más adatfolyamokban
Számítási táblát más adatfolyamokban is létrehozhat. Létrehozható úgy, hogy adatokat kap egy adatfolyamból a Microsoft Power Platform adatfolyam-összekötőjével.
A kép kiemeli a Power Platform adatfolyam-összekötőt a Power Query adatforrás-kiválasztása ablakában. Tartalmaz egy leírást is, amely azt állítja, hogy egy adatfolyamtábla egy másik adatfolyamtáblából származó adatokra építhető, amely már megőrződött a tárolóban.
A számított tábla fogalma az, hogy egy tábla megmaradjon a tárolóban, és más táblák is származzanak belőle, így csökkentheti az adatforrás olvasási idejét, és megoszthatja a gyakori átalakításokat. Ez a csökkentés úgy érhető el, hogy adatokat kap más adatfolyamokból az adatfolyam-összekötőn keresztül, vagy egy másik lekérdezésre hivatkozik ugyanabban az adatfolyamban.
Számított tábla: Átalakításokkal vagy anélkül?
Most, hogy már tudja, hogy a számított táblák kiválóan alkalmasak az adatátalakítás teljesítményének javítására, érdemes feltenni a kérdést, hogy az átalakításokat mindig a számított táblára kell-e halasztani, vagy a forrástáblára kell-e alkalmazni őket. Vagyis az adatokat mindig egy táblába kell beemésztni, majd egy számított táblában átalakítani? Mik az előnyei és hátrányai?
Adatok betöltése átalakítás nélkül szöveg-/CSV-fájlok esetén
Ha egy adatforrás nem támogatja a lekérdezések összecsukását (például Text/CSV-fájlokat), az átalakítások alkalmazása kevés előnyt jelent a forrásból származó adatok lekérésekor, különösen akkor, ha az adatmennyiségek nagyok. A forrástáblának egyszerűen be kell töltenie az adatokat a Text/CSV fájlból átalakítások alkalmazása nélkül. Ezután a számított táblák adatokat kérhetnek le a forrástáblából, és végrehajthatják az átalakítást a betöltött adatok tetején.
Felmerülhet a kérdés, hogy mi az az érték, ha olyan forrástáblát hoz létre, amely csak adatokat használ fel? Az ilyen táblák továbbra is hasznosak lehetnek, mert ha a forrásból származó adatokat több táblában is használják, az csökkenti az adatforrás terhelését. Emellett az adatokat mostantól más személyek és adatfolyamok is újra felhasználhatják. A számított táblák különösen hasznosak olyan esetekben, amikor az adatmennyiség nagy, vagy amikor egy adatforráshoz helyszíni adatátjárón keresztül férnek hozzá, mivel csökkentik az átjáróból érkező forgalmat és a mögöttes adatforrások terhelését.
SQL-tábla néhány gyakori átalakításának elvégzése
Ha az adatforrás támogatja a lekérdezések összecsukását, érdemes elvégezni a forrástáblában lévő átalakítások egy részét, mert a lekérdezés az adatforráshoz van hajtva, és csak az átalakított adatok lesznek lekérve. Ezek a módosítások javítják az általános teljesítményt. A levezetett számított táblákban gyakori átalakításokat a forrástáblában kell alkalmazni, hogy azok összevonhatók legyenek a forrással. A csak az alsóbb rétegbeli táblákra vonatkozó egyéb átalakításokat számítási táblákban kell elvégezni.