Kurz: Extrahovanie a výpočet mierok v službe Power BI z notebooku Jupyter
Tento kurz ukazuje, ako používať SemPy (Preview) na výpočet mierok v sémantických modeloch (množiny údajov služby Power BI).
V tomto kurze sa naučíte:
- Vyhodnotenie mierok služby Power BI pomocou rozhrania jazyka Python v knižnici Python sémantických prepojení (SemPy).
- Oboznámte sa so súčasťami semPy, ktoré pomáhajú preklenúť priepasť medzi umelou inteligenciou a BI. Medzi tieto súčasti patria:
- FabricDataFrame – štruktúra pripomínaná pandas, vylepšená ďalšími sémantickými informáciami.
- Užitočné funkcie, ktoré umožňujú načítanie sémantických modelov vrátane nespracovaných údajov, konfigurácií a mierok.
Požiadavky
Získajte predplatné na Microsoft Fabric. Alebo si zaregistrujte bezplatnú skúšobnú verziu služby Microsoft Fabric.
Prihláste sa do služby Microsoft Fabric.
Pomocou prepínača skúseností v ľavej dolnej časti domovskej stránky sa prepnete na službu Fabric.
Na ľavej navigačnej table vyberte položku Pracovné priestory , kde môžete vyhľadať a vybrať pracovný priestor. Tento pracovný priestor sa stane vaším aktuálnym pracovným priestorom.
Stiahnite si sémantický model ukážky analýzy maloobchodu PBIX.pbix a nahrajte ho do svojho pracovného priestoru.
Sledovanie v notebooku
Tento kurz sprevádza poznámkový blok powerbi_measures_tutorial.ipynb .
Ak chcete otvoriť sprievodný poznámkový blok pre tento kurz, postupujte podľa pokynov v téme Príprava systému na kurzy dátových vied na import notebooku do pracovného priestoru.
Ak by ste radšej skopírovali a prilepili kód z tejto stránky, môžete vytvoriť nový poznámkový blok.
Uistite sa, že pripojiť lakehouse na notebook , ako začnete spustiť kód.
Nastavenie poznámkového bloku
V tejto časti nastavíte poznámkové prostredie s potrebnými modulmi a údajmi.
Inštalácia
SemPy
z rozhrania PyPI pomocou možnosti vnorenej%pip
inštalácie v rámci poznámkového bloku:%pip install semantic-link
Vykonajte potrebné importy modulov, ktoré budete potrebovať neskôr:
import sempy.fabric as fabric
Môžete sa pripojiť k pracovnému priestoru služby Power BI. List the sémantické modely v pracovnom priestore:
fabric.list_datasets()
Načítanie sémantického modelu. V tomto kurze použijete Sémantický model ukážky analýzy maloobchodu PBIX :
dataset = "Retail Analysis Sample PBIX"
Zobrazenie zoznamu mierok pracovného priestoru
Pomocou funkcie SemPy list_measures
zadajte nasledujúci zoznam mierok v sémantickom modeli:
fabric.list_measures(dataset)
Vyhodnotenie mierok
V tejto časti môžete vyhodnotiť mierky rôznymi spôsobmi pomocou funkcie SemPy evaluate_measure
.
Vyhodnotenie nespracovej mierky
V nasledujúcom kóde použite funkciu SemPy evaluate_measure
na výpočet vopred nakonfigurovanej mierky s názvom "Priemerná veľkosť predajného priestoru". Základný vzorec pre túto mierku môžete vidieť vo výstupe predchádzajúcej bunky.
fabric.evaluate_measure(dataset, measure="Average Selling Area Size")
Vyhodnotenie mierky pomocou groupby_columns
Výstup mierky môžete zoskupiť podľa určitých stĺpcov tak, že zadáte ďalší parameter groupby_columns
:
fabric.evaluate_measure(dataset, measure="Average Selling Area Size", groupby_columns=["Store[Chain]", "Store[DistrictName]"])
V predchádzajúcom kóde ste zoskupili podľa stĺpcov Chain
a DistrictName
Store
tabuľky v sémantickom modeli.
Vyhodnotenie mierky pomocou filtrov
Parameter môžete použiť filters
aj na určenie konkrétnych hodnôt, ktoré môže výsledok obsahovať pre konkrétne stĺpce:
fabric.evaluate_measure(dataset, \
measure="Total Units Last Year", \
groupby_columns=["Store[Territory]"], \
filters={"Store[Territory]": ["PA", "TN", "VA"], "Store[Chain]": ["Lindseys"]})
V predchádzajúcom kóde Store
je názov tabuľky, Territory
je názov stĺpca a PA
je jednou z hodnôt, ktoré filter povoľuje.
Vyhodnotenie mierky v rámci viacerých tabuliek
Mierku môžete zoskupiť podľa stĺpcov, ktoré zahŕňajú viacero tabuliek v sémantickom modeli.
fabric.evaluate_measure(dataset, measure="Total Units Last Year", groupby_columns=["Store[Territory]", "Sales[ItemID]"])
Vyhodnotenie viacerých mierok
evaluate_measure
Funkcia vám umožňuje zadať identifikátory viacerých mierok a výstup vypočítaných hodnôt v tom istom prvku DataFrame:
fabric.evaluate_measure(dataset, measure=["Average Selling Area Size", "Total Stores"], groupby_columns=["Store[Chain]", "Store[DistrictName]"])
Použitie konektora XMLA služby Power BI
Predvolený klient sémantických modelov je podporovaný rozhraniami REST API služby Power BI. V prípade akýchkoľvek problémov s spustením dotazov s týmto klientom je možné prepnúť koncový server do rozhrania XMLA služby Power BI pomocou funkcie use_xmla=True
. Parametre SemPy zostávajú pri výpočte mierky s XMLA rovnaké.
fabric.evaluate_measure(dataset, \
measure=["Average Selling Area Size", "Total Stores"], \
groupby_columns=["Store[Chain]", "Store[DistrictName]"], \
filters={"Store[Territory]": ["PA", "TN", "VA"], "Store[Chain]": ["Lindseys"]}, \
use_xmla=True)
Súvisiaci obsah
Pozrite si ďalšie kurzy o sémantických prepojeniach/SemPy:
- Kurz: Vyčistenie údajov pomocou funkčných závislostí
- Kurz: Analýza funkčných závislostí v ukážkovom sémantickom modeli
- Kurz: Zisťovanie vzťahov v sémantickom modeli pomocou sémantického prepojenia
- Kurz: Zisťovanie vzťahov v množine údajov Synthea pomocou sémantického prepojenia
- kurz : Overenie údajov pomocou semPy a veľkých očakávaní (GX)