Zdieľať cez


Kurz: Extrahovanie a výpočet mierok v službe Power BI z notebooku Jupyter

Tento kurz ukazuje, ako používať SemPy (Preview) na výpočet mierok v sémantických modeloch (množiny údajov služby Power BI).

V tomto kurze sa naučíte:

  • Vyhodnotenie mierok služby Power BI pomocou rozhrania jazyka Python v knižnici Python sémantických prepojení (SemPy).
  • Oboznámte sa so súčasťami semPy, ktoré pomáhajú preklenúť priepasť medzi umelou inteligenciou a BI. Medzi tieto súčasti patria:
    • FabricDataFrame – štruktúra pripomínaná pandas, vylepšená ďalšími sémantickými informáciami.
    • Užitočné funkcie, ktoré umožňujú načítanie sémantických modelov vrátane nespracovaných údajov, konfigurácií a mierok.

Požiadavky

  • Získajte predplatné na Microsoft Fabric. Alebo si zaregistrujte bezplatnú skúšobnú verziu služby Microsoft Fabric.

  • Prihláste sa do služby Microsoft Fabric.

  • Pomocou prepínača skúseností v ľavej dolnej časti domovskej stránky sa prepnete na službu Fabric.

    Snímka obrazovky ponuky prepínača prostredí zobrazujúca, kde vybrať možnosť Dátová veda.

Sledovanie v notebooku

Tento kurz sprevádza poznámkový blok powerbi_measures_tutorial.ipynb .

Nastavenie poznámkového bloku

V tejto časti nastavíte poznámkové prostredie s potrebnými modulmi a údajmi.

  1. Inštalácia SemPy z rozhrania PyPI pomocou možnosti vnorenej %pip inštalácie v rámci poznámkového bloku:

    %pip install semantic-link
    
  2. Vykonajte potrebné importy modulov, ktoré budete potrebovať neskôr:

    import sempy.fabric as fabric
    
  3. Môžete sa pripojiť k pracovnému priestoru služby Power BI. List the sémantické modely v pracovnom priestore:

    fabric.list_datasets()
    
  4. Načítanie sémantického modelu. V tomto kurze použijete Sémantický model ukážky analýzy maloobchodu PBIX :

    dataset = "Retail Analysis Sample PBIX"
    

Zobrazenie zoznamu mierok pracovného priestoru

Pomocou funkcie SemPy list_measures zadajte nasledujúci zoznam mierok v sémantickom modeli:

fabric.list_measures(dataset)

Vyhodnotenie mierok

V tejto časti môžete vyhodnotiť mierky rôznymi spôsobmi pomocou funkcie SemPy evaluate_measure .

Vyhodnotenie nespracovej mierky

V nasledujúcom kóde použite funkciu SemPy evaluate_measure na výpočet vopred nakonfigurovanej mierky s názvom "Priemerná veľkosť predajného priestoru". Základný vzorec pre túto mierku môžete vidieť vo výstupe predchádzajúcej bunky.

fabric.evaluate_measure(dataset, measure="Average Selling Area Size")

Vyhodnotenie mierky pomocou groupby_columns

Výstup mierky môžete zoskupiť podľa určitých stĺpcov tak, že zadáte ďalší parameter groupby_columns:

fabric.evaluate_measure(dataset, measure="Average Selling Area Size", groupby_columns=["Store[Chain]", "Store[DistrictName]"])

V predchádzajúcom kóde ste zoskupili podľa stĺpcov Chain a DistrictNameStore tabuľky v sémantickom modeli.

Vyhodnotenie mierky pomocou filtrov

Parameter môžete použiť filters aj na určenie konkrétnych hodnôt, ktoré môže výsledok obsahovať pre konkrétne stĺpce:

fabric.evaluate_measure(dataset, \
                        measure="Total Units Last Year", \
                        groupby_columns=["Store[Territory]"], \
                        filters={"Store[Territory]": ["PA", "TN", "VA"], "Store[Chain]": ["Lindseys"]})

V predchádzajúcom kóde Store je názov tabuľky, Territory je názov stĺpca a PA je jednou z hodnôt, ktoré filter povoľuje.

Vyhodnotenie mierky v rámci viacerých tabuliek

Mierku môžete zoskupiť podľa stĺpcov, ktoré zahŕňajú viacero tabuliek v sémantickom modeli.

fabric.evaluate_measure(dataset, measure="Total Units Last Year", groupby_columns=["Store[Territory]", "Sales[ItemID]"])

Vyhodnotenie viacerých mierok

evaluate_measure Funkcia vám umožňuje zadať identifikátory viacerých mierok a výstup vypočítaných hodnôt v tom istom prvku DataFrame:

fabric.evaluate_measure(dataset, measure=["Average Selling Area Size", "Total Stores"], groupby_columns=["Store[Chain]", "Store[DistrictName]"])

Použitie konektora XMLA služby Power BI

Predvolený klient sémantických modelov je podporovaný rozhraniami REST API služby Power BI. V prípade akýchkoľvek problémov s spustením dotazov s týmto klientom je možné prepnúť koncový server do rozhrania XMLA služby Power BI pomocou funkcie use_xmla=True. Parametre SemPy zostávajú pri výpočte mierky s XMLA rovnaké.

fabric.evaluate_measure(dataset, \
                        measure=["Average Selling Area Size", "Total Stores"], \
                        groupby_columns=["Store[Chain]", "Store[DistrictName]"], \
                        filters={"Store[Territory]": ["PA", "TN", "VA"], "Store[Chain]": ["Lindseys"]}, \
                        use_xmla=True)

Pozrite si ďalšie kurzy o sémantických prepojeniach/SemPy: