Zoskupenie alebo súhrn riadkov
V doplnku Power Query môžete zoskupiť hodnoty v rôznych riadkoch do jednej hodnoty zoskupením riadkov podľa hodnôt v jednom alebo viacerých stĺpcoch. Môžete si vybrať z dvoch typov operácií zoskupenia:
Zoskupenia stĺpcov.
Zoskupenia riadkov.
V tomto kurze používate nasledujúcu ukážková tabuľku.
Snímka obrazovky tabuľky so stĺpcami zobrazujúcimi Rok (2020), Krajina (USA, Panama alebo Kanada), produkt (tričko alebo šortky), predajný kanál (online alebo predajca) a jednotky (rôzne hodnoty od 55 do 7500)
Kde nájdete tlačidlo Zoskupiť podľa
Tlačidlo Zoskupiť podľa môžete nájsť na troch miestach:
Na karte Domov v skupine Transformovať.
Na karte Transformovať
v skupine Tabuľka. Keď kliknete pravým tlačidlom myši v kontextovej ponuke, vyberiete stĺpce.
Použitie agregovanej funkcie na zoskupenie podľa jedného alebo viacerých stĺpcov
V tomto príklade bude vaším cieľom sumarizovať celkový počet predaných jednotiek na úrovni krajiny a predajného kanála. Na vykonanie operácie zoskupenia použite
- Na karte Domov vyberte položku Zoskupovať podľa.
- Vyberte možnosť Rozšírené, aby ste mohli vybrať viacero stĺpcov, podľa ktorého sa majú zoskupiť.
- Vyberte stĺpec Country .
- Vyberte Pridaťzoskupenia.
- Vyberte stĺpec Sales Channel .
- Do
Názov nového stĺpca zadajteCelkový počet jednotiek , do poľaoperáciavyberte položku Súčet a vstĺpca vyberte jednotky . - Vyberte
OK
V tejto operácii je uvedená nasledujúca tabuľka.
Dostupné operácie
Vďaka funkcii Group by je možné dostupné operácie kategorizovať dvoma spôsobmi:
- Operácia na úrovni riadkov
- Operácia na úrovni stĺpca
Nasledujúca tabuľka popisuje každú z týchto operácií.
Názov operácie | Kategória | Popis |
---|---|---|
Súčet | Operácia stĺpca | Sčíta všetky hodnoty zo stĺpca |
priemerné | Operácia stĺpca | Vypočíta priemernú hodnotu zo stĺpca |
mediánu |
Operácia stĺpca | Vypočíta medián zo stĺpca |
min | Operácia stĺpca | Vypočíta minimálnu hodnotu zo stĺpca |
maximálna | Operácia stĺpca | Vypočíta maximálnu hodnotu zo stĺpca |
Percentile | Operácia stĺpca | Vypočíta percentil zo stĺpca pomocou vstupnej hodnoty od 0 do 100. |
Spočítať jedinečné hodnoty | Operácia stĺpca | Vypočíta počet jedinečných hodnôt zo stĺpca |
Spočítať riadky | Operácia riadka | Vypočíta celkový počet riadkov z danej skupiny |
Spočítať jedinečné riadky | Operácia riadka | Vypočíta počet jedinečných riadkov z danej skupiny |
všetky riadky | Operácia riadka | Výstupom sú všetky zoskupené riadky v hodnote tabuľky bez agregácií. |
Nota
Operácie a
Vykonanie operácie na zoskupenie podľa jedného alebo viacerých stĺpcov
Počnúc pôvodnou vzorkou v tomto príklade vytvoríte stĺpec obsahujúci celkový počet jednotiek a ďalšie dva stĺpce, ktoré vám pomenujú a predané jednotky pre produkt s najvyšším výkonom, ktorý je zhrnutý na úrovni krajiny a predajného kanála.
Použite nasledujúce stĺpce ako Zoskupovať podľa stĺpcov:
- Krajina
- Predajný kanál
Vytvorte dva nové stĺpce pomocou nasledujúcich krokov:
- Agregácia stĺpca Units pomocou operácie Sum. Tento stĺpec pomenujte Celkový počet jednotiek.
- Pridajte nový stĺpec Products pomocou operácie Všetky riadky.
Po dokončení tejto operácie si všimnite, ako Products stĺpec obsahuje hodnoty [Tabuľka] v každej bunke. Každá hodnota [Tabuľka] obsahuje všetky riadky, ktoré boli zoskupené podľa
Nota
Na table s ukážkou podrobností sa nemusia zobrazovať všetky riadky použité pre operáciu zoskupenia. Môžete vybrať hodnotu [Tabuľka], aby sa zobrazili všetky riadky týkajúce sa zodpovedajúcej operácie zoskupenia.
V ďalšom kroku musíte extrahovať riadok s najvyššou hodnotou v stĺpci Units tabuliek v stĺpci new Products a zavolať tento nový stĺpec produkt s najvyšším výkonom.
Extrahovanie informácií o produkte s najvyšším výkonom
S novým stĺpcom
Nový stĺpec pomenujte produkt s najvyšším výkonom. Do Vzorec vlastného stĺpcazadajte Table.Max([Products], "Units" )
vzorca .
Výsledkom tohto vzorca sa vytvorí nový stĺpec s hodnotami [Záznam]. Tieto hodnoty záznamu sú v podstate tabuľkou len s jedným riadkom. Tieto záznamy obsahujú riadok s maximálnou hodnotou pre stĺpec Units jednotlivých hodnôt [tabuľka] v stĺpci Products.
Pomocou tejto novej stĺpca Produkt s najvyšším výkonom obsahujúcim hodnoty [Záznam] môžete vybrať ikonu rozbalenia, vybrať polia Product a Units a potom vybrať OK.
Po odstránení stĺpca Products a nastavení typu údajov pre oba novo rozbalené stĺpce sa váš výsledok bude podobať na nasledujúcom obrázku.
Približné zoskupenie
Nota
Nasledujúca funkcia je k dispozícii len v Power Query Online.
Ak chcete ukázať, ako na to "približné zoskupenie", zvážte ukážku tabuľky zobrazenú na nasledujúcom obrázku.
Cieľom približného zoskupenia je vykonať operáciu zoskupenia, ktorá pre textové reťazce používa algoritmus približnej zhody. Power Query používa algoritmus podobnosti Jaccard na meranie podobnosti medzi pármi inštancií. Potom použije aglomeratívne hierarchické klastrovanie na zoskupenie inštancií. Nasledujúci obrázok znázorňuje očakávaný výstup, v ktorom je tabuľka zoskupená podľa stĺpca Person.
Ak chcete vykonať približné zoskupenie, vykonajte rovnaké kroky, aké boli predtým popísané v tomto článku. Jediný rozdiel je v tom, že tentoraz v dialógovom okne Zoskupiť podľa začiarknite políčko Použiť približné zoskupenie.
Pre každú skupinu riadkov Power Query vyberie najčastejšie inštanciu ako "kanonickú" inštanciu. Ak sa vyskytujú viaceré inštancie s rovnakou frekvenciou, Power Query vyberie prvú inštanciu. Po výbere možnosti OK v dialógovom okne Zoskupiť podľa získate očakávaný výsledok.
Väčšiu kontrolu nad operáciou približného zoskupenia však máte, keď rozbalíte možnosti skupiny fuzzy.
Pre približné zoskupenie sú k dispozícii tieto možnosti:
- Prahová hodnota podobnosti (voliteľná): Táto možnosť označuje, ako musia byť podobné dve hodnoty zoskupené. Minimálnym nastavením nuly (0) sa zoskupia všetky hodnoty. Maximálne nastavenie 1 umožňuje zoskupiť hodnoty, ktoré sa presne zhodujú. Predvolená hodnota je 0,8.
- Ignorovaťprípadu : Pri porovnávaní textových reťazcov sa veľké a malé písmená ignorujú. Táto možnosť je predvolene zapnutá.
- Group kombináciou častí textu: Algoritmus sa snaží skombinovať textové časti (napríklad kombinovať Micro a mäkké do Microsoft) do zoskupovacích hodnôt.
- Zobraziť skóre podobnosti: Po približnej zoskupení zobrazí skóre podobnosti medzi vstupnými hodnotami a vypočítavaných reprezentatívnymi hodnotami. Vyžaduje pridanie operácie, ako napríklad Všetky riadky na prezentovanie týchto informácií na úrovni riadkov.
- tabuľka transformácií (voliteľné): Ak ich chcete zoskupiť, môžete vybrať tabuľku transformácie, ktorá mapuje hodnoty (napríklad mapovanie MSFT na Microsoft).
V tomto príklade sa používa tabuľka transformácie na znázornenie toho, ako možno mapovať hodnoty. Tabuľka transformácie má dva stĺpce:
- From: Textový reťazec, ktorý sa má vyhľadať v tabuľke.
- Do: Textový reťazec, ktorý sa má použiť na nahradenie textového reťazca v stĺpci Od.
Na nasledujúcom obrázku je znázornená tabuľka transformácií použitá v tomto príklade.
Dôležitý
Je dôležité, aby mala transformačná tabuľka rovnaké stĺpce a názvy stĺpcov ako na predchádzajúcom obrázku (musia byť označené ako "Od" a "Do"). V opačnom prípade Power Query tabuľku nerozpozná ako tabuľku transformácie.
Vráťte sa do dialógového okna
Po výbere tabuľky transformácie vyberte položky OK. Výsledok tejto operácie vám poskytne nasledujúce informácie:
V tomto príklade bola povolená možnosť Ignorovať prípad, takže hodnoty v stĺpci Odtabuľky transformácie sa používajú na vyhľadanie textového reťazca bez ohľadu na prípad reťazca. Táto operácia transformácie sa vykoná najprv a potom sa vykoná približná operácia zoskupenia.
Skóre podobnosti sa zobrazuje aj v hodnote tabuľky vedľa stĺpca osoba, ktorá presne odráža, ako boli hodnoty zoskupené a ich príslušné skóre podobnosti. Tento stĺpec môžete v prípade potreby rozbaliť alebo môžete použiť hodnoty z nových stĺpcov Frequency pre iné druhy transformácií.
Nota
Pri zoskupovaní podľa viacerých stĺpcov vykoná tabuľka transformácie operáciu nahradenia vo všetkých stĺpcoch, ak nahradením hodnoty sa zvýši skóre podobnosti.
Ďalšie informácie o fungovaní tabuliek transformácie nájdete v téme predjatia tabuľky transformácií.