Zdieľať cez


Zoskupenie alebo súhrn riadkov

V doplnku Power Query môžete zoskupiť hodnoty v rôznych riadkoch do jednej hodnoty zoskupením riadkov podľa hodnôt v jednom alebo viacerých stĺpcoch. Môžete si vybrať z dvoch typov operácií zoskupenia:

  • Zoskupenia stĺpcov.

  • Zoskupenia riadkov.

V tomto kurze používate nasledujúcu ukážková tabuľku.

Počiatočná tabuľka ukážky.

Snímka obrazovky tabuľky so stĺpcami zobrazujúcimi Rok (2020), Krajina (USA, Panama alebo Kanada), produkt (tričko alebo šortky), predajný kanál (online alebo predajca) a jednotky (rôzne hodnoty od 55 do 7500)

Kde nájdete tlačidlo Zoskupiť podľa

Tlačidlo Zoskupiť podľa môžete nájsť na troch miestach:

  • Na karte Domov v skupine Transformovať.

    Snímka obrazovky pása s nástrojmi Power Query s možnosťou Zoskupovať podľa zvýraznenou na karte Domov.

  • Na karte Transformovať v skupine Tabuľka.

    Snímka obrazovky pása s nástrojmi Power Query s možnosťou Zoskupovať podľa zvýraznenou na karte Transformovať.

  • Keď kliknete pravým tlačidlom myši v kontextovej ponuke, vyberiete stĺpce.

    Snímka obrazovky tabuľky s možnosťou Zoskupovať podľa zvýraznenou v kontextovej ponuke.

Použitie agregovanej funkcie na zoskupenie podľa jedného alebo viacerých stĺpcov

V tomto príklade bude vaším cieľom sumarizovať celkový počet predaných jednotiek na úrovni krajiny a predajného kanála. Na vykonanie operácie zoskupenia použite Country a Sales Channel stĺpce.

  1. Na karte Domov vyberte položku Zoskupovať podľa.
  2. Vyberte možnosť Rozšírené, aby ste mohli vybrať viacero stĺpcov, podľa ktorého sa majú zoskupiť.
  3. Vyberte stĺpec Country .
  4. Vyberte Pridaťzoskupenia.
  5. Vyberte stĺpec Sales Channel .
  6. Do Názov nového stĺpcazadajte Celkový počet jednotiek, do poľaoperácia vyberte položku Súčeta v stĺpca vyberte jednotky.
  7. Vyberte OK

Snímka obrazovky znázorňujúca dialógové okno Zoskupovať podľa s vyplnenými agregovanými stĺpcami.

V tejto operácii je uvedená nasledujúca tabuľka.

Snímka obrazovky ukážkovej výstupnej tabuľky so stĺpcami Country (Krajina), Sales Channel (Predajný kanál) a Total units (Celkový počet jednotiek).

Dostupné operácie

Vďaka funkcii Group by je možné dostupné operácie kategorizovať dvoma spôsobmi:

  • Operácia na úrovni riadkov
  • Operácia na úrovni stĺpca

Nasledujúca tabuľka popisuje každú z týchto operácií.

Názov operácie Kategória Popis
Súčet Operácia stĺpca Sčíta všetky hodnoty zo stĺpca
priemerné Operácia stĺpca Vypočíta priemernú hodnotu zo stĺpca
mediánu Operácia stĺpca Vypočíta medián zo stĺpca
min Operácia stĺpca Vypočíta minimálnu hodnotu zo stĺpca
maximálna Operácia stĺpca Vypočíta maximálnu hodnotu zo stĺpca
Percentile Operácia stĺpca Vypočíta percentil zo stĺpca pomocou vstupnej hodnoty od 0 do 100.
Spočítať jedinečné hodnoty Operácia stĺpca Vypočíta počet jedinečných hodnôt zo stĺpca
Spočítať riadky Operácia riadka Vypočíta celkový počet riadkov z danej skupiny
Spočítať jedinečné riadky Operácia riadka Vypočíta počet jedinečných riadkov z danej skupiny
všetky riadky Operácia riadka Výstupom sú všetky zoskupené riadky v hodnote tabuľky bez agregácií.

Nota

Operácie a percentilu Count sú k dispozícii len v režime Power Query Online.

Vykonanie operácie na zoskupenie podľa jedného alebo viacerých stĺpcov

Počnúc pôvodnou vzorkou v tomto príklade vytvoríte stĺpec obsahujúci celkový počet jednotiek a ďalšie dva stĺpce, ktoré vám pomenujú a predané jednotky pre produkt s najvyšším výkonom, ktorý je zhrnutý na úrovni krajiny a predajného kanála.

Snímka obrazovky ukážkovej výstupnej tabuľky s operáciami.

  1. Použite nasledujúce stĺpce ako Zoskupovať podľa stĺpcov:

    • Krajina
    • Predajný kanál
  2. Vytvorte dva nové stĺpce pomocou nasledujúcich krokov:

    1. Agregácia stĺpca Units pomocou operácie Sum. Tento stĺpec pomenujte Celkový počet jednotiek.
    2. Pridajte nový stĺpec Products pomocou operácie Všetky riadky.

    Snímka obrazovky znázorňujúca dialógové okno Zoskupiť podľa s neagaggovaným stĺpcom.

Po dokončení tejto operácie si všimnite, ako Products stĺpec obsahuje hodnoty [Tabuľka] v každej bunke. Každá hodnota [Tabuľka] obsahuje všetky riadky, ktoré boli zoskupené podľa Country a stĺpce Predajný kanál z pôvodnej tabuľky. Môžete vybrať prázdny priestor vo vnútri bunky a zobraziť ukážku obsahu tabuľky v dolnej časti dialógového okna.

Snímka obrazovky tably ukážky podrobností tabuľky.

Nota

Na table s ukážkou podrobností sa nemusia zobrazovať všetky riadky použité pre operáciu zoskupenia. Môžete vybrať hodnotu [Tabuľka], aby sa zobrazili všetky riadky týkajúce sa zodpovedajúcej operácie zoskupenia.

V ďalšom kroku musíte extrahovať riadok s najvyššou hodnotou v stĺpci Units tabuliek v stĺpci new Products a zavolať tento nový stĺpec produkt s najvyšším výkonom.

Extrahovanie informácií o produkte s najvyšším výkonom

S novým stĺpcom Products s hodnotami [Tabuľka] vytvoríte nový vlastný stĺpec tak, že prejdite na kartu Pridať stĺpec na páse s nástrojmi a vyberiete vlastný stĺpec zo skupiny Všeobecné.

Snímka obrazovky pása s nástrojmi Power Query s možnosťou Vlastný stĺpec zvýraznenou na karte Pridať stĺpec

Nový stĺpec pomenujte produkt s najvyšším výkonom. Do Vzorec vlastného stĺpcazadajte Table.Max([Products], "Units" ) vzorca .

Snímka obrazovky dialógového okna Vlastný stĺpec so zadaným vzorcom pre položku Table.Max.

Výsledkom tohto vzorca sa vytvorí nový stĺpec s hodnotami [Záznam]. Tieto hodnoty záznamu sú v podstate tabuľkou len s jedným riadkom. Tieto záznamy obsahujú riadok s maximálnou hodnotou pre stĺpec Units jednotlivých hodnôt [tabuľka] v stĺpci Products.

Snímka obrazovky výsledku vzorca vlastného stĺpca s tabuľkou Table.Max.

Pomocou tejto novej stĺpca Produkt s najvyšším výkonom obsahujúcim hodnoty [Záznam] môžete vybrať ikonu rozbalenia, vybrať polia Product a Units a potom vybrať OK.

Snímka obrazovky znázorňujúca operáciu rozbalenia pre hodnotu záznamu v stĺpci produktu Top performer (Najlepšie výsledky).

Po odstránení stĺpca Products a nastavení typu údajov pre oba novo rozbalené stĺpce sa váš výsledok bude podobať na nasledujúcom obrázku.

Snímka obrazovky konečnej tabuľky so všetkými transformáciami.

Približné zoskupenie

Nota

Nasledujúca funkcia je k dispozícii len v Power Query Online.

Ak chcete ukázať, ako na to "približné zoskupenie", zvážte ukážku tabuľky zobrazenú na nasledujúcom obrázku.

Snímka obrazovky tabuľky s deviatimi riadkami položiek, ktoré obsahujú rôzne pravopisy a veľké písmená mena Miguel a William.

Cieľom približného zoskupenia je vykonať operáciu zoskupenia, ktorá pre textové reťazce používa algoritmus približnej zhody. Power Query používa algoritmus podobnosti Jaccard na meranie podobnosti medzi pármi inštancií. Potom použije aglomeratívne hierarchické klastrovanie na zoskupenie inštancií. Nasledujúci obrázok znázorňuje očakávaný výstup, v ktorom je tabuľka zoskupená podľa stĺpca Person.

Snímka obrazovky tabuľky zobrazujúca položky pre osoby ako Miguel a Mikrofón a Frekvencia ako 3 a 2.

Ak chcete vykonať približné zoskupenie, vykonajte rovnaké kroky, aké boli predtým popísané v tomto článku. Jediný rozdiel je v tom, že tentoraz v dialógovom okne Zoskupiť podľa začiarknite políčko Použiť približné zoskupenie.

Snímka obrazovky so začiarkavacím políčkom Približné zoskupenie zvýrazneným v dialógovom okne Zoskupiť podľa.

Pre každú skupinu riadkov Power Query vyberie najčastejšie inštanciu ako "kanonickú" inštanciu. Ak sa vyskytujú viaceré inštancie s rovnakou frekvenciou, Power Query vyberie prvú inštanciu. Po výbere možnosti OK v dialógovom okne Zoskupiť podľa získate očakávaný výsledok.

Snímka obrazovky znázorňujúca finálnu tabuľku zoskupenia Približné, žiadna tabuľka transformácie.

Väčšiu kontrolu nad operáciou približného zoskupenia však máte, keď rozbalíte možnosti skupiny fuzzy.

Snímka obrazovky dialógového okna Zoskupovať podľa s možnosťami skupiny Fuzzy zvýraznenou.

Pre približné zoskupenie sú k dispozícii tieto možnosti:

  • Prahová hodnota podobnosti (voliteľná): Táto možnosť označuje, ako musia byť podobné dve hodnoty zoskupené. Minimálnym nastavením nuly (0) sa zoskupia všetky hodnoty. Maximálne nastavenie 1 umožňuje zoskupiť hodnoty, ktoré sa presne zhodujú. Predvolená hodnota je 0,8.
  • Ignorovaťprípadu : Pri porovnávaní textových reťazcov sa veľké a malé písmená ignorujú. Táto možnosť je predvolene zapnutá.
  • Group kombináciou častí textu: Algoritmus sa snaží skombinovať textové časti (napríklad kombinovať Micro a mäkké do Microsoft) do zoskupovacích hodnôt.
  • Zobraziť skóre podobnosti: Po približnej zoskupení zobrazí skóre podobnosti medzi vstupnými hodnotami a vypočítavaných reprezentatívnymi hodnotami. Vyžaduje pridanie operácie, ako napríklad Všetky riadky na prezentovanie týchto informácií na úrovni riadkov.
  • tabuľka transformácií (voliteľné): Ak ich chcete zoskupiť, môžete vybrať tabuľku transformácie, ktorá mapuje hodnoty (napríklad mapovanie MSFT na Microsoft).

V tomto príklade sa používa tabuľka transformácie na znázornenie toho, ako možno mapovať hodnoty. Tabuľka transformácie má dva stĺpce:

  • From: Textový reťazec, ktorý sa má vyhľadať v tabuľke.
  • Do: Textový reťazec, ktorý sa má použiť na nahradenie textového reťazca v stĺpci Od.

Na nasledujúcom obrázku je znázornená tabuľka transformácií použitá v tomto príklade.

Snímka obrazovky tabuľky zobrazujúca položky Z hodnôt mikrofónu a Williama a Na hodnoty Miguela a Billa.

Dôležitý

Je dôležité, aby mala transformačná tabuľka rovnaké stĺpce a názvy stĺpcov ako na predchádzajúcom obrázku (musia byť označené ako "Od" a "Do"). V opačnom prípade Power Query tabuľku nerozpozná ako tabuľku transformácie.

Vráťte sa do dialógového okna Zoskupiť podľa, rozbaľte možnosti skupiny Približné, zmeňte operáciu z Spočítať riadky na všetky riadky, povoľte možnosť Zobraziť skóre podobnosti a potom vyberte rozbaľovaciu ponuku Tabuľka transformácie.

Snímka obrazovky znázorňujúca rozbaľovaciu ponuku s ukážkou transformácie tabuľky približných zoskupení.

Po výbere tabuľky transformácie vyberte položky OK. Výsledok tejto operácie vám poskytne nasledujúce informácie:

Snímka obrazovky znázorňujúca približné zoskupenie ukážkovej finálnej tabuľky s tabuľkou transformácie.

V tomto príklade bola povolená možnosť Ignorovať prípad, takže hodnoty v stĺpci Odtabuľky transformácie sa používajú na vyhľadanie textového reťazca bez ohľadu na prípad reťazca. Táto operácia transformácie sa vykoná najprv a potom sa vykoná približná operácia zoskupenia.

Skóre podobnosti sa zobrazuje aj v hodnote tabuľky vedľa stĺpca osoba, ktorá presne odráža, ako boli hodnoty zoskupené a ich príslušné skóre podobnosti. Tento stĺpec môžete v prípade potreby rozbaliť alebo môžete použiť hodnoty z nových stĺpcov Frequency pre iné druhy transformácií.

Nota

Pri zoskupovaní podľa viacerých stĺpcov vykoná tabuľka transformácie operáciu nahradenia vo všetkých stĺpcoch, ak nahradením hodnoty sa zvýši skóre podobnosti.

Ďalšie informácie o fungovaní tabuliek transformácie nájdete v téme predjatia tabuľky transformácií.

Pozri tiež

Pridanie vlastného stĺpca
odstránenie duplikátov