Zdieľať cez


Práca s duplicitnými hodnotami

S duplicitnými množinami hodnôt môžete pracovať prostredníctvom transformácií, ktoré môžu odstrániť duplikáty z vašich údajov. Alebo môžete filtrovať údaje tak, aby sa zobrazovali iba duplikáty, takže sa na ne môžete zamerať.

Upozornenie

V doplnku Power Query sa rozlišuje veľké a malé písmená. Pri práci s duplicitnými hodnotami doplnok Power Query berie do úvahy prípad textu, ktorý môže viesť k neželaným výsledkom. Ako alternatívne riešenie môžu používatelia pred odstránením duplikátov použiť transformáciu veľkých alebo malých písmen.

V tomto článku sa v príkladoch používa nasledujúca tabuľka so stĺpcami ID, Category a Total .

Snímka obrazovky počiatočnej ukážkovej tabuľky obsahujúcej stĺpce ID, Category a Total.

Odstránenie duplikátov

Jednou z operácií, ktoré môžete vykonať, je odstránenie duplicitných hodnôt z tabuľky.

  1. Vyberte stĺpce, ktoré obsahujú duplicitné hodnoty.

  2. Prejdite na kartu Domov .

  3. V skupine Zredukovať riadky vyberte položku Odstrániť riadky.

  4. V rozbaľovacej ponuke vyberte položku Odstrániť duplikáty.

    Snímka obrazovky zobrazujúca umiestnenie možnosti Odstrániť duplikáty v časti Odstrániť riadky.

Upozornenie

Neexistuje žiadna záruka, že pri odstránení duplikátov sa vyberie prvá inštancia v množine duplikátov. Ďalšie informácie o tom, ako zachovať zoradenie, nájdete v téme Zachovanie zoradenia.

Odstránenie duplikátov z viacerých stĺpcov

V tomto príklade chcete identifikovať a odstrániť duplikáty pomocou všetkých stĺpcov z tabuľky.

Snímka obrazovky počiatočnej tabuľky s duplikátmi vo viacerých stĺpcoch zvýraznenými.

Máte štyri riadky, ktoré sú duplikátmi. Vaším cieľom je odstrániť tieto duplicitné riadky, aby sa v tabuľke nachádzali len jedinečné riadky. V tabuľke vyberte všetky stĺpce a potom vyberte položku Odstrániť duplikáty.

Výsledkom tejto operácie je tabuľka, ktorú hľadáte.

Snímka obrazovky konečnej tabuľky s odstránenými duplikátmi zo všetkých stĺpcov.

Poznámka

Túto operáciu možno vykonať aj s podmnožinou stĺpcov.

Odstránenie duplikátov z jedného stĺpca

V tomto príklade chcete identifikovať a odstrániť duplikáty iba pomocou stĺpca Kategória z tabuľky.

Snímka obrazovky počiatočnej tabuľky, ktorá identifikuje duplikáty v stĺpci Category (Kategória).

Tieto duplikáty chcete odstrániť a zachovať si len jedinečné hodnoty. Ak chcete odstrániť duplikáty zo stĺpca Kategória , vyberte ho a potom vyberte položku Odstrániť duplikáty.

Výsledkom tejto operácie je tabuľka, ktorú hľadáte.

Snímka obrazovky konečnej tabuľky s duplikátmi odstránenými zo stĺpca Kategória.

Majte duplikáty

Ďalšou operáciou, ktorú môžete vykonať s duplikátmi, je ponechať v tabuľke iba duplikáty.

  1. Vyberte stĺpce, ktoré obsahujú duplicitné hodnoty.

  2. Prejdite na kartu Domov .

  3. V skupine Zredukovať riadky vyberte položku Ponechať riadky.

  4. V rozbaľovacej ponuke vyberte položku Zachovať duplikáty.

    Snímka obrazovky zobrazujúca umiestnenie možnosti Ponechať duplikáty v časti Ponechať riadky.

Duplicitné hodnoty uchovávajte z viacerých stĺpcov

V tomto príklade chcete identifikovať a zachovať duplikáty pomocou všetkých stĺpcov z tabuľky.

Snímka obrazovky počiatočnej tabuľky obsahujúcej uchovávanie duplikátov z viacerých stĺpcov.

Máte štyri riadky, ktoré sú duplikátmi. Vaším cieľom v tomto príklade je ponechať iba riadky, ktoré sa duplikujú v tabuľke. Vyberte všetky stĺpce v tabuľke a potom vyberte položku Zachovať duplikáty.

Výsledkom tejto operácie je tabuľka, ktorú hľadáte.

Snímka obrazovky konečnej tabuľky s iba duplicitnými riadkami z viacerých stĺpcov.

Duplicitné položky uchovávajte v jednom stĺpci

V tomto príklade chcete identifikovať a zachovať duplikáty len pomocou stĺpca ID z tabuľky.

Počiatočná tabuľka na uchovávanie duplikátov z jedného stĺpca.

V tomto príklade máte viacero duplikátov a chcete, aby sa z tabuľky uchovávali iba tieto duplikáty. Ak chcete v stĺpci id zachovať duplikáty, vyberte stĺpec id a potom vyberte položku Zachovať duplikáty.

Výsledkom tejto operácie je tabuľka, ktorú hľadáte.

Konečná tabuľka iba s duplicitnými riadkami z jedného stĺpca.

Nástroje na profilovanie údajov