Zdieľať cez


Používanie nástrojov na profilovanie údajov

Nástroje na profilovanie údajov poskytujú nové a intuitívne spôsoby čistenia, transformácie a pochopenia údajov v Editor Power Query. Sú to:

  • Kvalita stĺpcov

  • Distribúcia stĺpcov

  • Profil stĺpca

Ak chcete povoliť nástroje profilovania údajov, prejdite na kartu Zobrazenie na páse s nástrojmi. V aplikácii Power Query Desktop povoľte požadované možnosti v skupine Ukážka údajov, ako je to znázornené na nasledujúcom obrázku.

Snímka obrazovky zobrazujúca nástroje profilovania údajov vybraté na karte Zobrazenie Power Query.

V Power Query Online vyberte položku Zobrazenie údajov a potom v rozbaľovacom zozname povoľte požadované možnosti.

Snímka obrazovky zobrazujúca nástroje profilovania údajov vybraté v časti Zobrazenie údajov na karte Zobraziť.

Po povolení možností sa v Editor Power Query zobrazí niečo ako na nasledujúcom obrázku.

Snímka obrazovky nástrojov na profilovanie údajov po ich nastavení.

Poznámka

Power Query predvolene vykoná toto profilovanie údajov na prvých 1 000 riadkoch údajov. Ak chcete, aby fungovala v celej množine údajov, vyberte správu Profilovanie stĺpcov na základe hlásenia prvých 1 000 riadkov v ľavom dolnom rohu okna editora a zmeňte profilovanie stĺpcov na profilovanie stĺpcov na základe celej množiny údajov.

Kvalita stĺpcov

Funkcie kvality stĺpcov označujú hodnoty v riadkoch v piatich kategóriách:

  • Platné, zobrazené zelenou farbou.

  • Chyba zobrazená červenou farbou.

  • Prázdna, zobrazená tmavosivou.

  • Neznámy, zobrazený na prerušovanej zelenej farbe. Udáva, kedy sa v stĺpci vyskytnú chyby, kvalita zostávajúcich údajov nie je známa.

  • Neočakávaná chyba zobrazená prerušovanou červenou farbou.

Tieto indikátory sa zobrazujú priamo pod názvom stĺpca ako súčasť malého pruhového grafu, ako je to znázornené na nasledujúcom obrázku.

Snímka obrazovky vylepšeného zobrazenia pruhového grafu s ukazovateľmi kvality údajov a označeniami nad jednotlivými stĺpcami v tabuľke.

Počet záznamov v každej kategórii kvality stĺpca sa zobrazí aj ako percento.

Ukázaním na ktorýkoľvek stĺpec sa zobrazí číselná distribúcia kvality hodnôt v celom stĺpci. Okrem toho sa výberom tlačidla s tromi bodkami (...) otvorí niekoľko tlačidiel rýchleho merania pre operácie s hodnotami.

Snímka obrazovky s distribúciou názvov stĺpcov so 701 platnými názvami (100 percent), nulovými chybami a prázdnymi nulami so zobrazenými príkazmi rýchleho merania.

Distribúcia stĺpcov

Táto funkcia poskytuje množinu vizuálov pod názvami stĺpcov, ktoré prezentujú frekvenciu a distribúciu hodnôt v každom stĺpci. Údaje v týchto vizualizáciách sú zoradené v zostupnom poradí od hodnoty s najvyššou frekvenciou.

Snímka obrazovky nástrojov na profilovanie údajov s zvýraznenou distribúciou horných stĺpcov.

Ukázaním na distribučné údaje v ktoromkoľvek stĺpci získate informácie o celkových údajoch v stĺpci (s jedinečným počtom a jedinečnými hodnotami). Distinct odkazuje na celkový počet rôznych hodnôt v každom stĺpci. Jedinečné odkazuje na hodnoty, ktoré majú v stĺpci iba jednu inštanciu. Môžete tiež vybrať tlačidlo s tromi bodkami a vybrať si z ponuky dostupných operácií.

Snímka obrazovky nástrojov na profilovanie údajov s možnosťami distribúcií stĺpcov zvýraznenými.

Profil stĺpca

Táto funkcia poskytuje podrobnejší prehľad o údajoch v stĺpci. Okrem grafu distribúcie stĺpcov obsahuje aj graf so štatistikou stĺpcov. Tieto informácie sa zobrazia pod časťou ukážky údajov, ako je to znázornené na nasledujúcom obrázku.

Snímka obrazovky nástroja na profilovanie údajov s zvýrazneným profilom stĺpca.

Filtrovať podľa hodnoty

S grafom distribúcie hodnôt môžete pracovať na pravej strane a vybrať ktorýkoľvek z pruhov tak, že ukážete na časti grafu.

Snímka obrazovky znázorňujúca ukázanie myšou na pruh v pruhovom grafe distribúcie hodnôt, v ktorom sa zobrazujú jednotlivé údaje pre tento pruh.

Kliknutím pravým tlačidlom myši zobrazíte množinu dostupných transformácií pre túto hodnotu.

Snímka obrazovky znázorňujúca spôsob zobrazenia kontextovej ponuky s dostupnými transformáciami pre jeden pruh v pruhovom grafe distribúcie hodnôt.

Kopírovať údaje

V pravom hornom rohu sekcie štatistiky stĺpca aj distribúcie hodnôt môžete vybrať tlačidlo s tromi bodkami (...) a zobraziť tak ponuku Kopírovať odkaz. Vyberte ho a skopírujte údaje zobrazené v oboch sekciách do Schránky.

Snímka obrazovky znázorňujúca ponuku Kopírovať odkaz v stĺpci so štatistikou stĺpca.

Zoskupovať podľa hodnoty

Keď vyberiete tlačidlo s tromi bodkami (...) v pravom hornom rohu grafu distribúcie hodnôt, môžete okrem položky Kopírovať vybrať položku Zoskupiť podľa. Táto funkcia zoskupí hodnoty v grafe podľa množiny dostupných možností.

Snímka obrazovky znázorňujúca ponuku Kopírovať a zoskupovať podľa odkazu v stĺpci Distribúcia hodnôt.

Na nasledujúcom obrázku je zobrazený stĺpec názvov produktov, ktoré sú zoskupené podľa dĺžky textu. Po zoskupení hodnôt v grafe môžete pracovať s jednotlivými hodnotami v grafe, ako je to popísané v téme Filtrovanie podľa hodnoty.

Snímka obrazovky nového pruhového grafu zobrazujúca distribúciu dĺžky textu názvov predajní v stĺpci Names (Názvy) tabuľky.