Számítási metrikák megtekintése
Ez a cikk bemutatja, hogyan használható a natív számítási metrikák eszköz az Azure Databricks felhasználói felületén a fő hardverek és Spark-metrikák gyűjtésére. A metrikák felhasználói felülete minden célú és feladatok kiszámításához elérhető.
Feljegyzés
A notebookok és feladatok kiszolgáló nélküli számítása lekérdezési elemzéseket használ a metrikák felhasználói felülete helyett. A kiszolgáló nélküli számítási metrikákról további információt a lekérdezési elemzések megtekintése című témakörben talál.
A metrikák szinte valós időben, egy percnél rövidebb normál késleltetéssel érhetők el. A metrikák az Azure Databricks által felügyelt tárolóban vannak tárolva, nem az ügyfél tárolójában.
Miben különböznek ezek az új metrikák a Gangliától?
Az új számítási metrikák felhasználói felülete átfogóbb képet nyújt a fürt erőforrás-használatáról, beleértve a Spark-használatot és a belső Databricks-folyamatokat. Ezzel szemben a Ganglia felhasználói felülete csak a Spark-tárolók használatát méri. Ez a különbség a két interfész metrikaértékeinek eltérését eredményezheti.
Számítási metrikák felhasználói felületének elérése
A számítási metrikák felhasználói felületének megtekintése:
- Kattintson a Számítás gombra az oldalsávon.
- Kattintson arra a számítási erőforrásra, amelyhez meg szeretné tekinteni a metrikákat.
- Kattintson a Metrikák fülre.
A hardvermetrikák alapértelmezés szerint megjelennek. A Spark-metrikák megtekintéséhez kattintson a Hardver feliratú legördülő menüre, és válassza Sparklehetőséget. Az is választható, ha a példány GPU-kompatibilis: GPU.
Metrikák szűrése időszak szerint
Az előzménymetrikák megtekintéséhez válasszon ki egy időtartományt a dátumválasztó szűrővel. A metrikákat percenként gyűjtjük, így az elmúlt 30 naptól kezdve bármilyen nap, óra vagy perc szerint szűrhet. Kattintson a naptár ikonra az előre definiált adattartományok közül való kijelöléshez, vagy a szövegmezőn belülre kattintva egyéni értékeket definiálhat.
Feljegyzés
A diagramokon megjelenített időintervallumok a megtekintett idő hosszától függően módosulnak. A legtöbb metrika az aktuálisan megtekintett időintervallumon alapuló átlag.
A legújabb metrikákat a Frissítés gombra kattintva is lekérheti.
Metrikák megtekintése csomópontszinten
Az egyes csomópontok metrikáinak megtekintéséhez kattintson a Compute legördülő menüre, és válassza ki azt a csomópontot, amelyhez meg szeretné tekinteni a metrikákat. A GPU-metrikák csak az egyes csomópontok szintjén érhetők el. A Spark-metrikák nem érhetők el az egyes csomópontokhoz.
Feljegyzés
Ha nem jelöl ki egy adott csomópontot, az eredmény a fürt összes csomópontjának (beleértve az illesztőprogramot) átlaga lesz.
Hardvermetrikadiagramok
A számítási metrikák felhasználói felületén a következő hardvermetrikadiagramok tekinthetők meg:
- Kiszolgálói terheléselosztás: Ez a diagram az egyes csomópontok processzorhasználatát mutatja az elmúlt percben.
-
CPU-kihasználtság: A processzor által az egyes módban töltött idő százalékos aránya a processzor teljes másodperces költségei alapján. A metrika átlaga a diagramon megjelenített időintervallum alapján történik. A nyomon követett módok a következők:
- vendég: Ha virtuális gépeket futtat, az a processzor, amelyet a virtuális gépek használnak
- iowait: Az I/O-ra való várakozással töltött idő
- tétlenség: Az idő, a cpu nem volt mit tenni
- irq: Megszakításkérésekkel töltött idő
- szép: A pozitív szépséggel rendelkező folyamatok által használt idő, ami alacsonyabb prioritást jelent, mint a többi tevékenység
- softirq: Szoftveres megszakítási kérelmekre fordított idő
- lopás: Ha Ön virtuális gép, akkor az idő, amikor más virtuális gépek "ellopták" a cpu-kból
- rendszer: A kernelben töltött idő
- felhasználó: A felhasználói területen töltött idő
-
Memóriakihasználtság: Az egyes módok teljes memóriahasználata bájtban mérve, és a diagramon megjelenített időintervallum alapján átlagolt. A rendszer a következő használati típusokat követi nyomon:
- használt: Használt memória (beleértve a számításon futó háttérfolyamatok által használt memóriát is)
- szabad: Nem használt memória
- puffer: A kernelpufferek által használt memória
- gyorsítótárazott: A fájlrendszer gyorsítótára által az operációs rendszer szintjén használt memória
- Memóriacserélés kihasználtsága: A memória felcserélése minden mód szerint, bájtban mérve, és a diagramon megjelenített időintervallum alapján átlagolt.
- Szabad fájlrendszerterület: Az egyes csatlakoztatási pontok teljes fájlrendszerhasználata bájtban mérve, és a diagramon megjelenített időintervallum alapján számítva.
- Hálózaton keresztül fogadva: Az egyes eszközök által a hálózaton keresztül fogadott bájtok száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
- Hálózaton keresztül továbbítva: Az egyes eszközök által a hálózaton keresztül továbbított bájtok száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
- Aktív csomópontok száma: Ez az aktív csomópontok számát jeleníti meg az adott számítás minden időbélyegén.
Spark-metrikák diagramjai
A számítási metrikák felhasználói felületén a következő Spark-metrikadiagramok tekinthetők meg:
- Kiszolgálói terheléselosztás: Ez a diagram az egyes csomópontok processzorhasználatát mutatja az elmúlt percben.
- Aktív tevékenységek: Az adott időpontban végrehajtott tevékenységek teljes száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
- Összes sikertelen tevékenység: A végrehajtókban sikertelen tevékenységek teljes száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
- Összes befejezett tevékenység: A végrehajtókban befejezett tevékenységek teljes száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
- Tevékenységekteljes száma: A végrehajtókban lévő összes tevékenység (futtatás, sikertelen és befejezett) teljes száma, amely a diagramon megjelenített időintervallum alapján átlagolt.
-
Teljes shuffle read: Az shuffle read data teljes mérete bájtban mérve és átlagolva attól függően, hogy melyik időintervallum jelenik meg a diagramon.
Shuffle read
a szakasz elején lévő összes végrehajtó szerializált olvasási adatainak összegét jelenti. -
Teljes shuffle írás: Az shuffle írási adatok teljes mérete bájtban mérve, és a diagramon megjelenített időintervallum alapján átlagolt.
Shuffle Write
a továbbítás előtt (általában egy szakasz végén) az összes végrehajtó írott szerializált adatainak összege. - Teljes tevékenység időtartama: A JVM által a feladatok végrehajtókon való végrehajtásával töltött teljes idő másodpercben mérve, és a diagramon megjelenített időintervallum alapján átlagolt.
GPU-metrikadiagramok
Feljegyzés
A GPU-metrikák csak a Databricks Runtime ML 13.3-on és újabb verziókban érhetők el.
A következő GPU-metrikadiagramok tekinthetők meg a számítási metrikák felhasználói felületén:
- Kiszolgálói terheléselosztás: Ez a diagram az egyes csomópontok processzorhasználatát mutatja az elmúlt percben.
- GPU-nkénti dekóder-kihasználtság: A GPU-dekódoló kihasználtságának százalékos aránya, amely a diagramon megjelenített időintervallum alapján átlagolt.
- GPU-kódolónkénti kihasználtság: A GPU-kódoló kihasználtságának százalékos aránya, amely a diagramon megjelenített időintervallum alapján átlagolva van.
- GPU-nkénti puffer memóriahasználati bájtok: A keretpuffer memóriakihasználtsága bájtban mérve, és a diagramon megjelenített időintervallum alapján átlagolt.
- GPU-nkénti memóriakihasználtság: A GPU-memória kihasználtságának százalékos aránya, amely a diagramon megjelenített időintervallum alapján átlagolt.
- GPU-nkénti kihasználtság: A GPU-kihasználtság százalékos aránya, amely a diagramon megjelenített időintervallum alapján átlagolt.
Hibaelhárítás
Ha hiányos vagy hiányzó metrikákat lát egy adott időszakra vonatkozóan, az a következő problémák egyike lehet:
- A Databricks szolgáltatás metrikáinak lekérdezéséért és tárolásáért felelős kimaradás.
- Hálózati problémák az ügyfél oldalán.
- A számítás sérült állapotban van vagy volt.