Adatgyűjtés éles modellekből
ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)
Python SDK azure-ai-ml v2 (aktuális)
Ebben a cikkben megismerheti az Azure Machine Learning online végpontjaiban üzembe helyezett modellek adatgyűjtését.
Az Azure Machine Learning-adatgyűjtő valós idejű naplózást biztosít a bemeneti és kimeneti adatokról a felügyelt online végpontokon vagy Kubernetes online végpontokon üzembe helyezett modellekből. Az Azure Machine Learning a naplózott következtetési adatokat az Azure Blob Storage-ban tárolja. Ezek az adatok ezután zökkenőmentesen használhatók modellfigyeléshez, hibakereséshez vagy naplózáshoz, ezáltal megfigyelhetővé téve az üzembe helyezett modellek teljesítményét.
Az adatgyűjtő a következő lehetőségeket biztosítja:
- Következtetési adatok naplózása központi helyre (Azure Blob Storage)
- Felügyelt online végpontok és Kubernetes online végpontok támogatása
- Definíció az üzembe helyezés szintjén, amely lehetővé teszi a konfiguráció maximális módosítását
- A hasznos adatok és az egyéni naplózás támogatása
Naplózási módok
Az adatgyűjtő két naplózási módot biztosít: a hasznos adatok naplózását és az egyéni naplózást. A hasznos adatok naplózása lehetővé teszi a HTTP-kérések és válasz hasznos adatok gyűjtését az üzembe helyezett modellekből. Az egyéni naplózással az Azure Machine Learning egy Python SDK-t biztosít a Pandas DataFrames közvetlen naplózásához a pontozási szkriptből. Az egyéni naplózási Python SDK-val a modell bemeneti és kimeneti adatait is naplózhatja, az adatokon kívül bármilyen adatátalakítás (vagy előfeldolgozás) előtt, alatt és után is.
Adatgyűjtő konfigurációja
Az adatgyűjtő az üzembe helyezés szintjén konfigurálható, és a konfiguráció az üzembe helyezéskor van megadva. Konfigurálhatja az Azure Blob Storage-célhelyet, amely megkapja az összegyűjtött adatokat. Konfigurálhatja a mintavételezési arányt is (0–100%- ig) az adatgyűjtéshez.
Korlátozások
Az adatgyűjtőre az alábbi korlátozások vonatkoznak:
- Az adatgyűjtő csak az online (vagy valós idejű) Azure Machine Learning-végpontok (felügyelt vagy Kubernetes) naplózását támogatja.
- Az adatgyűjtő Python SDK csak a táblázatos adatok pandas DataFrame-en keresztüli naplózását támogatja.