Adatgyűjtés éles modellekből

Cikk
09/02/2024

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Ebben a cikkben megismerheti az Azure Machine Learning online végpontjaiban üzembe helyezett modellek adatgyűjtését.

Az Azure Machine Learning-adatgyűjtő valós idejű naplózást biztosít a bemeneti és kimeneti adatokról a felügyelt online végpontokon vagy Kubernetes online végpontokon üzembe helyezett modellekből. Az Azure Machine Learning a naplózott következtetési adatokat az Azure Blob Storage-ban tárolja. Ezek az adatok ezután zökkenőmentesen használhatók modellfigyeléshez, hibakereséshez vagy naplózáshoz, ezáltal megfigyelhetővé téve az üzembe helyezett modellek teljesítményét.

Az adatgyűjtő a következő lehetőségeket biztosítja:

Következtetési adatok naplózása központi helyre (Azure Blob Storage)
Felügyelt online végpontok és Kubernetes online végpontok támogatása
Definíció az üzembe helyezés szintjén, amely lehetővé teszi a konfiguráció maximális módosítását
A hasznos adatok és az egyéni naplózás támogatása

Naplózási módok

Az adatgyűjtő két naplózási módot biztosít: a hasznos adatok naplózását és az egyéni naplózást. A hasznos adatok naplózása lehetővé teszi a HTTP-kérések és válasz hasznos adatok gyűjtését az üzembe helyezett modellekből. Az egyéni naplózással az Azure Machine Learning egy Python SDK-t biztosít a Pandas DataFrames közvetlen naplózásához a pontozási szkriptből. Az egyéni naplózási Python SDK-val a modell bemeneti és kimeneti adatait is naplózhatja, az adatokon kívül bármilyen adatátalakítás (vagy előfeldolgozás) előtt, alatt és után is.

Adatgyűjtő konfigurációja

Az adatgyűjtő az üzembe helyezés szintjén konfigurálható, és a konfiguráció az üzembe helyezéskor van megadva. Konfigurálhatja az Azure Blob Storage-célhelyet, amely megkapja az összegyűjtött adatokat. Konfigurálhatja a mintavételezési arányt is (0–100%- ig) az adatgyűjtéshez.

Korlátozások

Az adatgyűjtőre az alábbi korlátozások vonatkoznak:

Az adatgyűjtő csak az online (vagy valós idejű) Azure Machine Learning-végpontok (felügyelt vagy Kubernetes) naplózását támogatja.
Az adatgyűjtő Python SDK csak a táblázatos adatok pandas DataFrame-en keresztüli naplózását támogatja.

Megosztás a következőn keresztül:

Adatgyűjtés éles modellekből

Naplózási módok

Adatgyűjtő konfigurációja

Korlátozások

Visszajelzés

További források

Megosztás a következőn keresztül:

Adatgyűjtés éles modellekből

Naplózási módok

Adatgyűjtő konfigurációja

Korlátozások

Kapcsolódó tartalom

Visszajelzés

További források