Az Azure AI Vision újdonságai
Az Azure AI Vision újdonságai. Ezen a lapon naprakész maradhat az új funkciókkal, fejlesztésekkel, javításokkal és dokumentációs frissítésekkel.
2025. február
Face liveness ügyféloldali SDK 1.1.0 kiadás
Liveness ügyféloldali SDK 1.1.0-s kiadás
Ez a frissítés néhány fejlesztést tartalmaz:
- Megnövelt időtúllépés a főfordulós forgatókönyv esetében, hogy a végfelhasználók több időt töltsenek a folyamat befejezéséhez.
- Az iOS- és Android SDK-k javítása a Microsoft Intune Mobile Application Management SDK-kkal kapcsolatos kompatibilitási problémák megoldásához.
- Biztonsággal kapcsolatos javítások/fejlesztések.
További információkért tekintse meg az SDK kibocsátási megjegyzéseit.
2025. január
Arcélesség-észlelés – GA
A Face liveness detection funkció már általánosan elérhető (GA).
- Kiszolgálóoldali API: Face API 1.2-es verzió
- Ügyféloldali SDK: Azure AI Vision SDK 1.0.0
Ez az SDK lehetővé teszi a fejlesztők számára, hogy az arcélesség-ellenőrzést natív mobilalkalmazásokon és webböngészős alkalmazásokon is használják identitás-ellenőrzési forgatókönyvekhez.
Az új SDK támogatja a passzív és a passzív-aktív módokat is. A hibrid Passzív-Aktív mód úgy lett kialakítva, hogy csak rossz megvilágítási körülmények között igényeljen aktív mozgást, miközben a passzív életképesség-ellenőrzés sebességét és hatékonyságát optimális megvilágításban használja.
További információkért tekintse meg az SDK kibocsátási megjegyzéseit.
Image Analysis 4.0 Preview API elavulása
2025. március 31-én a Rendszerképelemzés 4.0 előzetes verziójú API-k kivonásra kerülnek. A dátum előtt át kell telepítenie az Azure Image Analysis számítási feladatait az Image Analysis 4.0 GA API-ba.
Javasoljuk, hogy előbb végezze el az átállást, hogy olyan fejlesztésekhez férhessen hozzá, mint a multimodális beágyazás, a szinkron OCR, az emberek észlelése, a képcímkézés, az intelligens körülvágás, a felirat, a sűrű felirat és a képobjektum-észlelés. Ezek a Képelemzés 4.0 előzetes verziójú API-k 2025. március 31-én megszűnnek:
2022-07-31-preview
2022-10-12-preview
2023-02-01-preview
2023-04-01-preview
2023-07-01-preview
v4.0-preview.1
Az előzetes verziójú API-verziók kivonása után a következő funkciók már nem lesznek elérhetők, és 2025. január 10-től megszűnnek a Studio felületéről:
- Modell testreszabása
- Háttér eltávolítása
- Termékfelismerés
A modellek zökkenőmentes működésének fenntartása érdekében váltson az Azure AI Custom Visionre, amely most már általánosan elérhető. A Custom Vision a nyugdíjba vonuló funkciókhoz hasonló funkciókat kínál.
2024. augusztus
Új észlelhető Face-attribútumok
A szemüvegek, az elmosódás, az elmosódás és az expozíciós attribútumok a legújabb Detection 03 modellel érhetők el. További részletekért lásd: Arcészlelési modell megadása.
2024. május
New Face SDK 1.0.0-beta.1 (kompatibilitástörő változások)
A Face SDK az 1.0.0-beta.1 verzióban lett átírva, hogy jobban megfeleljen az Azure SDK-k irányelveinek és tervezési alapelveinek. A C#, a Python, a Java és a JavaScript a támogatott nyelvek. Első lépésként kövesse a rövid útmutatót .
2024. február
Multimodális beágyazások – GA: új többnyelvű modell
A multimodális beágyazási API frissült, és általánosan elérhető. Az új 2024-02-01
API egy új modellt tartalmaz, amely 102 nyelven támogatja a szöveges keresést. Az eredeti csak angol nyelvű modell továbbra is elérhető, de nem kombinálható az új modellel ugyanabban a keresési indexben. Ha csak angol nyelvű modellel vektorizált szöveget és képeket, ezek a vektorok nem kompatibilisek a többnyelvű szöveg- és képvektorokkal.
A támogatott nyelvek listáját a nyelvtámogatási oldalon találja.
2024. január
Új képelemzési SDK 1.0.0-beta.1 (kompatibilitástörő változások)
Az Image Analysis SDK 1.0.0-beta.1 verzióban lett újraírva, hogy jobban igazodjon más Azure SDK-khoz. Minden API megváltozott. Az új SDK használatával kapcsolatos információkért tekintse meg a frissített rövid útmutatókat, mintákat és útmutatókat .
Főbb változások:
- Az SDK mostantól az általánosan elérhető Computer Vision REST API-t (2023-10-01) hívja meg az előzetes Computer Vision REST API helyett (2023-04-01-preview).
- JavaScript-támogatás lett hozzáadva.
- A C++ már nem támogatott.
- Az egyéni modellel rendelkező képelemzés és a képszegmentálás (háttér eltávolítása) már nem támogatott az SDK-ban, mert a Computer Vision REST API (2023-10-01) még nem támogatja őket. Bármelyik funkció használatához hívja meg közvetlenül a Computer Vision REST API-t (2023-04-01-preview) (a műveletek és
Segment
aAnalyze
műveletek használatával).
2023. november
Kép elemzése 4.0 GA
Az Analyze Image 4.0 REST API mostantól általánosan elérhető. Első lépésként kövesse az Analyze Image 4.0 rövid útmutatót .
A képelemzés egyéb funkciói, például a modell testreszabása, a háttér eltávolítása és a multimodális beágyazások nyilvános előzetes verzióban maradnak.
Arc ügyféloldali SDK az élőség észleléséhez
A Face Liveness SDK támogatja az élőség észlelését a felhasználók mobil- vagy peremeszközein. Elérhető a Java/Kotlin for Android és a Swift/Objective-C for iOS rendszerben.
Az élőség-észlelési szolgáltatás megfelel az iBeta 1. és 2. szintű ISO/IEC 30107-3 szabványnak.
2023. szeptember
Elavult Computer Vision API-verziók elavulása
A Computer Vision API 1.0-s, 2.0-s, 3.0-s és 3.1-es verziói 2026. szeptember 13-án megszűnnek. A fejlesztők ezen dátum után nem tudnak API-hívásokat kezdeményezni ezekhez az API-khoz. Javasoljuk, hogy az összes érintett ügyfél a lehető leghamarabb telepítse át számítási feladatait az általánosan elérhető Computer Vision 3.2 API-ba. Az ügyfeleknek érdemes megfontolni az Image Analysis 4.0 API-ra (előzetes verzió) való migrálást is, amely a legújabb és legnagyobb képelemzési képességekkel rendelkezik.
Ha kérdése van, látogasson el a Q&A-nkba.
2023. május
Image Analysis 4.0 Termékfelismerés (nyilvános előzetes verzió)
A Termékfelismerés API-k segítségével elemezheti a kiskereskedelmi üzletek polcainak fényképeit. Észlelheti a termékek jelenlétét és hiányát, és lekérheti a határolókeret koordinátáit. A modell testreszabásával kombinálva betanítanak egy modellt az adott termékek azonosítására. A termékfelismerési eredményeket összehasonlíthatja az áruház planogram-dokumentumához is. Termékfelismerés.
2023. április
Korlátozott hozzáférési jogkivonatok
A független szoftvergyártók (ISV-k) kezelhetik ügyfeleik Face API-használatát olyan hozzáférési jogkivonatok kibocsátásával, amelyek hozzáférést biztosítanak a Face-funkciókhoz, amelyek általában kapuval vannak elzárva. Ez lehetővé teszi, hogy az ügyfélvállalatok anélkül használják a Face API-t, hogy végig kellene mennie a hivatalos jóváhagyási folyamaton. Korlátozott hozzáférési jogkivonatok használata.
2023. március
Az Azure AI Vision Image Analysis 4.0 SDK nyilvános előzetes verziója
A Firenze alapmodell most már integrálva van az Azure AI Visionbe. A továbbfejlesztett Vision-szolgáltatások lehetővé teszik a fejlesztők számára, hogy piackész, felelős Azure AI Vision-alkalmazásokat hozzanak létre különböző iparágakban. Az ügyfelek mostantól zökkenőmentesen digitalizálhatják, elemezhetik és csatlakoztathatják adataikat a természetes nyelvi interakciókhoz, hatékony megállapításokat tehetnek elérhetővé a kép- és videótartalmakból az akadálymentesség támogatásához, a keresőoptimalizáláson keresztüli beszerzéshez, a felhasználók védelméhez a káros tartalmaktól, növelhetik a biztonságot és javíthatják az incidensekre adott válaszidőket. További információ: A Microsoft Firenze alapmodelljének bejelentése.
Image Analysis 4.0 SDK (nyilvános előzetes verzió)
Az Image Analysis 4.0 mostantól elérhető az ügyfélkódtár SDK-ján keresztül C#, C++ és Python nyelven. Ez a frissítés a Firenze által működtetett képfeliratokat és az emberi paritásos teljesítményhez tartozó sűrű feliratozást is tartalmazza.
Képelemzés v4.0 feliratozás és sűrű feliratozás (nyilvános előzetes verzió):
A "Felirat" a V4.0-s verzióban a "Leírás" helyett a továbbfejlesztett képfeliratozási funkció, amely részletes és szemantikai ismeretekkel rendelkezik. A sűrű feliratok a teljes kép leírásán kívül a kép legfeljebb 10 régiójának egy mondatos leírásával nyújtanak részletesebb tájékoztatást. A sűrű feliratok a leírt képterületek határolókeret-koordinátáit is visszaadják. Egy új, nem-semleges paraméter is lehetővé teszi az ügyfelek számára, hogy eldönthessék, engedélyezik-e az alt-text és a Seeing AI-alkalmazások valószínűségi nemi következtetését. A digitális tartalmak támogatásához automatikusan biztosít részletes feliratokat, akadálymentes helyettesítő szöveget, keresőoptimalizálást és intelligens fotókontrasztot. Képfeliratok.
Videóösszegzés és képkockakereső (nyilvános előzetes verzió):
A videótartalmak keresése és használata ugyanúgy, mint a gondolkodás és az írás. Keresse meg a releváns tartalmat további metaadatok nélkül. Csak a Vision Studióban érhető el.
Image Analysis 4.0-modell testreszabása (nyilvános előzetes verzió)
Most már létrehozhatja és betanítheti saját egyéni képbesorolási és objektumészlelési modelljeit a Vision Studióval vagy a v4.0 REST API-kkal.
Multimodális beágyazási API-k (nyilvános előzetes verzió)
A Képelemzés 4.0 API részét képező multimodális beágyazási API-k lehetővé teszik a képek és szöveges lekérdezések vektorizálását . Lehetővé teszik képek és szöveg koordinátákká konvertálását többdimenziós vektortérben. A vektoros hasonlóság keresésével mostantól természetes nyelven kereshet, és releváns képeket kereshet.
Háttér eltávolítási API-k (nyilvános előzetes verzió)
A Képelemzés 4.0 API részeként a Háttér eltávolítása API lehetővé teszi a kép hátterének eltávolítását. Ez a művelet megjelenítheti az észlelt előtérobjektum képét átlátszó háttérrel, vagy egy szürkeárnyalatos alfa matt képet, amely az észlelt előtérobjektum átlátszóságát mutatja.
Az Azure AI Vision 3.0 & 3.1 előzetes verzió elavulása
Az Azure AI Vision 3.0 és 3.1 API-k előzetes verziói a tervek szerint 2023. szeptember 30-án megszűnnek. Az ügyfelek ezen a napon túl nem tudnak hívásokat kezdeményezni ezekhez az API-khoz. Az ügyfeleknek javasoljuk, hogy inkább az általánosan elérhető (GA) 3.2 API-ra migrálják a számítási feladataikat. Az előzetes verzióról a 3.2 API-ra való migráláskor kövesse az alábbi módosításokat:
- Az Analyze Image and Read API-hívások egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
- Az Analyze Image and Read API-hívások egy mezőt is visszaadnak
model-version
a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták. - Az Azure AI Vision 3.2 API más hibajelentési formátumot használ. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.
2022. október
Azure AI Vision Image Analysis 4.0 (nyilvános előzetes verzió)
Az Image Analysis 4.0 nyilvános előzetes verzióban jelent meg. Az új API tartalmazza a képfeliratozást, a képcímkézést, az objektumészlelést, az intelligens növényeket, a személyek észlelését és az OCR olvasását, mindezt egyetlen képelemzési művelettel. Az OCR általános nem dokumentumképekhez van optimalizálva egy teljesítmény-továbbfejlesztett szinkron API-ban, amely megkönnyíti az OCR-alapú szolgáltatások beágyazását a munkafolyamatokban.
Szeptember 2022.
Az Azure AI Vision 3.0/3.1 Olvasási előzetes verzió elavulása
Az Azure AI Vision 3.0 és 3.1 Read API előzetes verziói 2023. január 31-én megszűnnek. Az ügyfeleknek javasoljuk, hogy a Read API általánosan elérhető (GA) verziójának használatbavételéhez tekintse meg az útmutatókat és a rövid útmutatókat. A legújabb GA-verziók a következő előnyöket biztosítják:
- 2022 legújabb általánosan elérhető OCR-modell
- Az OCR nyelvi lefedettségének jelentős bővítése, beleértve a kézzel írt szövegek támogatását
- Továbbfejlesztett OCR-minőség
2022. június
A Vision Studio indítása
A Vision Studio egy olyan felhasználói felületi eszköz, amely lehetővé teszi az Azure AI Vision funkcióinak felfedezését, létrehozását és integrálását az alkalmazásokba.
A Vision Studio számos szolgáltatásfunkció kipróbálására kínál platformot, és vizuálisan is megtekintheti, hogy mit térnek vissza. A Studio használatával anélkül kezdheti el az első lépéseket, hogy kódokat kellene írnia, majd használhatja az alkalmazásban elérhető ügyfélkódtárakat és REST API-kat.
Felelős AI a Face-hoz
Arc áttetszőségi megjegyzése
- Az átláthatósági megjegyzés útmutatást nyújt ahhoz, hogy segítsük ügyfeleinket a rendszerek pontosságának és méltányosságának javításában azáltal, hogy értelmes emberi felülvizsgálatot vezetnek be a félrevezetési vagy egyéb hibák eseteinek észleléséhez és megoldásához, támogatást nyújtanak azoknak, akik úgy vélik, hogy eredményeik helytelenek voltak, és azonosítják és kezelik a pontosság ingadozását a működési feltételek változása miatt.
Bizalmas attribútumok kivonása
- Megszüntettük az arcelemzési képességeket, amelyek arra szolgálnak, hogy érzelmi állapotokat és identitástulajdonságokat, például nemet, kort, mosolyt, arcszőrzetet, hajat és sminket vonjanak le.
- Az arcfelismerési képességek (beleértve az elmosódást, az expozíciót, a szemüveget, az átjárót, a tájékozódási pontot, a zajt, az elzáródást, az arc határolókeretét) általánosan elérhetők maradnak, és nem igényelnek alkalmazást.
Fairlearn-csomag és a Microsoft Méltányossági irányítópultja
- A nyílt forráskódú Fairlearn csomag és a Microsoft Méltányossági irányítópultja célja, hogy támogassa az ügyfeleket a Microsoft arc-ellenőrzési algoritmusainak méltányosságának mérésében a saját adataikon, lehetővé téve számukra a különböző demográfiai csoportokra hatással lévő lehetséges méltányossági problémák azonosítását és kezelését a technológia üzembe helyezése előtt.
Korlátozott hozzáférési szabályzat
- A Face a frissített Felelős AI Standardhoz való igazításának részeként egy új korlátozott hozzáférési szabályzatot implementált a Face API-hoz és az Azure AI Visionhez. A meglévő ügyfeleknek egy évük van az arcfelismerési szolgáltatásokhoz való folyamatos hozzáférés kérelmezésére és jóváhagyására a megadott használati esetek alapján. A Face korlátozott hozzáféréséről és az Azure AI Visionről itt talál részleteket.
Az Azure AI Vision 3.2 előzetes verziójának elavulása
A 3.2 API előzetes verzióinak kivonása 2022 decemberében várható. Az ügyfeleknek javasoljuk, hogy inkább az API általánosan elérhető (GA) verzióját használják. A 3.2-verziójú verziókból való migráláskor vegye figyelembe az alábbi változásokat:
- Az Analyze Image and Read API-hívások mostantól egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
- Az Analyze Image and Read API-hívások egy mezőt is visszaadnak
model-version
a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták. - A képelemzési API-k mostantól eltérő hibajelentési formátumot használnak. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.
2022. május
Az OCR (Olvasás) API-modell általánosan elérhető (GA)
Az Azure AI Vision OCR (Read) API legújabb modellje 164 támogatott nyelvvel már általánosan elérhető felhőszolgáltatásként és -tárolóként.
- A nyomtatott szövegek OCR-támogatása 164 nyelvre terjed ki, beleértve az orosz, arab, hindi és más, cirill, arab és devanagari szkripteket használó nyelveket.
- A kézzel írt szövegek OCR-támogatása 9 nyelvre terjed ki angol, egyszerűsített kínai, francia, német, olasz, japán, koreai, portugál és spanyol nyelven.
- Az önálló karakterek, kézzel írt dátumok, összegek, nevek, egyéb, a nyugtákban és számlákban gyakran megtalálható entitások fokozott támogatása.
- A digitális PDF-dokumentumok jobb feldolgozása.
- A bemeneti fájl méretkorlátja 10x-ről 500 MB-ra nőtt.
- Teljesítmény- és késésbeli fejlesztések.
- Felhőszolgáltatásként és Docker-tárolóként érhető el.
A GA-modell használatának megismeréséhez tekintse meg az OCR útmutatóját.
február 2022.
Az OCR (Olvasás) API nyilvános előzetes verziója 164 nyelvet támogat
Az Azure AI Vision OCR (Read) API a támogatott nyelveket 164-esre bővíti a legújabb előzetes verzióval:
- A nyomtatott szövegek OCR-támogatása 42 új nyelvre terjed ki, beleértve az arab, a hindi és más arab és devanagari szkripteket használó nyelveket.
- A kézzel írt szövegek OCR-támogatása az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol mellett japán és koreai nyelvre is kiterjed.
- Fejlesztések, beleértve a kézzel írt dátumok, összegek, nevek és egykarakteű mezők kinyerését.
- Általános teljesítmény- és AI-minőségi fejlesztések
Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.
Új minőségi attribútum Detection_01 és Detection_03
- Annak érdekében, hogy a rendszerépítők és ügyfeleik kiváló minőségű képeket rögzíthessenek, amelyek a Face API kiváló minőségű kimeneteihez szükségesek, bevezetünk egy új minőségi attribútumot , a QualityForRecognitiont , amely segít eldönteni, hogy egy kép megfelelő minőségű-e az arcfelismerési kísérlethez. Az érték alacsony, közepes vagy magas nem hivatalos minősítés. Az új attribútum csak észlelési modellek vagy felismerési modellek
detection_01
recognition_03
recognition_04
vagy .detection_03
Azonosítási forgatókönyvek esetében csak "magas" minőségű képek használata ajánlott a személyregisztrációhoz, és a "közepes" fölötti minőség ajánlott. Az új minőségi attribútummal kapcsolatos további információkért tekintse meg az Arcfelismerés és -attribútumok című témakört, és ismerje meg, hogyan használható a Gyorsútmutatóval.
2021. szeptember
Az OCR (Olvasás) API nyilvános előzetes verziója 122 nyelvet támogat
Az Azure AI Vision OCR (Read) API a támogatott nyelveket 122-esre bővíti a legújabb előzetes verzióval:
- Az OCR 49 új nyelven támogatja a nyomtatott szöveget, beleértve az orosz, a bolgár és más cirill és több latin nyelvet.
- AZ OCR támogatása kézzel írt szövegekhez 6 új nyelven, amelyek közé tartozik az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol.
- Fejlesztések a digitális PDF-fájlok és a gépi olvasható zóna (MRZ) szövegének az identitásdokumentumokban való feldolgozásához.
- Általános teljesítmény- és AI-minőségi fejlesztések
Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.
2021. augusztus
Képcímkéző nyelvbővítés
Az Image tagger legújabb verziója (v3.2) mostantól 50 nyelven támogatja a címkéket. További információért tekintse meg a nyelvi támogatási oldalt.
2021. július
Új headPose és Landmarks fejlesztések Detection_03
- A Detection_03 modell frissült, hogy támogassa az arc tájékozódási pont.
- A tájékozódási pontok funkció Detection_03 sokkal pontosabb, különösen a szemgolyó tájékozódási pontok, amelyek elengedhetetlenek a tekintet nyomon követéséhez.
május 2021.
Térinformatikai tároló frissítése
A Térinformatikai tároló új verziója új funkciókészlettel lett kiadva. Ezzel a Docker-tárolóval valós idejű streamelési videót elemezhet az emberek közötti térbeli kapcsolatok és azok fizikai környezeteken keresztüli mozgásának megértéséhez.
A térinformatikai műveletek mostantól konfigurálhatók úgy, hogy észleljék az adott személy által tapasztalt tájolást.
- A paraméter konfigurálásával
enable_orientation
a tájolás-osztályozók éspersoncrossingpolygon
műveletekpersoncrossingline
engedélyezhetők. Alapértelmezés szerint ki van kapcsolva.
- A paraméter konfigurálásával
A térinformatikai műveletek mostantól konfigurálást is kínálnak az adott személy sebességének észleléséhez séta/futás közben
- Az osztályozó alapértelmezés szerint ki van kapcsolva
enable_speed
, éspersoncrossingpolygon
a műveletek sebessége észlelhetőpersoncrossingline
. A kimenet a ,avgSpeed
ésminSpeed
aspeed
kimenetekben is tükröződik.
- Az osztályozó alapértelmezés szerint ki van kapcsolva
április 2021.
Azure AI Vision v3.2 GA
Az Azure AI Vision API 3.2-es verzió már általánosan elérhető a következő frissítésekkel:
- Továbbfejlesztett képcímkézési modell: elemzi a vizualizáció tartalmát, és releváns címkéket hoz létre a képen megjelenített objektumok, műveletek és tartalmak alapján. Ez a modell a Tag Image API-val érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
- Frissített con sátormód ration modell: észleli a felnőtt tartalom jelenlétét, és jelzőket biztosít a felnőtt, a racy és a gory vizualizációs tartalmakat tartalmazó képek szűréséhez. Ez a modell az Analyze API-n keresztül érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
- Az OCR (Olvasás) 73 nyelven érhető el, beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
- Az OCR (Olvasás) disztribúciós tárolóként is elérhető a helyszíni üzembe helyezéshez.
PersonDirectory adatstruktúra (előzetes verzió)
- Az olyan arcfelismerési műveletek végrehajtásához, mint az Azonosság és a Hasonló keresése, a Face API-ügyfeleknek létre kell hozniuk a Person objektumok válogatott listáját. Az új PersonDirectory egy olyan adatstruktúra, amely egyedi azonosítókat, választható névsztringeket és opcionális felhasználói metaadat-sztringeket tartalmaz a címtárhoz hozzáadott egyes személyidentitásokhoz . A Face API jelenleg a LargePersonGroup struktúrát kínálja, amely hasonló funkcionalitással rendelkezik, de legfeljebb 1 millió identitással rendelkezik. A PersonDirectory struktúra akár 75 millió identitást is felskálázhat.
- A PersonDirectory és a korábbi adatstruktúrák közötti másik jelentős különbség az, hogy többé nem kell betanítási hívásokat kezdeményeznie, miután arcokat ad hozzá egy Személy objektumhoz – a frissítési folyamat automatikusan megtörténik. További részletekért lásd : A PersonDirectory-struktúra használata.
2021. március
Az Azure AI Vision 3.2 nyilvános előzetes verziójának frissítése
Frissült az Azure AI Vision API 3.2-es nyilvános előzetes verziója. Az előzetes kiadás tartalmazza az Összes Azure AI Vision-funkciót, valamint a frissített Olvasási és elemzési API-kat.
február 2021.
Az API 3.2-es nyilvános előzetes verziójának olvasása OCR-támogatással 73 nyelven
Az Azure AI Vision Read API 3.2-es nyilvános előzetes verziója, amely felhőszolgáltatásként és Docker-tárolóként érhető el, a következő frissítéseket tartalmazza:
- OCR 73 nyelvhez , beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
- A szövegsor kimenetének természetes olvasási sorrendje (csak latin nyelvű)
- A szövegsorok kézírásstílus-besorolása a megbízhatósági pontszámmal együtt (csak latin nyelvek esetén).
- Csak többoldalas dokumentum kijelölt lapjaihoz bontsa ki a szöveget.
- Disztribúciós tárolóként érhető el a helyszíni üzembe helyezéshez.
További információkért tekintse meg a Read API útmutatójában található útmutatót .
Új Face API-észlelési modell
- Az új Detection 03 modell a jelenleg elérhető legpontosabb észlelési modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03 észlelés javítja a visszahívást és a pontosságot a képeken található kisebb arcokon (64x64 képpont). További fejlesztések közé tartozik a hamis pozitív értékek általános csökkentése és az elforgatott arc tájolások jobb észlelése. Az Észlelés 03 és az új Recognition 04 modell kombinálásával jobb felismerési pontosságot is biztosít. További részletekért lásd: Arcészlelési modell megadása.
Új észlelhető Face-attribútumok
- Az
faceMask
attribútum a legújabb Detection 03 modellel érhető el, valamint a hozzáadott attribútummal"noseAndMouthCovered"
, amely azt észleli, hogy az arcmaszk a kívánt módon van-e viselve, az orrra és a szájra is kiterjed. A legújabb maszkészlelési képesség használatához a felhasználóknak meg kell adniuk az észlelési modellt az API-kérelemben: rendelje hozzá a modell verzióját az detectionModel paraméterreldetection_03
. További részletekért lásd: Arcészlelési modell megadása.
Új Face API-felismerési modell
- Az új Recognition 04 modell a jelenleg elérhető legpontosabb felismerési modell. Ha Ön új ügyfél, javasoljuk, hogy ezt a modellt használja ellenőrzésre és azonosításra. Javítja a Recognition 03 pontosságát, beleértve az arcfedőt viselő felhasználók (sebészeti maszkok, N95 maszkok, ruhamaszkok) jobb felismerését is. Javasoljuk, hogy ne regisztrálja az arcfedőt viselő felhasználók képeit, mivel ez csökkenti a felismerés minőségét. Mostantól az ügyfelek biztonságos és zökkenőmentes felhasználói élményeket hozhatnak létre, amelyek észlelik, hogy a felhasználó arcvédőt visel-e a legújabb Detection 03 modellel, és felismerheti őket a legújabb Recognition 04 modellel. További részletekért lásd: Arcfelismerési modell megadása.
Január 2021.
Térinformatikai tároló frissítése
A Térinformatikai tároló új verziója új funkciókészlettel lett kiadva. Ezzel a Docker-tárolóval valós idejű streamelési videót elemezhet az emberek közötti térbeli kapcsolatok és azok fizikai környezeteken keresztüli mozgásának megértéséhez.
-
A térinformatikai műveletek mostantól úgy konfigurálhatók, hogy észleljék, ha egy személy védő arcot, például maszkot visel.
- A paraméter konfigurálásával egy maszkosztályozó engedélyezhető a
personcount
,personcrossingline
éspersoncrossingpolygon
aENABLE_FACE_MASK_CLASSIFIER
műveletek számára. - Az attribútumok
face_mask
, ésface_noMask
a rendszer a videóstreamben észlelt minden személy megbízhatósági pontszámával rendelkező metaadatként adja vissza
- A paraméter konfigurálásával egy maszkosztályozó engedélyezhető a
- A personcrossingpolygon művelet ki lett terjesztve, hogy lehetővé tegye az adott személy által a zónában töltött tartózkodási idő kiszámítását. A művelet zónakonfigurációjában beállíthatja a
type
paramétert, és egy personZoneDwellTimeEvent típusú új esemény tartalmazza adurationMs
zónában töltött ezredmásodperc számával kitöltött mezőt.zonedwelltime
- Kompatibilitástörő változás: A personZoneEvent eseményt átnevezték personZoneEnterExitEvent eseményre. Ezt az eseményt a personcrossingpolygon művelet aktiválja, amikor egy személy belép a zónába, vagy kilép a zónából, és irányadatokat biztosít a átlépett zóna számozott oldalával.
- A videó URL-címe "Private Parameter/obfuscated" (Privát paraméter/obfuscated) néven is megadható minden műveletben. Az elfedés most már nem kötelező, és csak akkor működik, ha
KEY
környezetiIV
változóként van megadva. - A kalibrálás alapértelmezés szerint engedélyezve van minden műveletnél. Állítsa be a
do_calibration: false
letiltásához. - Az automatikus újraszámítás (alapértelmezés szerint letiltva) támogatása a paraméteren keresztül, a részletekért tekintse meg a
enable_recalibration
térinformatikai műveleteket . - A kamera kalibrációs paraméterei a
DETECTOR_NODE_CONFIG
. Részletekért tekintse meg a térinformatikai műveleteket .
Késés csökkentése
- A Face csapata közzétett egy új cikket, amely ismerteti a késés lehetséges okait a szolgáltatás használatakor és a lehetséges kockázatcsökkentési stratégiákat. Lásd: Késés csökkentése a Face szolgáltatás használatakor.
2020. december
Ügyfélkonfiguráció a Face ID Storage-hoz
- Bár a Face Service nem tárolja az ügyfélképeket, a kinyert arcfunkció(ka)t a rendszer a kiszolgálón tárolja. A Face ID az arcfunkció azonosítója, és a Face – Azonosítás, Arc – Ellenőrzés és Arc – Hasonló keresés funkcióban lesz használva. A tárolt arcfunkciók az eredeti észlelési hívás után 24 órával lejárnak és törlődnek. Az ügyfelek most már meg tudják határozni, hogy mennyi ideig legyenek gyorsítótárazva ezek a Face-azonosítók. A maximális érték még mindig legfeljebb 24 óra, de most már megadható egy minimum 60 másodperces érték. A gyorsítótárazott Arcazonosítók új időtartományai bármilyen 60 másodperc és 24 óra közötti érték. További részleteket a Face – Detect API-referencia (a faceIdTimeToLive paraméter) tartalmaz.
2020. november
Minta arcregisztrációs alkalmazás
- A csapat közzétett egy minta Face-regisztrációs alkalmazást, amely bemutatja azokat az ajánlott eljárásokat, amelyekkel értelmes hozzájárulást hozhat létre, és magas pontosságú arcfelismerő rendszereket hozhat létre kiváló minőségű regisztrációkon keresztül. A nyílt forráskódú minta a regisztrációs alkalmazás összeállítása útmutatóban és a GitHubon található, amely készen áll a fejlesztők üzembe helyezésére vagy testreszabására.
Október 2020.
Azure AI Vision API v3.1 GA
Az Általános rendelkezésre állású Azure AI Vision API-t frissítették a 3.1-es verzióra.
2020. szeptember
Térinformatikai tároló előzetes verziója
A Térinformatikai tároló előzetes verzióban érhető el. Az Azure AI Vision térinformatikai funkciója lehetővé teszi a valós idejű streamelési videó elemzését, hogy megértse az emberek közötti térbeli kapcsolatokat és azok fizikai környezeteken keresztüli mozgását. A térinformatikai elemzés egy helyszíni Docker-tároló.
A Read API 3.1 nyilvános előzetes verziója ocR-t ad hozzá japánhoz
Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója a következő képességeket adja hozzá:
OCR japán nyelvhez
Az egyes szövegsorok esetében adja meg, hogy a megjelenés kézírásos vagy nyomtatási stílus-e, valamint egy megbízhatósági pontszámot (csak latin nyelvű).
Többoldalas dokumentum esetén csak a kijelölt oldalak vagy oldaltartományok szövegének kinyerése.
A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, japán, portugál, egyszerűsített kínai és spanyol nyelveket.
További információkért tekintse meg a Read API útmutatójában található útmutatót .
2020. augusztus
Inaktív adatok ügyfél által felügyelt titkosítása
- A Face szolgáltatás automatikusan titkosítja az adatokat a felhőben való megőrzésekor. A Face szolgáltatás titkosítása védi az adatokat, hogy megfeleljen a szervezeti biztonsági és megfelelőségi követelményeknek. Alapértelmezés szerint az előfizetés a Microsoft által felügyelt titkosítási kulcsokat használja. Az előfizetést saját, ügyfél által felügyelt kulcsokkal (CMK) is kezelheti. További részletek az ügyfél által felügyelt kulcsok között találhatók.
2020. július
Az API 3.1-es nyilvános előzetes verziójának olvasása az egyszerűsített kínai OCR-vel
Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója támogatja az egyszerűsített kínai nyelvet.
- A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, portugál, egyszerűsített kínai és spanyol nyelveket.
További információkért tekintse meg a Read API útmutatójában található útmutatót .
május 2020.
Az Azure AI Vision API 3.0-s verziójú általános rendelkezésre állása a Read API frissítéseivel történt:
- Angol, holland, francia, német, olasz, portugál és spanyol támogatás
- Nagyobb pontosság
- Megbízhatósági pontszám minden kinyert szóhoz
- Új kimeneti formátum
További információért tekintse meg az OCR áttekintését .
április 2020.
Új Face API-felismerési modell
- Az új recognition 03 modell a jelenleg elérhető legpontosabb modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03-ás felismerés jobb pontosságot biztosít a hasonlóság-összehasonlításokhoz és a személyegyeztetési összehasonlításokhoz. További részleteket az Arcfelismerési modell megadása című témakörben talál.
2020. március
- A TLS 1.2 mostantól a szolgáltatásnak küldött összes HTTP-kéréshez érvényes. További információ: Azure AI-szolgáltatások biztonsága.
Január 2020.
Az API 3.0 nyilvános előzetes verziójának olvasása
Mostantól a Read API 3.0-s verziójával nyomtatott vagy kézzel írt szöveget nyerhet ki képekből. A korábbi verziókhoz képest a 3.0 a következőt biztosítja:
- Nagyobb pontosság
- Új kimeneti formátum
- Megbízhatósági pontszám minden kinyert szóhoz
- Spanyol és angol nyelv támogatása a nyelvi paraméterrel
Kövesse a Szöveg kinyerése rövid útmutatót a 3.0 API használatának megkezdéséhez.
június 2019.
Új Face API-észlelési modell
- Az új Detection 02 modell jobb pontosságot biztosít a kis, oldalnézetű, elhomályosított és homályos arcokon. Használja a Face - Detect, FaceList - Add Face, LargeFaceList - Add Face, PersonGroup Person - Add Face and LargePersonGroup Person - Add Face and LargePersonGroup Person – Add Face by specifying the new face detection model name
detection_02
indetectionModel
parameter. További részletek az észlelési modell megadásáról.
április 2019.
Továbbfejlesztett attribútumpontosság
- Az és az
age
headPose
attribútumok általános pontossága javult. AzheadPose
attribútum az engedélyezett értékkel is frissülpitch
. Ezeket az attribútumokat a Face – DetectreturnFaceAttributes
paraméter paraméterébenreturnFaceAttributes
adhatja meg.
Továbbfejlesztett feldolgozási sebesség
- Az Arc – Észlelés, FaceList – Arc hozzáadása, LargeFaceList – Arc hozzáadása, PersonGroup person – Face és LargePersonGroup person hozzáadása – Arcműveletekhozzáadása.
2019. március
Új Face API-felismerési modell
- A Recognition 02 modell pontossága javult. Használja a Face – Detect, FaceList – Create, LargeFaceList – Create, PersonGroup – Create és LargePersonGroup – Create és LargePersonGroup használatával – Létrehozás az új arcfelismerési modell nevének
recognition_02
paraméterbenrecognitionModel
való megadásával. További részletek a felismerési modell megadásáról.
Január 2019.
Face Snapshot funkció
- Ez a funkció lehetővé teszi, hogy a szolgáltatás támogassa az előfizetések közötti adatmigrálást: Pillanatkép.
Fontos
2023. június 30-tól megszűnik a Face Snapshot API.
október 2018.
API-üzenetek
- A PersonGroup - Betanítási állapot lekérése, a LargePersonGroup – Betanítási állapot és a LargeFaceList pontosított leírása
lastSuccessfulTrainingDateTime
status
createdDateTime
lastActionDateTime
– Betanítási állapot lekérése.
2018. május
Továbbfejlesztett attribútumpontosság
- Jelentősen továbbfejlesztett
gender
attribútumok, valamint továbbfejlesztettage
,glasses
,facialHair
,hair
attribútumokmakeup
. Használja őket a Face - DetectreturnFaceAttributes
paraméteren keresztül.
Fájlméretkorlát növelése
- A bemeneti képfájl méretkorlátjának növelése 4 MB-ról 6 MB-ra a Face alkalmazásban – Észlelés, FaceList – Arc hozzáadása, LargeFaceList – Arc hozzáadása, PersonGroup person – Face és LargePersonGroup személy hozzáadása – Arc hozzáadása.
2018. március
Új adatstruktúra
- LargeFaceList és LargePersonGroup. További részletek a skálázásról a regisztrált felhasználók további kezelése érdekében.
- Fokozott arc – Az [1, 5] és az [1, 100] közötti paraméter azonosítása
maxNumOfCandidatesReturned
, alapértelmezett értéke pedig 10.
2017. május
Új észlelhető Face-attribútumok
- Hozzáadva
hair
,makeup
,accessory
,occlusion
,blur
, , ,exposure
ésnoise
attribútumok a Face - DetectreturnFaceAttributes
paraméterben. - Támogatott 10 000 személy a PersonGroup és a Face - Identify alkalmazásban.
- Támogatott lapozás a PersonGroup Person alkalmazásban – Választható paraméterekkel rendelkező lista :
start
éstop
. - Támogatott egyidejűség az arcok hozzáadásához/törléséhez a PersonGroup különböző FaceLists és különböző személyei ellen.
2017. március
Új észlelhető Face-attribútum
- Attribútum hozzáadva
emotion
a Face - DetectreturnFaceAttributes
paraméterben.
Megoldott problémák
- Az arcot nem sikerült újra észlelni a Face -Detect as in FaceList – Add Face and PersonGroup Person – Add Face ( Face and PersonGroup Person - Add Face) (Arc hozzáadása) nevű téglalaptal.
targetFace
- Az észlelhető arcméret úgy van beállítva, hogy szigorúan 36x36 és 4096x4096 képpont között legyen.
2016. november
Új előfizetési szint
- A Face Storage Standard-előfizetéssel további tartós arcokat tárolhat a PersonGroup Person használata során – Arc vagy FaceList hozzáadása – Arc hozzáadása azonosításhoz vagy hasonlóság-egyeztetéshez. A tárolt képek díja 1000 arconként 0,5 dollár és a díjszabás napi lebontású. Az ingyenes szintű előfizetések továbbra is 1000 főre korlátozódnak.
2016. október
API-üzenetek
- A FaceList – Arc és személycsoport hozzáadása – Arc hozzáadása – Arc hozzáadása lehetőségnél a "Több arc van a képen" szövegről a "Több arc van a képen" szövegre módosította a hibaüzenetet
targetFace
.
2016. július
Új funkciók
- Támogatott személyközi objektumhitelesítés a Face alkalmazásban – Ellenőrzés.
- Nem kötelező
mode
paraméter hozzáadva, amely lehetővé teszi két munkamód kiválasztását:matchPerson
amatchFace
Face - Find Similar (Hasonló keresése) és az alapértelmezett (matchPerson
Hasonló keresése) beállításban. - Opcionális
confidenceThreshold
paraméter hozzáadva a felhasználóhoz annak beállításához, hogy az egyik arc egy Személy objektumhoz tartozik-e a Face – Identify fájlban. - Választható és
top
paraméterek hozzáadvastart
a PersonGroup - List elemhez, hogy a felhasználó meg tudja adni a kezdőpontot és a listához tartozó teljes PersonGroups-számot.
1.0-s verzió változásai a V0-ről
- Frissített szolgáltatásgyökér végpontja a helyről
https://westus.api.cognitive.microsoft.com/face/v0/
a .https://westus.api.cognitive.microsoft.com/face/v1.0/
A következőre alkalmazott módosítások: Face – Detect, Face – Identify, Face – Find Similar and Face – Group. - A minimálisan észlelhető arcméret 36x36 képpontra frissült. A 36x36 képpontnál kisebb arcok nem lesznek észlelhetők.
- A PersonGroup és a Person adatok elavultak a Face V0-ben. Ezek az adatok nem érhetők el a Face V1.0 szolgáltatással.
- 2016. június 30-án elavult a Face API V0-végpontja.