Az Azure AI Vision újdonságai

Cikk
10/16/2024

Az Azure AI Vision újdonságai. Ezen a lapon naprakész maradhat az új funkciókkal, fejlesztésekkel, javításokkal és dokumentációs frissítésekkel.

2025. február

Face liveness ügyféloldali SDK 1.1.0 kiadás

Liveness ügyféloldali SDK 1.1.0-s kiadás

Ez a frissítés néhány fejlesztést tartalmaz:

Megnövelt időtúllépés a főfordulós forgatókönyv esetében, hogy a végfelhasználók több időt töltsenek a folyamat befejezéséhez.
Az iOS- és Android SDK-k javítása a Microsoft Intune Mobile Application Management SDK-kkal kapcsolatos kompatibilitási problémák megoldásához.
Biztonsággal kapcsolatos javítások/fejlesztések.

További információkért tekintse meg az SDK kibocsátási megjegyzéseit.

2025. január

Arcélesség-észlelés – GA

A Face liveness detection funkció már általánosan elérhető (GA).

Kiszolgálóoldali API: Face API 1.2-es verzió
Ügyféloldali SDK: Azure AI Vision SDK 1.0.0

Ez az SDK lehetővé teszi a fejlesztők számára, hogy az arcélesség-ellenőrzést natív mobilalkalmazásokon és webböngészős alkalmazásokon is használják identitás-ellenőrzési forgatókönyvekhez.

Az új SDK támogatja a passzív és a passzív-aktív módokat is. A hibrid Passzív-Aktív mód úgy lett kialakítva, hogy csak rossz megvilágítási körülmények között igényeljen aktív mozgást, miközben a passzív életképesség-ellenőrzés sebességét és hatékonyságát optimális megvilágításban használja.

További információkért tekintse meg az SDK kibocsátási megjegyzéseit.

Image Analysis 4.0 Preview API elavulása

2025. március 31-én a Rendszerképelemzés 4.0 előzetes verziójú API-k kivonásra kerülnek. A dátum előtt át kell telepítenie az Azure Image Analysis számítási feladatait az Image Analysis 4.0 GA API-ba.

Javasoljuk, hogy előbb végezze el az átállást, hogy olyan fejlesztésekhez férhessen hozzá, mint a multimodális beágyazás, a szinkron OCR, az emberek észlelése, a képcímkézés, az intelligens körülvágás, a felirat, a sűrű felirat és a képobjektum-észlelés. Ezek a Képelemzés 4.0 előzetes verziójú API-k 2025. március 31-én megszűnnek:

2022-07-31-preview
2022-10-12-preview
2023-02-01-preview
2023-04-01-preview
2023-07-01-preview
v4.0-preview.1

Az előzetes verziójú API-verziók kivonása után a következő funkciók már nem lesznek elérhetők, és 2025. január 10-től megszűnnek a Studio felületéről:

Modell testreszabása
Háttér eltávolítása
Termékfelismerés

A modellek zökkenőmentes működésének fenntartása érdekében váltson az Azure AI Custom Visionre, amely most már általánosan elérhető. A Custom Vision a nyugdíjba vonuló funkciókhoz hasonló funkciókat kínál.

2024. augusztus

Új észlelhető Face-attribútumok

A szemüvegek, az elmosódás, az elmosódás és az expozíciós attribútumok a legújabb Detection 03 modellel érhetők el. További részletekért lásd: Arcészlelési modell megadása.

2024. május

New Face SDK 1.0.0-beta.1 (kompatibilitástörő változások)

A Face SDK az 1.0.0-beta.1 verzióban lett átírva, hogy jobban megfeleljen az Azure SDK-k irányelveinek és tervezési alapelveinek. A C#, a Python, a Java és a JavaScript a támogatott nyelvek. Első lépésként kövesse a rövid útmutatót .

2024. február

Multimodális beágyazások – GA: új többnyelvű modell

A multimodális beágyazási API frissült, és általánosan elérhető. Az új 2024-02-01 API egy új modellt tartalmaz, amely 102 nyelven támogatja a szöveges keresést. Az eredeti csak angol nyelvű modell továbbra is elérhető, de nem kombinálható az új modellel ugyanabban a keresési indexben. Ha csak angol nyelvű modellel vektorizált szöveget és képeket, ezek a vektorok nem kompatibilisek a többnyelvű szöveg- és képvektorokkal.

A támogatott nyelvek listáját a nyelvtámogatási oldalon találja.

2024. január

Új képelemzési SDK 1.0.0-beta.1 (kompatibilitástörő változások)

Az Image Analysis SDK 1.0.0-beta.1 verzióban lett újraírva, hogy jobban igazodjon más Azure SDK-khoz. Minden API megváltozott. Az új SDK használatával kapcsolatos információkért tekintse meg a frissített rövid útmutatókat, mintákat és útmutatókat .

Főbb változások:

Az SDK mostantól az általánosan elérhető Computer Vision REST API-t (2023-10-01) hívja meg az előzetes Computer Vision REST API helyett (2023-04-01-preview).
JavaScript-támogatás lett hozzáadva.
A C++ már nem támogatott.
Az egyéni modellel rendelkező képelemzés és a képszegmentálás (háttér eltávolítása) már nem támogatott az SDK-ban, mert a Computer Vision REST API (2023-10-01) még nem támogatja őket. Bármelyik funkció használatához hívja meg közvetlenül a Computer Vision REST API-t (2023-04-01-preview) (a műveletek és Segment a Analyze műveletek használatával).

2023. november

Kép elemzése 4.0 GA

Az Analyze Image 4.0 REST API mostantól általánosan elérhető. Első lépésként kövesse az Analyze Image 4.0 rövid útmutatót .

A képelemzés egyéb funkciói, például a modell testreszabása, a háttér eltávolítása és a multimodális beágyazások nyilvános előzetes verzióban maradnak.

Arc ügyféloldali SDK az élőség észleléséhez

A Face Liveness SDK támogatja az élőség észlelését a felhasználók mobil- vagy peremeszközein. Elérhető a Java/Kotlin for Android és a Swift/Objective-C for iOS rendszerben.

Az élőség-észlelési szolgáltatás megfelel az iBeta 1. és 2. szintű ISO/IEC 30107-3 szabványnak.

2023. szeptember

Elavult Computer Vision API-verziók elavulása

A Computer Vision API 1.0-s, 2.0-s, 3.0-s és 3.1-es verziói 2026. szeptember 13-án megszűnnek. A fejlesztők ezen dátum után nem tudnak API-hívásokat kezdeményezni ezekhez az API-khoz. Javasoljuk, hogy az összes érintett ügyfél a lehető leghamarabb telepítse át számítási feladatait az általánosan elérhető Computer Vision 3.2 API-ba. Az ügyfeleknek érdemes megfontolni az Image Analysis 4.0 API-ra (előzetes verzió) való migrálást is, amely a legújabb és legnagyobb képelemzési képességekkel rendelkezik.

Ha kérdése van, látogasson el a Q&A-nkba.

2023. május

Image Analysis 4.0 Termékfelismerés (nyilvános előzetes verzió)

A Termékfelismerés API-k segítségével elemezheti a kiskereskedelmi üzletek polcainak fényképeit. Észlelheti a termékek jelenlétét és hiányát, és lekérheti a határolókeret koordinátáit. A modell testreszabásával kombinálva betanítanak egy modellt az adott termékek azonosítására. A termékfelismerési eredményeket összehasonlíthatja az áruház planogram-dokumentumához is. Termékfelismerés.

2023. április

Korlátozott hozzáférési jogkivonatok

A független szoftvergyártók (ISV-k) kezelhetik ügyfeleik Face API-használatát olyan hozzáférési jogkivonatok kibocsátásával, amelyek hozzáférést biztosítanak a Face-funkciókhoz, amelyek általában kapuval vannak elzárva. Ez lehetővé teszi, hogy az ügyfélvállalatok anélkül használják a Face API-t, hogy végig kellene mennie a hivatalos jóváhagyási folyamaton. Korlátozott hozzáférési jogkivonatok használata.

2023. március

Az Azure AI Vision Image Analysis 4.0 SDK nyilvános előzetes verziója

A Firenze alapmodell most már integrálva van az Azure AI Visionbe. A továbbfejlesztett Vision-szolgáltatások lehetővé teszik a fejlesztők számára, hogy piackész, felelős Azure AI Vision-alkalmazásokat hozzanak létre különböző iparágakban. Az ügyfelek mostantól zökkenőmentesen digitalizálhatják, elemezhetik és csatlakoztathatják adataikat a természetes nyelvi interakciókhoz, hatékony megállapításokat tehetnek elérhetővé a kép- és videótartalmakból az akadálymentesség támogatásához, a keresőoptimalizáláson keresztüli beszerzéshez, a felhasználók védelméhez a káros tartalmaktól, növelhetik a biztonságot és javíthatják az incidensekre adott válaszidőket. További információ: A Microsoft Firenze alapmodelljének bejelentése.

Image Analysis 4.0 SDK (nyilvános előzetes verzió)

Az Image Analysis 4.0 mostantól elérhető az ügyfélkódtár SDK-ján keresztül C#, C++ és Python nyelven. Ez a frissítés a Firenze által működtetett képfeliratokat és az emberi paritásos teljesítményhez tartozó sűrű feliratozást is tartalmazza.

Képelemzés v4.0 feliratozás és sűrű feliratozás (nyilvános előzetes verzió):

A "Felirat" a V4.0-s verzióban a "Leírás" helyett a továbbfejlesztett képfeliratozási funkció, amely részletes és szemantikai ismeretekkel rendelkezik. A sűrű feliratok a teljes kép leírásán kívül a kép legfeljebb 10 régiójának egy mondatos leírásával nyújtanak részletesebb tájékoztatást. A sűrű feliratok a leírt képterületek határolókeret-koordinátáit is visszaadják. Egy új, nem-semleges paraméter is lehetővé teszi az ügyfelek számára, hogy eldönthessék, engedélyezik-e az alt-text és a Seeing AI-alkalmazások valószínűségi nemi következtetését. A digitális tartalmak támogatásához automatikusan biztosít részletes feliratokat, akadálymentes helyettesítő szöveget, keresőoptimalizálást és intelligens fotókontrasztot. Képfeliratok.

Videóösszegzés és képkockakereső (nyilvános előzetes verzió):

A videótartalmak keresése és használata ugyanúgy, mint a gondolkodás és az írás. Keresse meg a releváns tartalmat további metaadatok nélkül. Csak a Vision Studióban érhető el.

Image Analysis 4.0-modell testreszabása (nyilvános előzetes verzió)

Most már létrehozhatja és betanítheti saját egyéni képbesorolási és objektumészlelési modelljeit a Vision Studióval vagy a v4.0 REST API-kkal.

Multimodális beágyazási API-k (nyilvános előzetes verzió)

A Képelemzés 4.0 API részét képező multimodális beágyazási API-k lehetővé teszik a képek és szöveges lekérdezések vektorizálását . Lehetővé teszik képek és szöveg koordinátákká konvertálását többdimenziós vektortérben. A vektoros hasonlóság keresésével mostantól természetes nyelven kereshet, és releváns képeket kereshet.

Háttér eltávolítási API-k (nyilvános előzetes verzió)

A Képelemzés 4.0 API részeként a Háttér eltávolítása API lehetővé teszi a kép hátterének eltávolítását. Ez a művelet megjelenítheti az észlelt előtérobjektum képét átlátszó háttérrel, vagy egy szürkeárnyalatos alfa matt képet, amely az észlelt előtérobjektum átlátszóságát mutatja.

Az Azure AI Vision 3.0 & 3.1 előzetes verzió elavulása

Az Azure AI Vision 3.0 és 3.1 API-k előzetes verziói a tervek szerint 2023. szeptember 30-án megszűnnek. Az ügyfelek ezen a napon túl nem tudnak hívásokat kezdeményezni ezekhez az API-khoz. Az ügyfeleknek javasoljuk, hogy inkább az általánosan elérhető (GA) 3.2 API-ra migrálják a számítási feladataikat. Az előzetes verzióról a 3.2 API-ra való migráláskor kövesse az alábbi módosításokat:

Az Analyze Image and Read API-hívások egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
Az Analyze Image and Read API-hívások egy mezőt is visszaadnak model-version a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták.
Az Azure AI Vision 3.2 API más hibajelentési formátumot használ. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.

2022. október

Azure AI Vision Image Analysis 4.0 (nyilvános előzetes verzió)

Az Image Analysis 4.0 nyilvános előzetes verzióban jelent meg. Az új API tartalmazza a képfeliratozást, a képcímkézést, az objektumészlelést, az intelligens növényeket, a személyek észlelését és az OCR olvasását, mindezt egyetlen képelemzési művelettel. Az OCR általános nem dokumentumképekhez van optimalizálva egy teljesítmény-továbbfejlesztett szinkron API-ban, amely megkönnyíti az OCR-alapú szolgáltatások beágyazását a munkafolyamatokban.

Szeptember 2022.

Az Azure AI Vision 3.0/3.1 Olvasási előzetes verzió elavulása

Az Azure AI Vision 3.0 és 3.1 Read API előzetes verziói 2023. január 31-én megszűnnek. Az ügyfeleknek javasoljuk, hogy a Read API általánosan elérhető (GA) verziójának használatbavételéhez tekintse meg az útmutatókat és a rövid útmutatókat. A legújabb GA-verziók a következő előnyöket biztosítják:

2022 legújabb általánosan elérhető OCR-modell
Az OCR nyelvi lefedettségének jelentős bővítése, beleértve a kézzel írt szövegek támogatását
Továbbfejlesztett OCR-minőség

2022. június

A Vision Studio indítása

A Vision Studio egy olyan felhasználói felületi eszköz, amely lehetővé teszi az Azure AI Vision funkcióinak felfedezését, létrehozását és integrálását az alkalmazásokba.

A Vision Studio számos szolgáltatásfunkció kipróbálására kínál platformot, és vizuálisan is megtekintheti, hogy mit térnek vissza. A Studio használatával anélkül kezdheti el az első lépéseket, hogy kódokat kellene írnia, majd használhatja az alkalmazásban elérhető ügyfélkódtárakat és REST API-kat.

Felelős AI a Face-hoz

Arc áttetszőségi megjegyzése

Az átláthatósági megjegyzés útmutatást nyújt ahhoz, hogy segítsük ügyfeleinket a rendszerek pontosságának és méltányosságának javításában azáltal, hogy értelmes emberi felülvizsgálatot vezetnek be a félrevezetési vagy egyéb hibák eseteinek észleléséhez és megoldásához, támogatást nyújtanak azoknak, akik úgy vélik, hogy eredményeik helytelenek voltak, és azonosítják és kezelik a pontosság ingadozását a működési feltételek változása miatt.

Bizalmas attribútumok kivonása

Megszüntettük az arcelemzési képességeket, amelyek arra szolgálnak, hogy érzelmi állapotokat és identitástulajdonságokat, például nemet, kort, mosolyt, arcszőrzetet, hajat és sminket vonjanak le.
Az arcfelismerési képességek (beleértve az elmosódást, az expozíciót, a szemüveget, az átjárót, a tájékozódási pontot, a zajt, az elzáródást, az arc határolókeretét) általánosan elérhetők maradnak, és nem igényelnek alkalmazást.

Fairlearn-csomag és a Microsoft Méltányossági irányítópultja

A nyílt forráskódú Fairlearn csomag és a Microsoft Méltányossági irányítópultja célja, hogy támogassa az ügyfeleket a Microsoft arc-ellenőrzési algoritmusainak méltányosságának mérésében a saját adataikon, lehetővé téve számukra a különböző demográfiai csoportokra hatással lévő lehetséges méltányossági problémák azonosítását és kezelését a technológia üzembe helyezése előtt.

Korlátozott hozzáférési szabályzat

A Face a frissített Felelős AI Standardhoz való igazításának részeként egy új korlátozott hozzáférési szabályzatot implementált a Face API-hoz és az Azure AI Visionhez. A meglévő ügyfeleknek egy évük van az arcfelismerési szolgáltatásokhoz való folyamatos hozzáférés kérelmezésére és jóváhagyására a megadott használati esetek alapján. A Face korlátozott hozzáféréséről és az Azure AI Visionről itt talál részleteket.

Az Azure AI Vision 3.2 előzetes verziójának elavulása

A 3.2 API előzetes verzióinak kivonása 2022 decemberében várható. Az ügyfeleknek javasoljuk, hogy inkább az API általánosan elérhető (GA) verzióját használják. A 3.2-verziójú verziókból való migráláskor vegye figyelembe az alábbi változásokat:

Az Analyze Image and Read API-hívások mostantól egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
Az Analyze Image and Read API-hívások egy mezőt is visszaadnak model-version a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták.
A képelemzési API-k mostantól eltérő hibajelentési formátumot használnak. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.

2022. május

Az OCR (Olvasás) API-modell általánosan elérhető (GA)

Az Azure AI Vision OCR (Read) API legújabb modellje 164 támogatott nyelvvel már általánosan elérhető felhőszolgáltatásként és -tárolóként.

A nyomtatott szövegek OCR-támogatása 164 nyelvre terjed ki, beleértve az orosz, arab, hindi és más, cirill, arab és devanagari szkripteket használó nyelveket.
A kézzel írt szövegek OCR-támogatása 9 nyelvre terjed ki angol, egyszerűsített kínai, francia, német, olasz, japán, koreai, portugál és spanyol nyelven.
Az önálló karakterek, kézzel írt dátumok, összegek, nevek, egyéb, a nyugtákban és számlákban gyakran megtalálható entitások fokozott támogatása.
A digitális PDF-dokumentumok jobb feldolgozása.
A bemeneti fájl méretkorlátja 10x-ről 500 MB-ra nőtt.
Teljesítmény- és késésbeli fejlesztések.
Felhőszolgáltatásként és Docker-tárolóként érhető el.

A GA-modell használatának megismeréséhez tekintse meg az OCR útmutatóját.

A Read API használatának első lépései

február 2022.

Az OCR (Olvasás) API nyilvános előzetes verziója 164 nyelvet támogat

Az Azure AI Vision OCR (Read) API a támogatott nyelveket 164-esre bővíti a legújabb előzetes verzióval:

A nyomtatott szövegek OCR-támogatása 42 új nyelvre terjed ki, beleértve az arab, a hindi és más arab és devanagari szkripteket használó nyelveket.
A kézzel írt szövegek OCR-támogatása az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol mellett japán és koreai nyelvre is kiterjed.
Fejlesztések, beleértve a kézzel írt dátumok, összegek, nevek és egykarakteű mezők kinyerését.
Általános teljesítmény- és AI-minőségi fejlesztések

Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.

A Read API használatának első lépései

Új minőségi attribútum Detection_01 és Detection_03

Annak érdekében, hogy a rendszerépítők és ügyfeleik kiváló minőségű képeket rögzíthessenek, amelyek a Face API kiváló minőségű kimeneteihez szükségesek, bevezetünk egy új minőségi attribútumot , a QualityForRecognitiont , amely segít eldönteni, hogy egy kép megfelelő minőségű-e az arcfelismerési kísérlethez. Az érték alacsony, közepes vagy magas nem hivatalos minősítés. Az új attribútum csak észlelési modellek vagy felismerési modellek detection_01recognition_03recognition_04vagy .detection_03 Azonosítási forgatókönyvek esetében csak "magas" minőségű képek használata ajánlott a személyregisztrációhoz, és a "közepes" fölötti minőség ajánlott. Az új minőségi attribútummal kapcsolatos további információkért tekintse meg az Arcfelismerés és -attribútumok című témakört, és ismerje meg, hogyan használható a Gyorsútmutatóval.

2021. szeptember

Az OCR (Olvasás) API nyilvános előzetes verziója 122 nyelvet támogat

Az Azure AI Vision OCR (Read) API a támogatott nyelveket 122-esre bővíti a legújabb előzetes verzióval:

Az OCR 49 új nyelven támogatja a nyomtatott szöveget, beleértve az orosz, a bolgár és más cirill és több latin nyelvet.
AZ OCR támogatása kézzel írt szövegekhez 6 új nyelven, amelyek közé tartozik az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol.
Fejlesztések a digitális PDF-fájlok és a gépi olvasható zóna (MRZ) szövegének az identitásdokumentumokban való feldolgozásához.
Általános teljesítmény- és AI-minőségi fejlesztések

Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.

A Read API használatának első lépései

2021. augusztus

Képcímkéző nyelvbővítés

Az Image tagger legújabb verziója (v3.2) mostantól 50 nyelven támogatja a címkéket. További információért tekintse meg a nyelvi támogatási oldalt.

2021. július

Új headPose és Landmarks fejlesztések Detection_03

A Detection_03 modell frissült, hogy támogassa az arc tájékozódási pont.
A tájékozódási pontok funkció Detection_03 sokkal pontosabb, különösen a szemgolyó tájékozódási pontok, amelyek elengedhetetlenek a tekintet nyomon követéséhez.

május 2021.

Térinformatikai tároló frissítése

A Térinformatikai tároló új verziója új funkciókészlettel lett kiadva. Ezzel a Docker-tárolóval valós idejű streamelési videót elemezhet az emberek közötti térbeli kapcsolatok és azok fizikai környezeteken keresztüli mozgásának megértéséhez.

A térinformatikai műveletek mostantól konfigurálhatók úgy, hogy észleljék az adott személy által tapasztalt tájolást.
- A paraméter konfigurálásával enable_orientation a tájolás-osztályozók és personcrossingpolygon műveletek personcrossingline engedélyezhetők. Alapértelmezés szerint ki van kapcsolva.
A térinformatikai műveletek mostantól konfigurálást is kínálnak az adott személy sebességének észleléséhez séta/futás közben
- Az osztályozó alapértelmezés szerint ki van kapcsolvaenable_speed, és personcrossingpolygon a műveletek sebessége észlelhetőpersoncrossingline. A kimenet a , avgSpeedés minSpeed a speedkimenetekben is tükröződik.

április 2021.

Azure AI Vision v3.2 GA

Az Azure AI Vision API 3.2-es verzió már általánosan elérhető a következő frissítésekkel:

Továbbfejlesztett képcímkézési modell: elemzi a vizualizáció tartalmát, és releváns címkéket hoz létre a képen megjelenített objektumok, műveletek és tartalmak alapján. Ez a modell a Tag Image API-val érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
Frissített con sátormód ration modell: észleli a felnőtt tartalom jelenlétét, és jelzőket biztosít a felnőtt, a racy és a gory vizualizációs tartalmakat tartalmazó képek szűréséhez. Ez a modell az Analyze API-n keresztül érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
Az OCR (Olvasás) 73 nyelven érhető el, beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
Az OCR (Olvasás) disztribúciós tárolóként is elérhető a helyszíni üzembe helyezéshez.

Lásd: Azure AI Vision v3.2 GA

PersonDirectory adatstruktúra (előzetes verzió)

Az olyan arcfelismerési műveletek végrehajtásához, mint az Azonosság és a Hasonló keresése, a Face API-ügyfeleknek létre kell hozniuk a Person objektumok válogatott listáját. Az új PersonDirectory egy olyan adatstruktúra, amely egyedi azonosítókat, választható névsztringeket és opcionális felhasználói metaadat-sztringeket tartalmaz a címtárhoz hozzáadott egyes személyidentitásokhoz . A Face API jelenleg a LargePersonGroup struktúrát kínálja, amely hasonló funkcionalitással rendelkezik, de legfeljebb 1 millió identitással rendelkezik. A PersonDirectory struktúra akár 75 millió identitást is felskálázhat.
A PersonDirectory és a korábbi adatstruktúrák közötti másik jelentős különbség az, hogy többé nem kell betanítási hívásokat kezdeményeznie, miután arcokat ad hozzá egy Személy objektumhoz – a frissítési folyamat automatikusan megtörténik. További részletekért lásd : A PersonDirectory-struktúra használata.

2021. március

Az Azure AI Vision 3.2 nyilvános előzetes verziójának frissítése

Frissült az Azure AI Vision API 3.2-es nyilvános előzetes verziója. Az előzetes kiadás tartalmazza az Összes Azure AI Vision-funkciót, valamint a frissített Olvasási és elemzési API-kat.

Az Azure AI Vision 3.2 nyilvános előzetes verziójának megtekintése

február 2021.

Az API 3.2-es nyilvános előzetes verziójának olvasása OCR-támogatással 73 nyelven

Az Azure AI Vision Read API 3.2-es nyilvános előzetes verziója, amely felhőszolgáltatásként és Docker-tárolóként érhető el, a következő frissítéseket tartalmazza:

OCR 73 nyelvhez , beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
A szövegsor kimenetének természetes olvasási sorrendje (csak latin nyelvű)
A szövegsorok kézírásstílus-besorolása a megbízhatósági pontszámmal együtt (csak latin nyelvek esetén).
Csak többoldalas dokumentum kijelölt lapjaihoz bontsa ki a szöveget.
Disztribúciós tárolóként érhető el a helyszíni üzembe helyezéshez.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

A Read API 3.2-es nyilvános előzetes verziójának használata

Új Face API-észlelési modell

Az új Detection 03 modell a jelenleg elérhető legpontosabb észlelési modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03 észlelés javítja a visszahívást és a pontosságot a képeken található kisebb arcokon (64x64 képpont). További fejlesztések közé tartozik a hamis pozitív értékek általános csökkentése és az elforgatott arc tájolások jobb észlelése. Az Észlelés 03 és az új Recognition 04 modell kombinálásával jobb felismerési pontosságot is biztosít. További részletekért lásd: Arcészlelési modell megadása.

Új észlelhető Face-attribútumok

Az faceMask attribútum a legújabb Detection 03 modellel érhető el, valamint a hozzáadott attribútummal "noseAndMouthCovered", amely azt észleli, hogy az arcmaszk a kívánt módon van-e viselve, az orrra és a szájra is kiterjed. A legújabb maszkészlelési képesség használatához a felhasználóknak meg kell adniuk az észlelési modellt az API-kérelemben: rendelje hozzá a modell verzióját az detectionModel paraméterrel detection_03. További részletekért lásd: Arcészlelési modell megadása.

Új Face API-felismerési modell

Az új Recognition 04 modell a jelenleg elérhető legpontosabb felismerési modell. Ha Ön új ügyfél, javasoljuk, hogy ezt a modellt használja ellenőrzésre és azonosításra. Javítja a Recognition 03 pontosságát, beleértve az arcfedőt viselő felhasználók (sebészeti maszkok, N95 maszkok, ruhamaszkok) jobb felismerését is. Javasoljuk, hogy ne regisztrálja az arcfedőt viselő felhasználók képeit, mivel ez csökkenti a felismerés minőségét. Mostantól az ügyfelek biztonságos és zökkenőmentes felhasználói élményeket hozhatnak létre, amelyek észlelik, hogy a felhasználó arcvédőt visel-e a legújabb Detection 03 modellel, és felismerheti őket a legújabb Recognition 04 modellel. További részletekért lásd: Arcfelismerési modell megadása.

Január 2021.

Térinformatikai tároló frissítése

A térinformatikai műveletek mostantól úgy konfigurálhatók, hogy észleljék, ha egy személy védő arcot, például maszkot visel.
- A paraméter konfigurálásával egy maszkosztályozó engedélyezhető a personcount, personcrossingline és personcrossingpolygon a ENABLE_FACE_MASK_CLASSIFIER műveletek számára.
- Az attribútumok face_mask , és face_noMask a rendszer a videóstreamben észlelt minden személy megbízhatósági pontszámával rendelkező metaadatként adja vissza
A personcrossingpolygon művelet ki lett terjesztve, hogy lehetővé tegye az adott személy által a zónában töltött tartózkodási idő kiszámítását. A művelet zónakonfigurációjában beállíthatja a type paramétert, és egy personZoneDwellTimeEvent típusú új esemény tartalmazza a durationMs zónában töltött ezredmásodperc számával kitöltött mezőt.zonedwelltime
Kompatibilitástörő változás: A personZoneEvent eseményt átnevezték personZoneEnterExitEvent eseményre. Ezt az eseményt a personcrossingpolygon művelet aktiválja, amikor egy személy belép a zónába, vagy kilép a zónából, és irányadatokat biztosít a átlépett zóna számozott oldalával.
A videó URL-címe "Private Parameter/obfuscated" (Privát paraméter/obfuscated) néven is megadható minden műveletben. Az elfedés most már nem kötelező, és csak akkor működik, ha KEY környezeti IV változóként van megadva.
A kalibrálás alapértelmezés szerint engedélyezve van minden műveletnél. Állítsa be a do_calibration: false letiltásához.
Az automatikus újraszámítás (alapértelmezés szerint letiltva) támogatása a paraméteren keresztül, a részletekért tekintse meg a enable_recalibrationtérinformatikai műveleteket .
A kamera kalibrációs paraméterei a DETECTOR_NODE_CONFIG. Részletekért tekintse meg a térinformatikai műveleteket .

Késés csökkentése

A Face csapata közzétett egy új cikket, amely ismerteti a késés lehetséges okait a szolgáltatás használatakor és a lehetséges kockázatcsökkentési stratégiákat. Lásd: Késés csökkentése a Face szolgáltatás használatakor.

2020. december

Ügyfélkonfiguráció a Face ID Storage-hoz

Bár a Face Service nem tárolja az ügyfélképeket, a kinyert arcfunkció(ka)t a rendszer a kiszolgálón tárolja. A Face ID az arcfunkció azonosítója, és a Face – Azonosítás, Arc – Ellenőrzés és Arc – Hasonló keresés funkcióban lesz használva. A tárolt arcfunkciók az eredeti észlelési hívás után 24 órával lejárnak és törlődnek. Az ügyfelek most már meg tudják határozni, hogy mennyi ideig legyenek gyorsítótárazva ezek a Face-azonosítók. A maximális érték még mindig legfeljebb 24 óra, de most már megadható egy minimum 60 másodperces érték. A gyorsítótárazott Arcazonosítók új időtartományai bármilyen 60 másodperc és 24 óra közötti érték. További részleteket a Face – Detect API-referencia (a faceIdTimeToLive paraméter) tartalmaz.

2020. november

Minta arcregisztrációs alkalmazás

A csapat közzétett egy minta Face-regisztrációs alkalmazást, amely bemutatja azokat az ajánlott eljárásokat, amelyekkel értelmes hozzájárulást hozhat létre, és magas pontosságú arcfelismerő rendszereket hozhat létre kiváló minőségű regisztrációkon keresztül. A nyílt forráskódú minta a regisztrációs alkalmazás összeállítása útmutatóban és a GitHubon található, amely készen áll a fejlesztők üzembe helyezésére vagy testreszabására.

Október 2020.

Azure AI Vision API v3.1 GA

Az Általános rendelkezésre állású Azure AI Vision API-t frissítették a 3.1-es verzióra.

2020. szeptember

Térinformatikai tároló előzetes verziója

A Térinformatikai tároló előzetes verzióban érhető el. Az Azure AI Vision térinformatikai funkciója lehetővé teszi a valós idejű streamelési videó elemzését, hogy megértse az emberek közötti térbeli kapcsolatokat és azok fizikai környezeteken keresztüli mozgását. A térinformatikai elemzés egy helyszíni Docker-tároló.

A Read API 3.1 nyilvános előzetes verziója ocR-t ad hozzá japánhoz

Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója a következő képességeket adja hozzá:

OCR japán nyelvhez
Az egyes szövegsorok esetében adja meg, hogy a megjelenés kézírásos vagy nyomtatási stílus-e, valamint egy megbízhatósági pontszámot (csak latin nyelvű).
Többoldalas dokumentum esetén csak a kijelölt oldalak vagy oldaltartományok szövegének kinyerése.
A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, japán, portugál, egyszerűsített kínai és spanyol nyelveket.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

További információ a Read API v3.1 Public Preview 2-ről

2020. augusztus

Inaktív adatok ügyfél által felügyelt titkosítása

A Face szolgáltatás automatikusan titkosítja az adatokat a felhőben való megőrzésekor. A Face szolgáltatás titkosítása védi az adatokat, hogy megfeleljen a szervezeti biztonsági és megfelelőségi követelményeknek. Alapértelmezés szerint az előfizetés a Microsoft által felügyelt titkosítási kulcsokat használja. Az előfizetést saját, ügyfél által felügyelt kulcsokkal (CMK) is kezelheti. További részletek az ügyfél által felügyelt kulcsok között találhatók.

2020. július

Az API 3.1-es nyilvános előzetes verziójának olvasása az egyszerűsített kínai OCR-vel

Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója támogatja az egyszerűsített kínai nyelvet.

A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, portugál, egyszerűsített kínai és spanyol nyelveket.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

További információ a Read API v3.1 Public Preview 1-ről

május 2020.

Az Azure AI Vision API 3.0-s verziójú általános rendelkezésre állása a Read API frissítéseivel történt:

Angol, holland, francia, német, olasz, portugál és spanyol támogatás
Nagyobb pontosság
Megbízhatósági pontszám minden kinyert szóhoz
Új kimeneti formátum

További információért tekintse meg az OCR áttekintését .

április 2020.

Új Face API-felismerési modell

Az új recognition 03 modell a jelenleg elérhető legpontosabb modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03-ás felismerés jobb pontosságot biztosít a hasonlóság-összehasonlításokhoz és a személyegyeztetési összehasonlításokhoz. További részleteket az Arcfelismerési modell megadása című témakörben talál.

2020. március

A TLS 1.2 mostantól a szolgáltatásnak küldött összes HTTP-kéréshez érvényes. További információ: Azure AI-szolgáltatások biztonsága.

Január 2020.

Az API 3.0 nyilvános előzetes verziójának olvasása

Mostantól a Read API 3.0-s verziójával nyomtatott vagy kézzel írt szöveget nyerhet ki képekből. A korábbi verziókhoz képest a 3.0 a következőt biztosítja:

Nagyobb pontosság
Új kimeneti formátum
Megbízhatósági pontszám minden kinyert szóhoz
Spanyol és angol nyelv támogatása a nyelvi paraméterrel

Kövesse a Szöveg kinyerése rövid útmutatót a 3.0 API használatának megkezdéséhez.

június 2019.

Új Face API-észlelési modell

Az új Detection 02 modell jobb pontosságot biztosít a kis, oldalnézetű, elhomályosított és homályos arcokon. Használja a Face - Detect, FaceList - Add Face, LargeFaceList - Add Face, PersonGroup Person - Add Face and LargePersonGroup Person - Add Face and LargePersonGroup Person – Add Face by specifying the new face detection model name detection_02 in detectionModel parameter. További részletek az észlelési modell megadásáról.

április 2019.

Továbbfejlesztett attribútumpontosság

Az és az ageheadPose attribútumok általános pontossága javult. Az headPose attribútum az engedélyezett értékkel is frissül pitch . Ezeket az attribútumokat a Face – DetectreturnFaceAttributes paraméter paraméterében returnFaceAttributesadhatja meg.

Továbbfejlesztett feldolgozási sebesség

Az Arc – Észlelés, FaceList – Arc hozzáadása, LargeFaceList – Arc hozzáadása, PersonGroup person – Face és LargePersonGroup person hozzáadása – Arcműveletekhozzáadása.

2019. március

Új Face API-felismerési modell

A Recognition 02 modell pontossága javult. Használja a Face – Detect, FaceList – Create, LargeFaceList – Create, PersonGroup – Create és LargePersonGroup – Create és LargePersonGroup használatával – Létrehozás az új arcfelismerési modell nevének recognition_02 paraméterben recognitionModel való megadásával. További részletek a felismerési modell megadásáról.

Január 2019.

Face Snapshot funkció

Ez a funkció lehetővé teszi, hogy a szolgáltatás támogassa az előfizetések közötti adatmigrálást: Pillanatkép.

Fontos

2023. június 30-tól megszűnik a Face Snapshot API.

október 2018.

API-üzenetek

A PersonGroup - Betanítási állapot lekérése, a LargePersonGroup – Betanítási állapot és a LargeFaceList pontosított leírása lastSuccessfulTrainingDateTimestatuscreatedDateTimelastActionDateTime– Betanítási állapot lekérése.

2018. május

Továbbfejlesztett attribútumpontosság

Jelentősen továbbfejlesztett gender attribútumok, valamint továbbfejlesztett age, glasses, facialHair, hairattribútumok makeup . Használja őket a Face - DetectreturnFaceAttributes paraméteren keresztül.

Fájlméretkorlát növelése

A bemeneti képfájl méretkorlátjának növelése 4 MB-ról 6 MB-ra a Face alkalmazásban – Észlelés, FaceList – Arc hozzáadása, LargeFaceList – Arc hozzáadása, PersonGroup person – Face és LargePersonGroup személy hozzáadása – Arc hozzáadása.

2018. március

Új adatstruktúra

LargeFaceList és LargePersonGroup. További részletek a skálázásról a regisztrált felhasználók további kezelése érdekében.
Fokozott arc – Az [1, 5] és az [1, 100] közötti paraméter azonosításamaxNumOfCandidatesReturned, alapértelmezett értéke pedig 10.

2017. május

Új észlelhető Face-attribútumok

Hozzáadvahair, makeup, accessory, occlusion, blur, , , exposureés noise attribútumok a Face - DetectreturnFaceAttributes paraméterben.
Támogatott 10 000 személy a PersonGroup és a Face - Identify alkalmazásban.
Támogatott lapozás a PersonGroup Person alkalmazásban – Választható paraméterekkel rendelkező lista : start és top.
Támogatott egyidejűség az arcok hozzáadásához/törléséhez a PersonGroup különböző FaceLists és különböző személyei ellen.

2017. március

Új észlelhető Face-attribútum

Attribútum hozzáadva emotion a Face - DetectreturnFaceAttributes paraméterben.

Megoldott problémák

Az arcot nem sikerült újra észlelni a Face -Detect as in FaceList – Add Face and PersonGroup Person – Add Face ( Face and PersonGroup Person - Add Face) (Arc hozzáadása) nevű téglalaptal.targetFace
Az észlelhető arcméret úgy van beállítva, hogy szigorúan 36x36 és 4096x4096 képpont között legyen.

2016. november

Új előfizetési szint

A Face Storage Standard-előfizetéssel további tartós arcokat tárolhat a PersonGroup Person használata során – Arc vagy FaceList hozzáadása – Arc hozzáadása azonosításhoz vagy hasonlóság-egyeztetéshez. A tárolt képek díja 1000 arconként 0,5 dollár és a díjszabás napi lebontású. Az ingyenes szintű előfizetések továbbra is 1000 főre korlátozódnak.

2016. október

API-üzenetek

A FaceList – Arc és személycsoport hozzáadása – Arc hozzáadása – Arc hozzáadása lehetőségnél a "Több arc van a képen" szövegről a "Több arc van a képen" szövegre módosította a hibaüzenetet targetFace.

2016. július

Új funkciók

Támogatott személyközi objektumhitelesítés a Face alkalmazásban – Ellenőrzés.
Nem kötelező mode paraméter hozzáadva, amely lehetővé teszi két munkamód kiválasztását: matchPerson a matchFace Face - Find Similar (Hasonló keresése) és az alapértelmezett (matchPersonHasonló keresése) beállításban.
Opcionális confidenceThreshold paraméter hozzáadva a felhasználóhoz annak beállításához, hogy az egyik arc egy Személy objektumhoz tartozik-e a Face – Identify fájlban.
Választható és top paraméterek hozzáadva start a PersonGroup - List elemhez, hogy a felhasználó meg tudja adni a kezdőpontot és a listához tartozó teljes PersonGroups-számot.

1.0-s verzió változásai a V0-ről

Frissített szolgáltatásgyökér végpontja a helyről https://westus.api.cognitive.microsoft.com/face/v0/ a .https://westus.api.cognitive.microsoft.com/face/v1.0/ A következőre alkalmazott módosítások: Face – Detect, Face – Identify, Face – Find Similar and Face – Group.
A minimálisan észlelhető arcméret 36x36 képpontra frissült. A 36x36 képpontnál kisebb arcok nem lesznek észlelhetők.
A PersonGroup és a Person adatok elavultak a Face V0-ben. Ezek az adatok nem érhetők el a Face V1.0 szolgáltatással.
2016. június 30-án elavult a Face API V0-végpontja.

Azure AI-szolgáltatások frissítései

Azure-frissítési közlemények az Azure AI-szolgáltatásokhoz

Megosztás a következőn keresztül:

Az Azure AI Vision újdonságai

2025. február

Face liveness ügyféloldali SDK 1.1.0 kiadás

2025. január

Arcélesség-észlelés – GA

Image Analysis 4.0 Preview API elavulása

2024. augusztus

Új észlelhető Face-attribútumok

2024. május

New Face SDK 1.0.0-beta.1 (kompatibilitástörő változások)

2024. február

Multimodális beágyazások – GA: új többnyelvű modell

2024. január

Új képelemzési SDK 1.0.0-beta.1 (kompatibilitástörő változások)

2023. november

Kép elemzése 4.0 GA

Arc ügyféloldali SDK az élőség észleléséhez

2023. szeptember

Elavult Computer Vision API-verziók elavulása

2023. május

Image Analysis 4.0 Termékfelismerés (nyilvános előzetes verzió)

2023. április

Korlátozott hozzáférési jogkivonatok

2023. március

Az Azure AI Vision Image Analysis 4.0 SDK nyilvános előzetes verziója

Image Analysis 4.0 SDK (nyilvános előzetes verzió)

Képelemzés v4.0 feliratozás és sűrű feliratozás (nyilvános előzetes verzió):

Videóösszegzés és képkockakereső (nyilvános előzetes verzió):

Image Analysis 4.0-modell testreszabása (nyilvános előzetes verzió)

Multimodális beágyazási API-k (nyilvános előzetes verzió)

Háttér eltávolítási API-k (nyilvános előzetes verzió)

Az Azure AI Vision 3.0 & 3.1 előzetes verzió elavulása

2022. október

Azure AI Vision Image Analysis 4.0 (nyilvános előzetes verzió)

Szeptember 2022.

Az Azure AI Vision 3.0/3.1 Olvasási előzetes verzió elavulása

2022. június

A Vision Studio indítása

Felelős AI a Face-hoz

Arc áttetszőségi megjegyzése

Bizalmas attribútumok kivonása

Fairlearn-csomag és a Microsoft Méltányossági irányítópultja

Korlátozott hozzáférési szabályzat

Az Azure AI Vision 3.2 előzetes verziójának elavulása

2022. május

Az OCR (Olvasás) API-modell általánosan elérhető (GA)

február 2022.

Az OCR (Olvasás) API nyilvános előzetes verziója 164 nyelvet támogat

Új minőségi attribútum Detection_01 és Detection_03

2021. szeptember

Az OCR (Olvasás) API nyilvános előzetes verziója 122 nyelvet támogat

2021. augusztus

Képcímkéző nyelvbővítés

2021. július

Új headPose és Landmarks fejlesztések Detection_03

május 2021.

Térinformatikai tároló frissítése

április 2021.

Azure AI Vision v3.2 GA

PersonDirectory adatstruktúra (előzetes verzió)

2021. március

Az Azure AI Vision 3.2 nyilvános előzetes verziójának frissítése

február 2021.

Az API 3.2-es nyilvános előzetes verziójának olvasása OCR-támogatással 73 nyelven

Új Face API-észlelési modell

Új észlelhető Face-attribútumok

Új Face API-felismerési modell

Január 2021.

Térinformatikai tároló frissítése

Késés csökkentése

2020. december

Ügyfélkonfiguráció a Face ID Storage-hoz

2020. november

Minta arcregisztrációs alkalmazás

Október 2020.

Azure AI Vision API v3.1 GA

2020. szeptember

Térinformatikai tároló előzetes verziója

A Read API 3.1 nyilvános előzetes verziója ocR-t ad hozzá japánhoz