Képek gyűjtése

Cikk
01/27/2025

Ahhoz, hogy egy objektumészlelési modellt betaníthasson az objektumok felismerésére, azokat az objektumokat ábrázoló képeket kell összegyűjtenie. A jobb eredmény érdekében tartsa be a képek mennyiségére és minőségére vonatkozó irányelveket.

Formátum és méret

Az objektumészlelési modellbe táplált képeknek az alábbi jellemzőkkel kell rendelkezniük:

Formátum:
- JPG
- PNG
- BMP
Méret:
- 6 MB maximális betanításhoz
- minimális szélesség/magasság 256 pixel x 256 pixel

Az adatok mennyisége és egyensúlya

Lényeges, hogy az AI-modell betanításához elég képet töltsön fel. Megfelelő kiindulásként a betanítási halmaz objektumonként legalább 15 képet tartalmazzon. Kevesebb képpel fennáll a kockázat, hogy a modell zajt vagy jelentéktelen elemeket tanul meg. A modell betanítására használt képek számával a pontosságnak is nőnie kell.

Egy másik szempont az adatok egyensúlyának biztosítása. Ha egy objektumhoz 500, egy másikhoz pedig csak 50 képe van, akkor a betanítási halmaz nem kiegyensúlyozott. Ez azt okozhatja, hogy a modell hatékonyabban ismeri fel az objektumok egyikét. A következetesebb eredmények érdekében tartson fenn legalább 1:2 arányt a legkevesebb és a legtöbb képpel rendelkező objektumok képszáma között. Ha a legtöbb képpel rendelkező objektumról például 500 képe van, akkor a legkevesebb képpel rendelkezőről is legyen legalább 250 a betanításhoz.

Különböző képek használata

Olyan képeket adjon meg, amelyek képviselik a modellnek a normál használat során átadottakat. Tegyük fel például, hogy almák felismerésére tanít be egy modellt. Ha csak tányérra helyezett almák képeivel tanítja, akkor nem feltétlenül fogja felismerni a fán lógó almákat. Változatos képek használatával biztosíthatja, hogy a modell ne legyen egyoldalú, és általánosítani is képes legyen. Az következőkben néhány módszert mutatunk be a betanítási halmaz változatosabbá tételére.

Háttér

Használjon képeket a tárgyakról különböző hátterek előtt – például gyümölcsöt a tányérokon, a kézben vagy a fákon. A környezetet is ábrázoló képek jobbak a semleges hátterűeknél, mert több információt nyújtanak a besoroláshoz.

Kép hátterek.

Megvilágítás

Használjon különböző megvilágítású betanítási képeket, főleg akkor, ha az észleléshez használt képek megvilágítása is eltérő lehet. Legyenek a képek között például vakuval, nagy expozíciós idővel és más módokon készültek is. Hasznos különböző telítettségű, árnyalatú és világosságú képeket is használni. Az eszköz kamerája szinte bizonyosan lehetővé teszi ezek beállítását.

Képvilágítás.

A tárgy mérete

Olyan képeket adjon meg, amelyeken a tárgyak különböző méretűek, és az objektum különböző részeit örökítik meg – például egy banánfürtöket és egy banán közeli képét. A különböző méretek segítségével a modell jobban általánosít.

Objektumméretek.

A kamera nézőpontja

Törekedjen a különböző nézőpontokból készült képek használatára. Ha az összes fénykép rögzített helyzetű, például térfigyelő kamerákból származik, rendeljen különböző címkét az egyes kamerákhoz. Ez segít elkerülni, hogy oda nem tartozó objektumokat, például lámpaoszlopokat modellezzen fő elemként. Akkor is adjon meg kameracímkéket, ha a kamerák ugyanazokat az objektumokat fényképezik.

Kameraállások.

Nem várt eredmények

Előfordulhat, hogy az AI-modell helytelenül tanulja meg a képek közös jellemzőit. Tegyük fel, hogy egy az almákat a citrusféléktől megkülönböztető AI-modellt szeretne betanítani. Ha kézben tartott almák és fehér tányéron lévő citrusfélék képeit használja, megtörténhet, hogy a modell kezek és tányérok megkülönböztetését tanulja meg az almáké és citrusféléké helyett.

Váratlan eredmények.

Ennek elkerülése érdekében használja fel a különböző képek használatáról szóló fenti útmutatást: adjon meg különböző szögekből és hátterekkel készült, eltérő méretű tárgyakat és csoportokat ábrázoló képeket és más változatokat.

Első lépések a Objektumfelismerés használatában

Megosztás a következőn keresztül:

Képek gyűjtése

Formátum és méret

Az adatok mennyisége és egyensúlya