Збір зображень

Стаття
01/27/2025

Щоб навчити модель виявлення об’єктів розпізнавати свої об’єкти, вам потрібно зібрати зображення, які містять ці об’єкти. Дотримуйтесь рекомендацій щодо кількості та якості зображення для досягнення кращих результатів.

Формат і розмір

Зображення, які ви будете подавати своїй моделі виявлення об’єктів, повинні мати такі характеристики:

Формат приготування:
- JPG
- PNG
- BMP
Розмір:
- Максимум 6 МБ для навчання
- мінімальна ширина / висота 256 пікселів х 256 пікселів

Кількість даних і баланс даних

Важливо завантажити достатню кількість зображень, щоб навчити свою модель штучного інтелекту. Хорошою відправною точкою є наявність принаймні 15 зображень на кожен об’єкт для навчального набору. Чим менше зображень, тим більший ризик того, що ваша модель засвоїть концепції, які є просто шумом або не мають відношення до справи. Тренування вашої моделі з більшою кількістю зображень має підвищити точність.

Ще одним фактором є забезпечення збалансованості ваших даних. Якщо у вас 500 зображень для одного об’єкта і лише 50 зображень для іншого, ваш набір тренувальних даних не збалансований. Це може призвести до того, що модель буде краще розпізнавати один з об’єктів. Для отримання більш стабільних результатів дотримуйтесь співвідношення принаймні 1:2 між об’єктом із найменшою кількістю зображень і об’єктом із найбільшою кількістю. Наприклад, якщо об’єкт з найбільшою кількістю зображень має 500 зображень, то об’єкт з найменшою кількістю зображень повинен мати не менше 250 зображень для навчання.

Використовуйте більш різноманітні зображення

Надавайте зображення, які відображають те, що буде надіслано моделі під час звичайного використання. Наприклад, скажімо, ви тренуєте модель розпізнавати яблука. Якщо ви тренуєте зображення яблук лише на тарілках, він може не завжди розпізнавати яблука на деревах. Включення різних видів зображень гарантує, що ваша модель не упереджена і може добре узагальнити. Нижче наведено кілька способів, як ви можете зробити свій тренувальний набір більш різноманітним.

Фон

Використовуйте зображення своїх об’єктів на тлі різних фонів, наприклад, фрукти на тарілках, в руках і на деревах. Фотографії в контексті кращі, ніж фотографії на тлі нейтрального фону, оскільки вони надають більше інформації для класифікатора.

Фони зображень.

Освітлення

Використовуйте тренувальні зображення з різним освітленням, особливо якщо зображення, які використовуються для виявлення, можуть мати різне освітлення. Наприклад, додайте зображення, зроблені зі спалахом, високою експозицією тощо. Також корисно включати зображення з різною насиченістю, відтінком і яскравістю. Імовірно, камера вашого пристрою дозволяє керувати цими налаштуваннями.

Освітлення зображення.

Розмір об’єкта

Надайте зображення, на яких об’єкти мають різні розміри, фіксуючи різні частини об’єкта, наприклад, фотографію грон бананів і крупним планом одного банана. Різні розміри допомагають моделі краще узагальнити.

Розміри об’єктів.

Кут нахилу камери

Намагайтеся надавати зображення, зроблені з різних ракурсів. Якщо всі фотографії зроблено з набору стаціонарних камер, наприклад камер спостереження, призначте кожній камері різні мітки. Це може допомогти уникнути моделювання не пов’язаних між собою об’єктів, таких як ліхтарні стовпи, як ключова особливість. Призначайте мітки камер, навіть якщо камери знімають однакові об’єкти.

Ракурси камери.

Несподівані результати

Моделі штучного інтелекту можуть неправильно вивчати характеристики, які є спільними для ваших зображень. Припустимо, ви хочете створити модель, щоб відрізнити яблука від цитрусових. Якщо ви використовуєте зображення яблук в руках і цитрусових на білих тарілках, модель може тренуватися на руках проти білих тарілок замість яблук проти цитрусових.

Несподівані результати.

Щоб виправити це, скористайтеся наведеними вище рекомендаціями щодо навчання з більш різноманітними зображеннями: надайте зображення з різними ракурсами, фоном, розміром об’єкта, групами та іншими варіантами.

Початок роботи з Виявлення об’єктів

Поділитися через

Збір зображень

Формат і розмір

Кількість даних і баланс даних

Використовуйте більш різноманітні зображення