Наукові видання Львівського національного університету імені Івана Франка

Вісник Львівського університету. Серія прикладна математика та інформатика

Інформація
Рік видання 2018
Випуск 26
Автори Романюк В.
Назва статті Дослідження техніки Dropout для детекторів Faster R-CNN з наперед навченими згортковими нейронними мережами для виявлення дуже простих об’єктів, що можуть бути замаскованими
Анотація Метод виявлення об’єктів Faster R-CNN використовує наперед навчену згорткову нейронну мережу для того, щоб навчати детектор на малих навчальних множинах, типових для практики виявлення об’єктів. Перенавчанню в згорткових мережах запобігають за допомогою вставки шарів DropOut. Відкритим питанням є те, чи техніка DropOut набагато поліпшує точність детектора об’єктів Faster R-CNN. Тому наша мета – з’ясувати, як техніка DropOut впливає на продуктивність детектора об’єктів. Первинним набором даних класифікації зображень для попереднього навчання згорткової нейронної мережі є CIFAR-10. Відповідна архітектура згорткової мережі для класифікації зображень CIFAR-10 має 50 % шар DropOut, вставлений між двома повнозв’язними шарами. Задачі виявлення об’єктів, використовувані для навчання і тестування детектора Faster R-CNN, складаються з монохромних зображень, на яких мають бути виявлені невеликі чорні прямокутники. Незважаючи на те, що такі об’єкти – дуже прості, вони можуть бути замаскованими поблизу деяких темних ділянок так, щоб виявлення не було легким. Одна задача полягає у виявленні чорних прямокутників на фронтальних зображеннях приміських будинків. Інша – у виявленні таких прямокутників на зображеннях офісних кімнат. Набір даних приміських зображень поділений на навчальну множину зі 120 зображень і тестову множину зі 121 зображення, з чорним прямокутником у кожному зображенні. Набір даних офісних зображень поділений так само на навчальну множину зі 115 зображень і тестову множину зі 100 зображень, з чорним прямокутником у кожному зображенні. Продуктивність детектора досліджують за трьома параметрами навчання: співвідношення перекриття обмежувальних прямокутників для позитивних навчальних зразків, розмір мінімального прямокутника прив’язки і коефіцієнт пірамідального масштабування обмежувальних прямокутників. Під продуктивністю розуміють кількість виявлених об’єктів разом зі співвідношенням перетину й об’єднання. Однак ні графіки для сум співвідношень перетину й об’єднання, ні графіки для кількості виявлених об’єктів не продемонстрували, щоб техніка DropOut впливала на продуктивність детектора об’єктів Faster R-CNN. Навіть пропустивши кілька об’єктів та знижуючи поріг точності, такий вплив видається незначним. Відтак наперед навчена згорткова нейронна мережа для включення її у склад детектора об’єктів Faster R-CNN не повинна містити шару DropOut, особливо якщо ця мережа з шаром DropOut навчається набагато довше.
Мова Англійська
PDF формат Романюк В. 
small logo
©2003-2009 Львівський університет | Контакти