С. В. Туранов - Применение неспециализированной модели свёрточной нейросети для автоматической детекции макроскопических организмов на подводных видеозаписях из Чукотского моря

БИОЛОГИЯ МОРЯ, 2026, том 52, № 1, с. 37-47

Применение неспециализированной модели свёрточной нейросети для автоматической детекции макроскопических организмов на подводных видеозаписях из Чукотского моря

¹Национальный научный центр морской биологии им. А.В. Жирмунского (ННЦМБ) ДВО РАН, Владивосток, Российская Федерация;
²Дальневосточный государственный технический рыбохозяйственный университет (Дальрыбвтуз), Владивосток, Российская Федерация

E-mail:

Представлен анализ применения свёрточной нейросетевой модели общего назначения Detectron2 (COCO-Detection/faster_rcnn_R_50_FPN_3x) для автоматического обнаружения макроскопических организмов на подводных видеозаписях, полученных в Чукотском море с помощью телеуправляемых подводных аппаратов (ТПА) . Актуальность работы обусловлена назревшей необходимостью развития методов неинвазивного мониторинга биоразнообразия в арктических морях и нехваткой размеченных наборов данных подводной фауны для обучения моделей классификации и детекции. В использованных репрезентативных фрагментах видеоматериалов для разных типов дна (илисто-песчаный, илисто-песчано-ракушечный и каменистый) модель с отключенным порогом вероятности детекции обрабатывала каждый третий кадр. После небольшой дообработки результаты детекции нейросетью были сопоставлены с результатами аналогичной работы, выполненной человеком. Показано, что на илисто-песчаном и илисто-песчано-ракушечном грунтах результаты нейросети сопоставимы с результатами человека: достигнуты высокие метрики точности (0.8), полноты (0.8) и гармоничного среднего или F1-меры (0.80-0.82) при совпадении результатов детекции моделью и человеком на протяжении 50% времени видеофрагмента. При этом объём видеоматериала, требующего просмотра специалистом, сокращается на 30-53%. В условиях сложного каменистого фона качество детекции нейросетью существенно снижалось (точность - 0.12; полнота - 0.07; F1-мера - 0.08), модель была практически не способна различать живые объекты. Обсуждаются выявленные ограничения и причины ошибок детекции (ложных срабатываний и пропусков), а также перспективы повышения эффективности метода за счёт создания специализированных размеченных наборов данных и дообучения моделей.

Ключевые слова: телеуправляемый подводный аппарат (ТПА), неинвазивный мониторинг, обнаружение живых объектов, компьютерное зрение, Detectron2, Faster Region-based Convolutional Neural Networks (R-CNN), Common Objects in Context (COCO).