Применение мультимодальных генеративных моделей для повышения качества интерпретации данных аэросъемки

С.В. Зайцев* (1), С.В. Наумов (1), Р.И. Шакиров (2), Д.В. Бородкина (2), Д.Г. Сёмин (2), Г.К. Григорьев (2) (1 - Nedra Digital (ООО «Недра»), 2 - Группа компаний «Газпром нефть»)

Современные ИИ-модели, хотя и демонстрируют впечатляющие результаты во многих областях, остаются весьма чувствительными к качеству и количеству тренировочных данных. В контексте аэросъемки это приводит к риску ошибочной интерпретации данных, что может иметь серьезные последствия, включая пропуск критических событий и неэффективное распределение ресурсов. Перед лицом таких вызовов, актуальность исследования новых подходов к обучению и анализу данных ИИ становится бесспорной. В данной работе была выполнена проверка технологической гипотезы о возможности использования мультимодальных генеративных ИИ-моделей для синтезирования данных аэросъемки. Эти модели обладают потенциалом создавать высокодетализированные и реалистичные изображения, что может кардинально изменить подход к обучению нейронных сетей в сфере аэросъемки. Синтетические данные, генерируемые таким образом, могут обеспечить достаточный и качественный датасет, необходимый для повышения точности извлечения и интерпретации информации с аэрофотоснимков (АФС). В частности, это касается точности сегментирования различных слоев - от водных путей до дорожной сети, выявления опасных инцидентов, категорий рубки леса, задымлений, разливов нефти, обрывов линий электропередач, а также идентификации людей, транспорта и нарушений на производственных объектах.