Заполнение пропущенных значений каротажных данных при помощи агрегации моделей

Д. Ю. Ковалев* (1), Д. К. Хлюстов (1) ( 1 - Aramco Innovations LLC)

В последние годы развитие сложных моделей искусственного интеллекта позволило получить высокоточные методы решения таких задач, как прогнозирование, кластеризация и интерполяция многомерных временных рядов. Однако большинство алгоритмов, основанных на глубоких нейронных сетях или применяющих ансамблирование, требуют значительных объемов данных, желательно содержащих максимально возможное число физически реализуемых сценариев. Многие наборы данных, встречающихся в практически значимых задачах, содержат заметную часть пропущенных значений. К примеру, в нефтяной промышленности возможными причинами отсутствия части данных являются тяжелые условия работы оборудования, необходимость снижения расходов на бурение, ошибки сетей коммуникации. Соответственно, задача физически адекватного заполнения пропущенных значений становится особенно актуальной. В данной работе рассматривается один из возможных подходов к заполнению пропущенных значений. Все элементы набора данных представляют собой многомерные временные ряды, индексированные по глубине. Для проверки предлагаемого подхода были использованы открытый набор данных. Он содержит результаты логирования для 371 скважины из бассейна Таранаки в Новой Зеландии. Предложенный метод с использование алгоритма агрегации Вовка позволяет на основе нескольких прогнозирующих моделей строить усредненную оценку поведения процесса. Продемонстрировано, что при помощи алгоритма можно существенно повысить точность прогнозирования как на малых, так и на больших промежутках времени.