Abstract: | Layer-by-layer description of the core is performed to understand the regularities of the structure of the geological section, predict the development of reservoirs, clarify stratigraphic boundaries and obtain calculation parameters for assessing hydrocarbon reserves. In this case, the name of the breed is one of the key parameters determined in the layer-by-layer description. This paper presents a comparative analysis of two approaches to determining the breed using machine learning methods: based on graphical identifiers and convolutional neural networks. The original sample contained photographs of core samples from the Tyumenskaya suite fields (8 fields, 15 wells, more than 2 km of core) under daylight. For the analysis, 4 main classes of rocks (siltstones, mudstones, sandstones, coals) were selected. For these rocks, windows of 5×5 cm were formed and compressed to 299×299 pixels. The total sample exceeded 90,000 windows: 70%– training sample (60,359 windows) and 30%– test (31,140 windows). The training and test samples contain photographs of core samples from different fields. The comparison was made between convolutional neural networks (ResNet, ResNeXt, Inception, etc.) and a classifier (such as XGBoost) based on graphic identifiers of two types: color (average color, dominant colors) and texture (entropy, Euler’s number, contrast, dissimilarity, uniformity, energy, correlation). According to the results of the experiments, the model based on convolutional neural networks turned out to be more sensitive to implicit features and made it possible to reduce the error in the weighted average f1-measure with respect to the ensemble of weak classifiers by 12.5% on the test sample even without optimization of hyperparameters. Thus, we can conclude that the model based on convolutional neural networks is more sensitive to implicit features that are difficult to extract using known graphic identifiers. On the other hand, the approach based on graphic identifiers and an ensemble of weak classifiers can be used without specialized computing power (video cards). Послойное описание керна выполняется для понимания закономерностей строения геологического разреза, прогнозирования развития коллекторов, уточнения стратиграфических границ и получения подсчетных параметров для оценки запасов углеводородного сырья. При этом название породы – один из ключевых параметров, определяемых при послойном описании. В данной работе представлен сравнительный анализ двух подходов определения породы методами машинного обучения: на основе графических идентификаторов и сверточных нейронных сетей. Исходная выборка содержала фотографии керна месторождений Тюменской свиты (8 месторождений, 15 скважин, более 2 км керна) при дневном освещении. Для анализа выбраны 4 основных класса пород (алевролиты, аргиллиты, песчаники, угли). Для данных пород сформированы окна 5 × 5 см и нормированы до 299 × 299 пикселей. Общая выборка превысила 90 тыс. окон: 70% – обучающая выборка (60 359 окон) и 30% – тестовая (31 140 окон). Обучающая и тестовая выборки содержат фотографии керна с разных месторождений. Сравнение производилось между сверточными нейронными сетями (ResNet, ResNeXt, Inception и др.) и классификатором (типа XGBoost) на основе графических идентификаторов двух типов: цветовые (средний цвет, доминирующие цвета) и текстурные (энтропия, число Эйлера, контраст, непохожесть, однородность, энергия, корреляция). По результатам экспериментов модель на основе сверточных нейронных сетей оказалась более чувствительна к неявным признакам и позволила сократить ошибку по средневзвешенной f1-мере по отношению к ансамблю слабых классификаторов на 12,5% на тестовой выборке даже без оптимизации гиперпараметров. Таким образом, можно сделать вывод, что модель на основе сверточных нейронных сетей более чувствительна к неявным признакам, которые сложно извлечь, используя известные графические идентификаторы. С другой стороны, подход на основе графических идентификаторов и ансамбля слабых классификаторов может быть использован без специализированных вычислительных мощностей (видеокарт). |