Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

CHOOSING A METHOD FOR THE INTERPOLATION FUNCTION

Maltsev D.P. 1
1 Tyumen Industrial University
Choosing the right type of interpolation method depends on many factors. Each method works differently, but most use the concept of spatial autocorrelation; close objects are more similar than distant ones. This article presents some general interpolation methods, as well as the choice of the method and its justification for the subsequent implementation of the interpolation function.
interpolation
methods of interpolation
the choice of the interpolation method
the kriging method
the triangulated irregular network inverse weighted states

Введение

Пространственная интерполяция является широко применяемым методом в географических исследованиях. Это метод, который использует значения выборки известных географических объектов для оценки или прогнозирования значений в других неизвестных объектах. Ее можно применять к пространственным данным различных географических объектов или явлений: население, гидрология, атмосфера, топография, сельское хозяйство, почва, землепользование, количество осадков и температура [1].

1 Исходные данные

Необходимо подобрать метод для реализации функции интерполяции в точечных слоях, при условии, что количество объектов в слое будет неограниченно и их расположение может быть хаотичным. Следующим условием является расположение неизвестного объекта в любой точке представленной карты/слоя. Дополнительно необходимо учесть скорость и сложность расчета метода, для наиболее быстрого предоставления результата пользователю и использования имеющихся вычислительных мощностей.

2 Методы интерполяции

Задача пространственной интерполяции – получить (с минимально возможной погрешностью) значения изучаемой пространственной переменной Z в произвольных точках области исследования на основе обработки и анализа ее значений, измеренных в ограниченном числе выборочных точек:

(1)

здесь (X0, Y0) – координаты произвольной точки в области исследования, Z0 – неизвестное значение изучаемой переменной Z в этой точке, 0  – интерполяционная оценка неизвестного значения Z0, получаемая на основе выборочных данных (Z1, Z2,…, Zn). Для оценки значения переменной Z в точке, где она не измерена, применяют различные методы пространственной интерполяции. Принято различать два основных подхода к интерполяции: детерминированный и геостатистический. Методы детерминированной интерполяции аппроксимируют неизвестную переменную параметрической функцией, чья форма задается либо явно (например, полином), либо неявно (условие минимальной кривизны). Параметры выбираются так, чтобы оптимизировать некоторый критерий наилучшего приближения в точках выборки (например, наименьшие квадраты, точное совпадение). Геостатистические методы используют статистические свойства измеренных данных, оценивая пространственную автокорреляцию и учитывая ее при интерполяции [2, стр. 5-7].

  • Детерминированные методы:

Метод обратных взвешенных состояний

Это один из самых простых и доступных методов. Он основан на предположении, что отсутствующее значение может быть аппроксимировано как средневзвешенное значение в точках в пределах определенного расстояния или из заданного числа m ближайших точек. Ближайшие объекты к отсутствующему значению имеют больший вес, тогда как очень отдаленные имеют относительно низкое влияние на расчеты. Вес, приписываемый каждому известному наблюдению, контролируется параметром мощности, часто называемым p. Веса, как правило, обратно пропорциональны степени расстояния, которая в несэмплированном местоположении r приводит к оценке,

(2)

где p – параметр. Хотя этот базовый метод прост в реализации и доступен практически в любой ГИС, он имеет ряд хорошо известных недостатков, ограничивающих его практическое применение. Этот метод часто не воспроизводит локальную форму, подразумеваемую данными, и создает локальные экстремумы в точках данных [3].

Метод триангулированной нерегулярной сети

Этот подход основан на построении треугольной сети на основе пространственного расположения объектов. При этом используется треугольная тесселяция заданных точечных данных для получения двумерной функции для каждого треугольника, которая затем используется для оценки значений в несэмплированных местоположениях. Чаще всего используется метод Делоне. Этот метод направлен на создание неперекрывающихся треугольников, чей описанный круг содержит только три точки вершин треугольника. Каждое неизвестное значение Zi, которое необходимо найти, связано с треугольником T, в котором оно находится. Значение атрибута в Zi рассчитывается как взвешивание значений трех вершин треугольника T.

В линейной интерполяции используются плоские грани, подогнанные к каждому треугольнику. Нелинейные смешанные функции (например, полиномы) используют дополнительные условия непрерывности в первом порядке или как производные первого и второго порядка, обеспечивая гладкую связь треугольников и дифференцируемость получаемой поверхности. Из-за своей локальной природы методы обычно бывают быстрыми, с легким включением разрывов и структурных особенностей. Соответствующая триангуляция относительно геометрии поверхности имеет решающее значение [3].

· Геостатические методы:

Кригинг – базовая интерполяционная модель геостатистики. Он является основой всех методов, связанных с геостатистикой, – интерполяции, вероятностного картирования, стохастического моделирования. Термин «кригинг» служит для обозначения семейства алгоритмов линейной пространственной регрессии. Он происходит от фамилии инженера Д. Крига, который первым применил интерполятор на основе модели пространственной корреляции данных для анализа золотых месторождений Южной Африки. Независимо от Д. Крига Л. С. Гандин применил аналогичный метод для объективного анализа метеополей. Выделяют несколько вариантов моделей кригинга (простой, обычный, универсальный, логнормальный, невязок и др.), которые различаются принятыми предположениями и используемой информацией о моделируемой переменной [4].

Простой кригинг

Как следует из названия, простой кригинг является наиболее простым вариантом кригинга. В этом случае детерминированный тренд m известен и считается постоянным по всему исследуемому полю.

Простой кригинг работает в предположении о стационарности второго порядка случайной переменной Z(x). Кроме того, предполагается, что детерминистическая компонента m(x) постоянна и известна на всей области исследования [4].

(3)

Этот метод является глобальным, потому что он не учитывает локальные изменения тренда. Следует понимать, что здесь прогнозируемые значения не могут выходить за пределы диапазона значений выборки.

Обычный кригинг

Этот метод наиболее известный подход кригинга. Обычный кригинг отличается от простого кригинга тем, что не предполагает знание среднего значения. В обычном кригинге среднее значение считается постоянным, но оно неизвестно. Кроме того, обычный кригинг при использовании локальной оценки не требует постоянства среднего по всей зоне оценивания; предполагается, что среднее постоянно только в окрестности точки оценивания W(x). Предположение о постоянстве среднего в рамках малой окрестности более реалистично, тем более что данные обладают пространственной непрерывностью. Оценка обычного кригинга строится, как линейная комбинация исходных данных [4]:

(4)

3 Выбор алгоритма и его обоснование

Проанализировав представленные методы можно сделать следующие выводы:

· методы кригинга предоставляют наиболее оптимальные и точные результаты, но для расчетов используют всю представленную выборку. Исходя из этого можно предполагать, что данные методы предоставят наиболее близкий объект схожий с оригинальным. Но учитывая, что в исходных данных указано отсутствие ограничения на количество объектов в слое, то можно сказать, что расчет будет производиться довольно долгое время;

· метод триангулированной нерегулярной сети предоставляет менее точные результаты по сравнению с методами кригинга. При расчете этим методом используются три соседних объекта, через которые описывается окружность, с условием отсутствия внутри нее других объектов, которые образуют равносторонний треугольник (метод Делоне). Благодаря этому расчет неизвестного объекта, по данному методу будет наиболее быстрым среди всех представленных. Однако, как следует из исходных данных, этот метод не подойдет для поиска объектов расположенных за пределами представленной выборки, по причине отсутствующих там объектов, необходимых для расчета;

· метод обратных взвешенных состояний так же предоставляет усредненные данные о найденном объекте. При расчете данным методом используются только соседние объекты, имеющие вес, поэтому в расчетах будет использована только часть выборки. Благодаря этому данный метод удовлетворяет и условиям по нахождению объекта за пределами выборки.

Исходя из результатов анализа, для реализации функции интерполяции был выбран метод обратных взвешенных состояний, благодаря тому что, он удовлетворяет всем исходным условиям для реализации: расчет неизвестного может быть произведен на слое с любой количественной выборкой объектов, удовлетворяется условие расчета объекта за пределами выборки, расчет учитывает только весовые объекты выборки, благодаря этому достигается приемлемая скорость получения результата.