
0
Кросс-проверка
Добрый день. Не подскажите, можно ли при проведении кросс-проверки исключить из подсчета данные по скважине из которой взята проба, для которой проводится интерполяция?
Customer support service by UserEcho
Добрый день. Не подскажите, можно ли при проведении кросс-проверки исключить из подсчета данные по скважине из которой взята проба, для которой проводится интерполяция?
Customer support service by UserEcho
Добрый день, Вы можете использовать фильтр на вводе процесса кросс-валидации и исключить любую скважину. Но процесс, в принципе, и так исключает действительное значение (пробу) из набора данных, оценивает ее заново из окружающих проб на основании указанных параметров. Вы сравниваете оцененное и фактическое значение.
Нет, я имела в виду не какую-то конкретную скважину, а чтобы при каждой конкретной интерполяции исключалась только та скважина к которой принадлежит интерполируемая проба. Т.к. соседние с ней пробы на этой же скважине "забивают" влияние проб с других скважин и таким образом проверяется возможность рассчитать значение в одной пробе путем интерполяции по соседним пробам, а не по соседним скважинам
Ну для этого можно: использовать ограничение на количество скважин - Min поле счета, чтобы пробы брались не с одной скважины, на которой весит эта проба, а с соседних.
А также можно просто область поиска по Z уменьшить, тогда процесс будет искать пробы для интерполяции удаленной только в стороны, а не вниз по скважине.
Также можно использовать декластеризацию - деление на секторы обалсти поиска, которая делается не только по вертикали, но и по горизонтали.
Но хочу заметить, в кросс-валидации должны использоваться те же настройки, что и при интерполяции, иначе она бессмысленна.
Спасибо. Я поняла. Т.е. можно добиться чего-то похожего, но параметры эллипсоида при этом оказываются "нереальными". Насколько я знаю, возможность отключать данные по пересечению в котором находится проба при кросс-проверке есть в Исатис.
Смысл кросс-валидации - оценить Параметры интерполяции. То есть, искуственно занизив влияние ближайших проб по скважине при кросс валидации, Вы измените условия проверки. Она окажется уже не честной, так как при интерполяции, Вы не исключали влияние проб по скважине для оценки блоков, близко расположенных к скважине.
Возможно, в этом есть смысл в определенных моментах, если Вы можете предоставить нам какую-либо документацию по этому поводу, мы рассмотрим добавление дополнительных опций в этот процесс.
Добрый день, Евгения! Смысл кросс-валидации, как вы и сказали, оценить параметры интерполяции. Но анизатропия свойств изучаемого параметра, отраженная в вариограммах, максимально проявляется при интерполяции в ячейку блочной модели расположенную на удалении от разведочных пересечений. Т.к. если ячейка расположена рядом с какими-то пробами, то их влияние практически перекрывает влияние закономерностей в распределении содержания в объеме домена. То есть, если мы хотим узнать, позволяют ли закономерности в пространственном распределении, описываемые вариограммами, корректно оценивать содержание на расстояниях, сопоставимых с разведочной сетью, то нам надо «выключать» влияние соседних проб на рассматриваемом пересечении. И если Вы добавите такую опцию, то это будет представлять практический интерес.
Хорошо, мы подумаем над этим!
Добрый день , Татьяна Олеговна!
То есть , как я понимаю, такое ограничение дает понимание ошибки интерполяции здесь и сейчас, т.е. в конкретной области, удаленной от соседней скважины на величину разведочной сети?
Позже, после интерполяции в ячейки модели, на флангах рудного тела в ячейках модели мы можем увидеть дисперсию, стандартную погрешность,коэффициент эффективности, линию регрессии для того же Кригинга.
В вашем предложении видно определенное "тонкое место". На кросс-валидации мы проверяем (кроме параметров поискового эллипсоида в меньшей степени) в основном параметры смоделированных теоритических вариограмм на основе экспериментальных, которые актуальны именно для того набора данных по рудному телу, которое использовалось. Исключив десяток, другой соседних проб мы существенно меняем выборку, соответственно вид экспериментальных вариограмм может меняться.
В литературе вот нашел пока следующие разновидности кросс-валидации. В ММ реализован вариант, когда из базы данных изымается одна точка и для нее проводится оценка значения. Это частный случай метода складного ножа . Далее текст из книги "Геостатистика. Теория и практика" (В.В.Демьянов,Е.А.Савельева):
Метод складного ножа (Jack-knife) является общим случаем кросс-валидации, когда оценивание производится не в одной , а в нескольких точках измерений, данные о которых предварительно изымаются из рассмотрения. Полученные в результате невязки анализируются (способ описан в тексте).Поскольку при джек-найфе изымается произвольный набор данных , комбинации этого набора варьируются, что делает этот метод стохастическим.
Бутстреп (bootstrap) состоит в оценке на основе случайных выборок из набора данных. Выборки делаются из исходного набора случайным образом. Выбранная точка не изымается , она может попасть в выборку несколько раз.Оценка производится по оставшимся не выбранными точкам. Обычно процедура выборки и оценки повторяется много раз.
Эти методы не реализованы в ММ, но они и не про регулярное (неслучайное) изъятие проб. Надо еще поизучать вопрос.