+4

Логнормальное преобразование

Евгения (Moderator / Admin (RUS)) 9 years ago in Micromine / Статистика updated 6 years ago 5
Image 274
Данные могут иметь нормальное и ассиметричное распределение. Мы можем количественно определить ассиметрию, используя два простых метода:
Ассиметрия = (среднее - мода) / стандартное отклонение
Ассиметрия = 3 х (среднее - мода) / стандартное отклонение
В обоих методах положительные результирующие значения означают положительную ассиметрию, а отрицательные - отрицательную.
Тем не менее, реальные данные не всегда поддаются такой закономерности, поэтому нельзя исключать визуальную проверку графика.
Концентрация множества элементов земной коры представляет собой положительную ассиметрию, с длинным хвостом с правой стороныи коротким - с левой. Драгоценные металлы, среднее содержание по которым ниже, чем медиана и мода, но высокое стандартное отклонение, часто обладают таким распределением.
Если вы наблюдаете  положительную ассиметрию по вашим данным, наложение модели нормального распределения (колокол) дает слабое соответсвие с вашими данными. Например, возможно, что  минус первое стандартное отклонение по вашим данным будет отрицательным, что является невозможным для данных опробования, а второе стандартное отклонение и вовсе вышло за пределы графика влево.
В этом случае необходимо применять логнормальное преобразование, оно продлит гистограмму в низких содержаниях, сократит -  в высоких, в результате график будет больше подходить под нормальное распределение.
Логнормальное распределение - переменные имеют нормальное распределение, если натуральных логарифм этих значений имеет нормальное распределение.
В Micromine логнормальное преобразование осуществляется через функцию Используемыме значения в диалоговом окне статистика распределения.
Ниже приведет рисунок, показывающий результат применения логнормального преобразования данных. обратите внимание, что ось Х на втором графике имеет логорифмических масштаб.
Image 275


После того, как данные подверглись логнормальному преобразованию, значения арифметического среднего, дисперсии и стандартного отклонения являются бесполезными. При применении логнормального преобразования используйте значения геометрического среднего и сишеля.
Другие элементы, содержащиеся в земной коре, могут иметь отрицательную ассиметрию с длинным левым хвостом и коротким правым. Тем не менее, в Micromine нет прямого преобразования для таких данных.

Таким образом, используйте логнормальное преобразование, если:
 - Визуальное исследование графика показало положительную ассиметрию
- При количественном подсчете ассиметрии, вы получили отрицательное значение, или значение, выше чем 1
- Максимальное значение в наборе данных выше, чем среднее в 100 раз
+4

Информация в Статистике Распределения

Image 230

Данное информационное окно можно найти в меню графика гистограмм:

Image 231

Минимальное значение - самое маленькое значение из ваших данных

Максимальное значение - самое высокое значение среди ваших данных

2-е наибольшее; 3-е наибольшее; 4-е наибольшее - второе, третье и четвертое наибольшее значение среди ваших данных. Если эти значения намного меньше, чем максимальное (наибольшее) значение, необходимо применить урезку ураганов для ваших данных до начала процесса моделирования. 

Количество - количество проб (данных), участвующих в построении гистограммы.

Среднее - арифметическое среднее.

Дисперсия - среднее значение из суммы всех квадратов отклонений от СРЕДНЕГО.

Стандартное отклонение - квадратный корень из дисперсии.

Коэффициент вариации - COV, стандартное отклонение, разделенное на среднее.

Медиана - срединное значение набора данных, упорядоченных в возрастающем или убывающем порядке.

Ln среднее - арифметическое среднее из логнормально преобразованных данных (натуральный логарифм).

Ln стд отклонение - стандартное отклонение логнормально преобразованных данных (натуральный логарифм).

Геометрическое среднее - альтернативный способ расчета среднего, который уменьшает эффект очень больших или очень маленьких значений, в расчете используется Ln среднее.

Геом. стд. отклонение - альтернативный способ для расчета стандартного отклонения. В расчете используется Ln стд отклонение.

Обычно, геометрическое среднее рассчитывается путем перемножения n-го количества значений, а затем извлечения корня n-ной степени из результата.

Оценочная функция Сишеля - альтернативный способ расчета среднего из логнормально распределенных данных.

V Сишеля - альтернативный способ для расчета дисперсии из логнормально распределенных данных. 

Гамма Сишеля - фактор поправки на смещение, использующийся при расчете оценочной функции Сишеля.

Хи квадрат тест - значение определяющее насколько исходные данные соответствуют  колоколообразной нормальной кривой. 

Степень свободы - также, как и Хи квадрат тест, определяет насколько данные соответствуют нормальному распределению. Есть правило, что если Хи квадрат меньше Степени свободы + 25%, можно сделать вывод, что данные соответствуют нормальному распределению. 

Теоретически, чем меньше значение Хи квадрат теста, тем лучше, но данный параметр становится бесполезным, если используется большое количество бинов, которое необходимо для создания хорошего графика.






0

Относительная вариация

Сергей Дроздов 1 month ago in Micromine / Статистика updated by Stepan (Moderator (RUS)) 1 month ago 1

Коллеги, добрый день. При построении парных относительных вариограмм можно вывести линию дисперсии (в данном случае - отн вариация). эта линия всегда значительно выше графика

Image 3803

при этом, при вычислении обычных вариограмм линия дисперсии проходит примерно на уровне графика

Image 3804

Скажите пожалуйста, что за величина "относительная вариация" и как она рассчитывается?

0

Статистика по блочной молдеи

Nikita 7 months ago in Micromine / Статистика updated 7 months ago 5

Всем доброго времени суток, подскажите пожалуйста возможно ли, при наличии только данных блочной модели, определить бортовые содержания с помощью приемов геостатистики, если да поделитесь пожалуйста методой. если нет прошу прощения за некорректный вопрос.

0

PCA, Clustering - примеры использования

azagoskin 8 months ago in Micromine / Статистика updated 8 months ago 2

Здравствуйте! 


Есть ли какие-то методички или примеры использования инструментов PCA, Clustering на наборах мультиэлементных данных? Пока на интуитивном уровне пытаюсь применять эти инструменты для разбраковки пород по главным компонентам, но буду рад любым примерам использования, особенно в части настроек форм - например, как отобрать наиболее значимые поля для анализа и т.п.

Кстати, пока в Clustering работает только метод K-means, остальные на моем наборе данных обваливают программу.

Заранее спасибо!

0

Карта вариограмм

Владимир Марков 10 months ago in Micromine / Статистика updated 9 months ago 4

Приветствую всех пользователей Micromine.

Если я правильно понял, первая карта вариограмм - это аналог горизонтального веера вариограмм. Найденное на этой карте направление наименьшей изменчивости - это простирание вертикальной плоскости, в которой лежит первая ось. Поэтому азимут погружения первой оси должен быть таким же, как и одно из простираний этой плоскости. В контрольном файле вариограмм этот азимут другой. Вопрос: азимут и погружение какой оси даны в контрольном файле (на левом рисунке)?  И, если на правом рисунке азимут простирания и погружение соответствуют главной оси, то непонятно, как рассчитали угол погружения и как получить две другие оси так, чтобы все 3 были взаимно перпендикулярны.

Image 3390

0

График содержаний вниз по скважине по нескольким элементам

azagoskin 2 years ago in Micromine / Статистика updated by Stepan (Moderator (RUS)) 2 years ago 7

Коллеги, подскажите, какой график лучше подойдет для отображения содержаний нескольких элементов вниз по скважине? (поля XYZ имеются, можно также использовать depth From- Depth to). Пример графика ниже:


Image 2992

0

Применение макроса для функции Chart Presentation Layout

azagoskin 2 years ago in Micromine / Статистика updated by Евгения (Moderator / Admin (RUS)) 2 years ago 3

Здравствуйте! подскажите пожалуйста, как совместить создание графиков через макрос и Chart Presentation Layout?

Если выбрать форму графика в этом окне, которая относится к макросу (с подстановочными параметрами вида %1,%2, etc), то Layout очевидным образом не находит точек для построения графика, т.к. не знает подстановочных параметров. Подозреваю, что нужно будет Presentation Layout прописать в макросе?

Заранее спасибо

Image 2588

0

Вебинар по статистическим графикам в ММ

Levina Yevgeniya 3 years ago in Micromine / Статистика updated 3 years ago 2

Здравствуйте!  

Большое спасибо Евгении Шульге за интересный вебинар. Почерпнула много полезного.

Евгения, не  могли бы Вы поделиться  теорией квантильного анализа. Если есть на русском языке. Заранее благодарна!

 

0

Вариограмма или относительная парная вариограмма (или их аналоги) ?

Станислав 6 years ago in Micromine / Статистика updated 6 years ago 2

Во многих ггис есть для анализа опции вариограммы, логвариограммы, нормализованной вариограммы, парной относительной.


Хотелось бы понять, важно ли для кригинга какой из типов ВГ использовался для подбора моделей. Поясню мысль. Например, есть двуструктурная ВГ с каким-то самородком. Её можно описать как в относительных выражениях - самородок - 50% общей дисперсии, 1 структура - 30%, вторая - 20%. А можно в абсолютных, т.е. для случая приведённого выше при общей дисперсии, скажем, 3 это будет: самородок - 1.5, 1 структура - 0.9, вторая - 0.6.


Так вот, при интерполяции (при прочих равных условиях) имеет значение только структура изменчивости (т.е. процентное соотношение вклада каждой структуры) или абсолютные цифры самородка и силлов также важны? Если важны, разве не могут быть они вычислены из структурных соотношений и известной общей дисперсии?


Вопрос не праздный, т.к., например, при Uniform Conditioning, который, я надеюсь, появится в ММ в период нашей технической поддержки (ну, почему бы и не помечтать :) ) разрешено использовать только обычные вариограммы. Не нормализованные, не относительные парные. 


Как дело обстоит в обычном кригинге?