Secuencia de Análisis de Datos Geoquímicos

Entre la bibliografía sobre análisis de datos geoquímicos, uno de los más importantes es "The Evaluation of Geochemical Survey Data: Data Analysis and Statistical Methods Using Geographic Information Systems" realizado por Eric C. Grunsky como un capítulo en la publicación 'GAC's Special Paper 44: "GIS For the Earth Sciences" editted by Dr. Jeff Harris'. Lo siguiente es el extracto de su secuencia de trabajo.

Análisis Preliminar de Datos

  • Examinar cada elemento con histogramas, boxplots, q-q plots, scatter plots y tablas de resúmenes: 35 elementos.
  • Mapas de elementos mostrando rangos de valores usando burbujas o puntos símbolos. Imágenes interpoladas pueden ser usadas donde es apropiado.
  • Recortar la distribución de cada elemento por "outliers".
  • Investigar los "outliers" por cada elemento; ¿error analítico o valor atípico?
  • Ajustar datos por valores censurados si es requerido.
  • Si las medidas de asociación son requeridas (correlaciones, covarianzas) a lo largo con estimados robustos de estas medidas, entonces transformarcada elemento usando transformaciones de poder Box-Cox usando observaciones bajo el percentil 95th-98th. Esto depende de examen visual preliminar de los q-q plots e histogramas. Aplicar transformaciones log-ratio o log-centred para eliminar los efectos de cierre1.
  • Examinar scatter plots y plots cuantil-cuantil para la presencia de poblaciones multiples.
  • Si se ensambla conjuntos de datos, examinar los requerimientos de “levelling”

Análisis Exploratorio de Datos Multivariados

  • Crear un matriz de plots para datos transformados. Mirar por asociaciones/tendencias.
  • Usar estimados robustos para computar medias y covarianzas para mejorar la detección de "outliers".
  • La aplicación de técnicas de reducción de dimensiones como el análisis de componentes principales puede identificar patrones y tendencias en los datos.
  • Los mapas geográficos de las cargas componentes puede asistir en la identificación de procesos geoquimicos espaciales.
  • Los métodos como análisis de cluster aíslan grupos de observaciones con características similares y observaciones atípicas. Grupos específicos de interés puede frecuentemente ser aislados usando estos métodos. Los mapas de ubicaciones de los grupos pueden ayudar a examinar la continuidad espacial de los grupos.
  • El uso de los plots de distancia Malahanobis (D2) aplicados a datos transformados pueden asistir en aislar "outliers" basados en un numero seleccionado de elementos de interés. Los mapas de grandes distancias (>95th percentil) puede asistir en identificar observaciones o grupo de elementos de observaciones de interés.
  • El calculo de indices empíricos de cola pueden ser útiles en áreas donde las asociaciones de multielementos son bien comprendidos. Los indices están basados en la combinación lineal de elementos “pathfinders” con coeficientes que son seleccionados para cada área y “commodity” siendo observada. Las observaciones con altos indices pueden ser investigados para potencial de mineralización.

  1. datos composicionales (Nota propia)

No hay comentarios.:

Publicar un comentario