INTRODUCCIÓN A LA ESTADÍSTICA APLICADA CON EL PROGRAMA R
Curso impartido en el CONSEJO SUPERIOR DE INVESTIGACIONES CIENTIFICAS
Madrid, Mayo de 2022
Dept. Ecología Evolutiva
Museo Nacional de Ciencias Naturales - CSIC
C/ José Gutiérrez Abascal, 2. 28006 Madrid. SPAIN
TEMARIO:
TIPOS DE DISTRIBUCIONES: Normal (Gaussiana), Gamma, Poisson, Binomial Negativa, Binomial, Multinomial
PRIMEROS PASOS EN R: importar tablas de datos, vectores, matrices de datos
aleatorización y re-ordenación de matrices
entorno de trabajo, consola, plots
ESTADISTICOS BÁSICOS: centrales y de dispersión, percentiles, tablas de significación
INTERVALOS DE CONFIANZA: paramétricos gausianos; no paramétricos (percentiles por bootstrapping)
ERRORES DE TIPO I, II. POTENCIA DE LOS TESTS: experimentos numéricos con errores
MODELOS GENERALIZADOS: generalidades; construcción de modelos
VALORACIÓN DE LOS RESIDUOS DEL MODELO: normalidad; heterocedasticidad; puntos influyentes y perdidos
RELACIONES ENTRE LAS VARIABLES PREDICTORAS:
exploraciones visuales
independencia entre los predictores y VIF (variance inflation factor)
TRANSFORMACIONES DE LA RESPUESTA Y MODELOS GENERALES LINEALES:
logarítmica, raíz cuadrada, arcoseno
transformación de rangos
transformación de Box-Cox (automatizada)
RESULTADOS DEL MODELO:
omnibus test
comparación del modelo nulo con el de interés mediante Akaike AICc
relación entre lo observado y lo predicho
variación total explicada (pseudo-R2)
tabla de coeficientes: su interpretación
estima de significación de efectos y partición de la varianza-devianza: tipos I, II y III
PARTICIÓN DE LA VARIABILIDAD DE LA RESPUESTA ENTRE EFECTOS DE PREDICTORES
EXPLICACIÓN vs. PREDICCIÓN: ¿CUÁL ES EL PODER PREDICTIVO DEL MODELO?
AFRONTANDO LA VIOLACIÓN DE LA HOMOCEDASTICIDAD DE LOS RESIDUOS:
corrección de la matriz de varianzas-covarianzas HC0, HC1, HC2, HC3, HC4, HC4m, HC5
CÓMO TRATAR LOS DATOS INFLUYENTES Y/O PERDIDOS: ESTIMAS ROBUSTAS
SOBREDISPERSIÓN: CÓMO Y A QUÉ TRATARLA
PARTICULARIDADES DE LOS MODELOS GENERALIZADOS CON BINOMIALES:
interpretación de los coeficientes (odds ratios)
AUC y diagramas ROC (especificidad, sensitividad, npv, ppv, umbral de corte óptimo)
caso especial de las variables respuestas multinomiales
REDUCCIÓN DE LA COMPLEJIDAD DE LOS MODELOS:
comparación de modelos de interés utilizando la teoría de la información
selección del subconjunto más parsimonioso de predictores
INFERENCIA MULTIMODELO Y MODEL AVERAGING:
gestión de los resultados de modelos ambivalentes con similar fuerza de la evidencia
promedio de varios modelos en función de la fuerza de su evidencia
MATERIALES DEL CURSO
Presentación del profesor
Scripts comentados
Manejando vectores y estadísticos básicos
Significación y potencia; errores de tipo I y II
Construcción de modelos generalizados lineales
Valoración de los residuos del modelo
Estimaciones robustas del modelo
Comparación de modelos; inferencia multimodelo
Listado de comandos básicos en R
A short list of the most useful R commands
A short list of some useful R commands
Comandos para regresiones y estadística básica
Actualización: 10/15/2022