INTRODUCCIÓN A LA ESTADÍSTICA APLICADA CON EL PROGRAMA R

Curso impartido en el CONSEJO SUPERIOR DE INVESTIGACIONES CIENTIFICAS

Madrid, Mayo de 2022

Luis M. Carrascal

    Dept. Ecología Evolutiva

Museo Nacional de Ciencias Naturales - CSIC

    C/ José Gutiérrez Abascal, 2. 28006 Madrid. SPAIN

 

 

TEMARIO:

TIPOS DE DISTRIBUCIONES: Normal (Gaussiana), Gamma, Poisson, Binomial Negativa, Binomial, Multinomial

 

PRIMEROS PASOS EN R: importar tablas de datos, vectores, matrices de datos

   aleatorización y re-ordenación de matrices

   entorno de trabajo, consola, plots

 

ESTADISTICOS BÁSICOS: centrales y de dispersión, percentiles, tablas de significación

 

INTERVALOS DE CONFIANZA: paramétricos gausianos; no paramétricos (percentiles por bootstrapping)

 

ERRORES DE TIPO I, II. POTENCIA DE LOS TESTS: experimentos numéricos con errores

 

MODELOS GENERALIZADOS: generalidades; construcción de modelos

 

VALORACIÓN DE LOS RESIDUOS DEL MODELO: normalidad; heterocedasticidad; puntos influyentes y perdidos

    

RELACIONES ENTRE LAS VARIABLES PREDICTORAS:

   exploraciones visuales

   independencia entre los predictores y VIF (variance inflation factor)

 

TRANSFORMACIONES DE LA RESPUESTA Y MODELOS GENERALES LINEALES:

   logarítmica, raíz cuadrada, arcoseno

   transformación de rangos

   transformación de Box-Cox (automatizada)

 

RESULTADOS DEL MODELO:

   omnibus test

   comparación del modelo nulo con el de interés mediante Akaike AICc

   relación entre lo observado y lo predicho

   variación total explicada (pseudo-R2)

   tabla de coeficientes: su interpretación

   estima de significación de efectos y partición de la varianza-devianza: tipos I, II y III

 

PARTICIÓN DE LA VARIABILIDAD DE LA RESPUESTA ENTRE EFECTOS DE PREDICTORES

 

EXPLICACIÓN  vs. PREDICCIÓN: ¿CUÁL ES EL PODER PREDICTIVO DEL MODELO?

 

AFRONTANDO LA VIOLACIÓN DE LA HOMOCEDASTICIDAD DE LOS RESIDUOS:

   corrección de la matriz de varianzas-covarianzas HC0, HC1, HC2, HC3, HC4, HC4m, HC5

 

CÓMO TRATAR LOS DATOS INFLUYENTES Y/O PERDIDOS: ESTIMAS ROBUSTAS

 

SOBREDISPERSIÓN: CÓMO Y A QUÉ TRATARLA

 

PARTICULARIDADES DE LOS MODELOS GENERALIZADOS CON BINOMIALES:

   interpretación de los coeficientes (odds ratios)

   AUC y diagramas ROC (especificidad, sensitividad, npv, ppv, umbral de corte óptimo)

   caso especial de las variables respuestas multinomiales

 

REDUCCIÓN DE LA COMPLEJIDAD DE LOS MODELOS:

   comparación de modelos de interés utilizando la teoría de la información

   selección del subconjunto más parsimonioso de predictores

 

INFERENCIA MULTIMODELO Y MODEL AVERAGING:

   gestión de los resultados de modelos ambivalentes con similar fuerza de la evidencia

   promedio de varios modelos en función de la fuerza de su evidencia 

  

 

MATERIALES DEL CURSO 

 

Presentación del profesor 

    [documento pdf]

 

Scripts comentados

Distribuciones de variables

Manejando vectores y estadísticos básicos

Intervalos de confianza

Significación y potencia; errores de tipo I y II

Construcción de modelos generalizados lineales

Valoración de los residuos del modelo

Resultados del modelo

Bootstrapping del modelo

Validación cruzada del modelo

Estimaciones robustas del modelo

Modelos glmmTMB

Comparación de modelos; inferencia multimodelo

 

 

 

Listado de comandos básicos en R

    R Reference Card

    A short list of the most useful R commands

    A short list of some useful R commands

    Table of Useful R commands

    Comandos para regresiones y estadística básica

  

  

 

Actualización: 10/15/2022