martes, 21 de agosto de 2012

Clase 3: Distribuciones de probabilidad en R-project

Distribuciones de probabilidad en R


En las entradas anteriores (Clase 1, Clase 2) comentamos que el análisis estadístico consta de tres partes: el análisis descriptivo, el probabilistico y el inferencial. Hemos abordado el primero en la Clase 2 y ahora nos centraremos en el análisis probabilístico.

Probabilidad y variables aleatorias.


La probabilidad refleja las expectativas de que un resultado (o suceso) determinado ocurra.
Para estudiar el comoprtamiento de estas probabilidades, se trabaja con variables aleatorias que  representan los posibles resultados de un experimento aún no realizado. Una variable aleatoria (v.a.) es una función que asocia a cada resultado de de un experimento (espacio muestral) un número real.

Tipos de variables aleatorias.

Podemos clasificar las v.a. en discretas y continuas según tomen valores discretos (números enteros) o continuos (números reales), respectivamente.

Función de probabilidad y función de distribución.

Las v.a. quedan caracterizadas por su función masa de probabilidad (caso discreto) o función de densidad de probabilidad (caso continuo), además de por su función de distribución, esperanza y varianza.
La función de densidad nos dice cómo se distribuyen las probabilidades de un suceso o evento, por tanto, la distribución de probabilidad de una v.a. es una función que asigna a cada valor posible de dicha v.a. una probabilidad. La función de distribución se puede entender como una función de probabilidad acumulada, es decir,  asocia a cada valor de la variable aleatoria la probabilidad acumulada hasta ese valor.



Con estos conceptos en mente, veamos ahora cómo aplicarlos en R.
Saludos!

 

###########################################################################
#                 An?lisis de datos con R                                 #
#                           2012                                          #
#                        Msc. Rosana Ferrero                              #
#             http://statisticalecology.blogspot.com/                     #
###########################################################################
# 3. Distribuciones de probabilidad                                 #
###########################################################################
 
### Funciones para distribuciones de probabilidad
 
     # Densidad de probabilidad (d): probabilidades puntuales P(X=x)
     # Probabilidades (p): probabilidades acumuladas P(X<=x) y P(X>x) si lower.tail=F
     # Quantiles (q): cuantiles (cola inferior) o cola superior si lower.tail=F. Recordar que los cuantiles pueden ser: cuartiles, deciles, percentiles
     # N?meros aleatorios (r):  Generaci?n de muestras aleatorias
 
  ### Distribuciones disponibles:
     # binom  Binomial
     # cauchy  Cauchy
     # chisq  Chi Cuadrado
     # beta  Beta
     # exp  Exponencial
     # gamma  Gamma
     # geom  Geom?trica
     # hyper  Hipergeom?trica
     # lnorm  Log-normal
     # logis  Log?stica
     # nbinom  Binomial negativa
     # nchisq  Chi cuadrado no central
     # norm  Normal
     # pois  Poisson
     # signrank  Distribucion del test de Wilcoxon de rangos con signo
     # t  Student
     # unif  Uniforme
     # weibull  Weibull
     # wilcox  Distribuci?n de la suma de rangos de Wilcoxon
 
 ### Ejemplo con la distribuci?n normal:
   rnorm(1)     # Generaci?n de un dato de la normal estandar
  #[1] -0.4120618
   rnorm(5)     # Generaci?n de 5 datos de la normal estandar
  #[1] -0.3220499 -0.5556478 -0.1899898 -0.3450181 -2.5807986
   rnorm(5,mean=1,sd=3)    # Generaci?n de un dato de una normal no estandar
  #[1] -0.4035896 -0.8089832  3.2513373  4.9641722 -1.8603231
 
   dnorm(0)  # Evaluaci?n de la funci?n de densidad normal en el punto 0
  #[1] 0.3989423
   dnorm(1)
  #[1] 0.2419707
  # dnorm(3)
  [1] 0.004431848
 
   pnorm(0)  # Probabilidad acumulada bajo la normal en el punto 0
  #[1] 0.5
   pnorm(3)
  # [1] 0.9986501
 
   qnorm(0.5)   # El cuantil 50% de la normal es el 0
  #[1] 0
   qnorm(0.9986501) # El cuantil 99.86501% de la normal es el 3
  #[1] 3.000000
 
   x=seq(-4,4,length=200)  # Dibujo del gr?fico de la distribuci?n normal
   plot(x,dnorm(x),type="l")
 
 
#Generaci?n de 100 datos de una normal estandar, y un sumario de los mismos:
   x = rnorm(100)
   summary(x)
  #    Min.  1st Qu.   Median     Mean  3rd Qu.     Max.
  #-2.18000 -0.71000 -0.01041  0.05584  0.73730  2.76500
 
  #Generaci?n de dos muestras correladas, y c?lculo de la correlaci?n:
   x = seq(1:10)
   y = 2*x+rnorm(10)
   cor(x,y)
  #[1] 0.9817436
 
  #Creaci?n de permutaciones:
   sample(10)
   #[1]  5  6  1  4  9  2  8 10  7  3
   sample(10)
   #[1]  9  1  3 10  7  2  5  4  8  6
 
  #Muestreo sin repetici?n:
   sample(1:10,5)
  #[1] 7 8 2 4 6
 
  #Muestreo con repetici?n: ej. Simulaci?n de 5 tiradas de un dado equilibrado.
   sample(1:10,5,rep=T)
  #[1]  6 10  6  1  6
 
  #C?lculo de algunos percentiles de un conjunto de datos:
   x = rnorm(200)
   quantile(x,probs=c(0.1,0.4,0.9))
  #       10%        40%        90%
  #-1.3194786 -0.3663511  1.0824184

No hay comentarios:

Publicar un comentario

Libros para descargar (gratis) sobre Estadística Computacional