domingo, 8 de diciembre de 2019

Estadística Bayesiana

La estadística Bayesiana es una rama de la estadística que se considera casi como la rama opuesta a la estadística clásica. En estadística, un parámetro es una cantidad que no es conocida a priori pero se sabe que existe y tiene un valor, por ejemplo, el porcentaje de agua en la tierra. Sabemos que en la estadística clásica los parámetros se consideran constantes fijas que no cambian en el tiempo. Desde este punto de vista, el porcentaje de agua es una constante. Pero esta idea fue refutada por estadísticos que consideraban que los parámetros podrían funcionar bien si se comportaban como variables aleatorias. 

Entonces, ¿el porcentaje de agua de la tierra es una variable aleatoria?

Sí, desde el punto de vista de la estadística bayesiana, el porcentaje de agua sería una variable aleatoria con todas sus propiedades que la caracterizan (media, varianza, moda, ...). 

Un argumento para esta postura es que el agua en la tierra está cambiando constantemente, a causa del descongelamiento de los polos. Pero esto nos llevaría a pensar que en realidad la cantidad exacta de agua en la tierra sería imposible de conocer. Solo sería posible encontrar valores posibles para este valor.




lunes, 18 de noviembre de 2019

Introducción a las series de tiempo

Una serie de tiempo es una realización truncada de un proceso estocástico. También se puede definir por un conjunto de observaciones en intervalos regulares de tiempo (días, meses, años). Estas observaciones pueden tener distintas características, por ejemplo, puede ser que las observaciones se mantengan alrededor de un valor constante a través del tiempo (serie estacionaria) o puede ser que la serie presente una tendencia (positiva o negativa) en la cual se pueda evidenciar un comportamiento lineal. Otros tipos de observaciones son los que presentan comportamientos similares en intervalos de meses, por ejemplo, las series del clima, donde existe un patrón definido cada mes, dependiendo si es verano o invierno. Estas series tienen el nombre de series estacionales.

Un ejemplo de una serie no estacionaria es la siguiente:



La serie anterior representa los accidentes fatales ocurridos en España desde el año 2005 al 2018. Se puede observar que la serie no es estable en media ni varianza. Esto lleva a pensar que la serie es no estacionaria.

Para comprobar que la serie es no estacionaria se puede emplear una prueba de raíz unitaria llamada la prueba de Dickey-Fuller. Esta prueba de hipótesis tiene como hipótesis nula que la serie presenta una raíz unitaria. Utilizando el código en Python nos da la siguiente respuesta:

ADF Statistic: -2.025312
p-value: 0.275586
Critical Values:
 1%: -3.475
 5%: -2.881
 10%: -2.577
No rechazar Ho - La serie de tiempo no es estacionaria




martes, 11 de diciembre de 2018

¿Qué es la media?

Muchas veces nos hablan acerca de "el promedio" de algunos datos. Pero en realidad, ¿qué es lo que calculamos al encontrar el promedio?.

En un sistema físico bidimensional, cuando queremos encontrar el punto de equilibrio de alguna superficie rectangular que está cargada con varios pesos de masas diferentes, existe un solo punto donde la tabla permanecería totalmente horizontal. Este punto es conocido en mecánica como el centroide del cuerpo.

Ahora, si suponemos que tenemos una línea imaginaria y en ella colocamos números enteros, y estos números representan pesos de carga, existirá un punto en el que la línea permanecerá horizontal. Este punto se conoce en estadística como la media aritmética.


Sin ir más allá, veamos la fórmula con la que se calcula el promedio:







Según la fórmula, debemos sumar cada uno de los datos y luego dividir la suma por la cantidad de datos que tenemos. El resultado será lo que se conoce como media muestral. ¿Qué significa que sea media muestral? Significa que los datos provienen de una muestra, a diferencia del total de datos de la población.


En estadística inferencial, la media muestral es conocida como un estimador de la media poblacional. ¿Qué significa que sea estimador? Un estimador es una función de la muestra que se usa para encontrar un parámetro desconocido de la población. En la vida real es muy útil contar con estimadores debido a que casi nunca tenemos acceso a todos los datos de la población, y de esta manera, los estimadores juegan un papel importante en la estadística.