[MUSIC] En esta sesión estaremos hablando de las pruebas de hipótesis. Una parte muy útil de la estadística y de la diferencia estadística son las pruebas de hipótesis. Básicamente una hipótesis estadística es una afirmación, generalmente una suposición o conjetura, respecto de alguna característica desconocida de la población. Es decir, de algunos de los parámetros poblacionales, los que veremos son el caso de la media poblacional y la proporción poblacional. Algunos ejemplos. Un legislador afirma que el ingreso medio de la población es de al menos 8,000 pesos mensuales. Es decir, en realidad es una hipótesis que se está formulando respecto de el ingreso medio poblacional. La proporción de ciudadanos dispuestos a seguir apoyando al gobierno de turno en las próximas elecciones es del 65%. Nuevamente, esta es una afirmación respecto de otra característica poblacional, que es la proporción. Entonces, lo que hacemos es buscar hipótesis para decidir si la afirmación que se está realizando se encuentra apoyada o no por la evidencia empírica. Entonces, las pruebas de hipótesis se realizan respecto a los parámetros poblacionales. Utilizaremos información muestral para evaluar si la evidencia empírica valida o no dichas hipótesis. Vamos a ver pruebas de hipótesis para la media poblacional mu, y para la proporción poblacional p. Para ello, es necesario introducir primero algunos conceptos básicos. Por un lado, lo que se llama la hipótesis nula y la hipótesis alternativa, que se denota como H sub 0 o H sub 1. Es decir, la idea es formular la afirmación que se está haciendo en un escenario dicotómico, es decir, el caso en el que ocurre o no ocurre aquella hipótesis que se está planteando. Es decir, el ingreso medio de los ciudadanos de ese país es mayor o igual a 8,000 pesos, o es menor a 8,000 pesos. Es decir, la hipótesis nula y alternativa tienen que ser mutuamente excluyentes entre sí. Posiblemente las decisiones que pueden tomarse respecto de la hipótesis nula, va de vuelta esta parte. Lo que uno hará es construir a partir de los datos de la muestra un estadístico, que permitirá tomar una decisión respecto de la hipótesis nula, la de rechazar o no rechazarla. Lo que sucede es lo siguiente, es que uno nunca sabe si la hipótesis nula es verdadera o es falsa, you que no observamos el parámetro poblacional. Pero la evidencia empírica me dará razones suficientes o no para rechazarla. Entonces, imaginemos el siguiente caso. Imaginemos que la hipótesis nula es realmente verdadera. La información muestral puede llevarte a rechazar la hipótesis nula siendo verdadera. Si ese es el caso, estoy cometiendo un error que vamos a llamar error de tipo 1, o nivel de significación del test, el alfa. O puede ser que la información muestral me lleve a no rechazar la hipótesis nula siendo verdadera. Si ese es el caso, estoy tomando una decisión correcta que vamos a llamar nivel de confianza del test, o 1- alfa. O alternativamente puede suceder que la hipótesis nula que se está planteando en realidad es falsa, aunque no lo sea. Pero la información muestral puede llevarte a rechazar la hipótesis nula siendo falsa, en cuyo caso estoy tomando una decisión correcta, y eso se conoce como la potencia del test, o 1- beta. O puede suceder que la información te lleve a no rechazar la hipótesis nula siendo falsa, caso en el cual voy a estar cometiendo un error que se llama error de tipo 2, o el beta. Bien, pueden notar you que no podemos cometer ambos errores a la vez. ¿Por qué? Porque la hipótesis nula o es verdadera o es falsa, aunque eso no lo sé. Entonces, ¿qué es lo que se hace generalmente en la práctica? Lo que se realiza es lo siguiente, se fija el error de tipo 1 o nivel de significación del test en un valor determinado. Los valores usuales son 1%, 5% o 10%, dependiendo de cómo querramos que sea la probabilidad de rechazar la hipótesis nula siendo verdadera. Un poco de humor. Aunque en este caso, es un caso de ex-post, you que aquí realmente sabemos si la hipótesis nula, la de no estar embarazada o embarazado, es verdadera o falsa. Pero esto es como para que vean cómo se puede entender también el error de tipo 1 y error de tipo 2 como los famosos falso positivo y falso negativo. Sería el caso decirle a un hombre que está embarazado o el caso de decirle a una mujer embarazada que no lo está. Entonces, una prueba de hipótesis con respecto a una característica desconocida de la población, es una regla para decidir si se rechaza o no la hipótesis nula, y la decisión va a estar basada en un estadístico. you habíamos definido qué era un estadístico, era una función en base a información muestral. Para ciertos valores de este estadístico, la decisión va a ser de rechazar la hipótesis nula. Estos valores se conocen como valores críticos, y van a determinar lo que se conoce como la región crítica del test, o región de rechazo del test. Entonces, una prueba de hipótesis tiene una estructura de pasos lógicos. El primer paso es la formulación de la hipótesis a contrastar. El segundo paso es establecer el nivel de significación del test, es decir, el error de tipo 1 con el que estamos dispuestos a trabajar. Tercero, el cálculo del estadístico de contraste en base a información muestral. Cuarto, la regla de decisión del test. Y por último, la conclusión del mismo.