Brian May - Too Much Love Will Kill You, Un monumental astrofísico músico

                             Brian May - Too Much Love Will Kill You


I'm just the pieces of the man I used to be
Too many bitter tears are raining down on me
I'm far away from home
And I've been facing this alone for much too long 

Oh, I feel like no-one ever told the truth to me
About growing up and what a struggle it would be
In my tangled state of mind
I've been looking back to find where I went wrong 

Too much love will kill you
If you can't make up your mind
Torn between the lover and the love you leave behind
You're headed for disaster 'cos you never read the signs
Too much love will kill you every time 

I'm just the shadow of the man I used to be
And it seems like there's no way out of this for me
I used to bring you sunshine
Now all I ever do is bring you down, oooh
How would it be if you were standing in my shoes
Can't you see that it's impossible to choose
No there's no making sense of it
Every way I go I'm bound to lose, oh yeah 

Too much love will kill you
Just as sure as none at all
It'll drain the power that's in you
Make you plead and scream and crawl
And the pain will make you crazy
You're the victim of your crime
Too much love will kill you every time 

Yeah too much love will kill you
It'll make your life a lie
Yes too much love will kill you
And you won't understand why
You'd give your life you'd sell your soul
But here it comes again
Too much love will kill you
In the end - In the end
http://www.brianmay.com/

http://www.tate.org.uk/context-comment/video/tateshots-poor-mans-picture-gallery-brian-may

Un cuento: 
Hace algunos años, allá por el siglo pasado, estaba tan enamorada de un chico que no podía ver más allá de sus ojos. De echo mis ojos no existían. Respiraba por ese chico, vivía por ese chico, rezumaba vida por ese chico. Los avatares de la vida nos pusieron en situación de tomar decisiones, algunas vanas y rápidas, otras decisivas y escalofriantes. Pero el día que decidí por mi misma no lo olvidaré mientras que mi sistema cognitivo siga vigente. Recién casadita, algo que por la zona de Valencia se llama novensana, se me antojaba que mi chico era todavía más guapo que nunca, más sabio, más eficaz, más eficiente, en resumen "más todo"..... Hasta el día que vino con una pequeñísima bolsita con un contenido blanco en el interior, y por sus gestos me indicaba que no lo molestase. Le pregunté qué hacía, qué iba a hacer con eso, qué planes tenía en la cabeza. Con la misma eficacia que yo pensaba que tenía mi recién novensano me dijo que no le molestase, que yo no tenía ni idea y que lo dejase tranquilo.
En ese mismo instante sentí en mi cómo mis pies absorbían una energía terrenal arcana, algo me indicaba que eso no era así. Muy tranquila le dije:
-Claro el delito lo está cometiendo tú y tienes la cobardía de decirme que yo no tengo ni idea, saca ahora mismo eso de aquí si no quieres que vaya a la comisaría a denunciarte, una cosa es que los fines de semana seas tan sumamente gilipoyas como para gastarte dinero en esos polvitos con la creencia que gozarás más de la vida, si eres idiota, bueno yo me he enamorado de un idiota, pero lo que no voy a consentir delante de mi que te hagas el hombre porque estés cortando con glucosa vete tu a saber lo que te habrán vendido como coca. Cobarde que eres un cobarde y ahora lo quitas de en medio o soplo.... 
Casi treinta años después, pienso en todos los consumidores de cocaína que tienen que tomar decisiones a gran nivel, banqueros, trabajadores en bolsa, ingenieros, médicos, y todas las redes sociales de las comunidades estatales. Nadie les dijo en su momento, deja eso o soplo..... Ahora con unos cerebros en un primer momento privilegiados y ahora con el paso del consumo deteriorados y marchitos..... ¿quién les soplará?.... ¿Deep Web?

Continuación: Estimación de parámetros y contraste de hipótesis ....

Varianza poblacional conocida
En estas circunstancias sabemos que la distribución muestral de la media es normal con media, y desviación típica (o error típico de la media) igual a la desviación típica poblacional dividida por la raíz cuadrada de n:

Se trata, por tanto, de determinar dos valores que definen un intervalo dentro del cual estimamos que se encontrará la media poblacional, con una determinada probabilidad, que se denomina nivel de confianza.
Teniendo en cuenta las propiedades de la distribución normal si, por ejemplo, fijamos un nivel de confianza del  o del 95%, sabemos que entre los valores:
  •  Z= -1,96 y Z=+1,96 a izquierda y derecha de la media de la distribución muestral
Se encuentran el 95% de las medias de cualquier muestra.

Es decir, en 95 de cada 100 muestras la media de la muestra, se encontrará comprendida entre las puntuaciones típicas:
 Nuestro interés se centra en estimar el parámetro poblacional, a partir del estadístico de la muestra, que es un valor conocido. Para ello, de la expresión anterior  tendríamos que despejar el valor de μ, y llegaríamos a:
El intervalo de confianza se construye sumando y restando a la media de la muestra una cantidad que define el error máximo de estimación con un nivel de confianza del 95%, en este caso, y que representa la máxima diferencia que puede existir entre el estimador y el parámetro a estimar, en el caso de la media aritmética la diferencia entre: 
A continuación se representa la distribución de probabilidad de las medias obtenidas al extraer todas las posibles muestras de tamaño n que se pueden extraer de una población.
Varianza poblacional desconocida
En la práctica estadística no es frecuente que se conozca la varianza poblacional. Lo habitual es desconocer tal dato que tendremos que estimar a partir de la varianza o cuasivarianza de la muestra como un estimador de la varianza poblacional. En estas circunstancias la distribución muestral de la media es la distribución t de Student y, por tanto:
De acuerdo con ese mismo razonamiento, el intervalo de confianza de la media poblacional es:
La diferencia ahora es que utilizamos la distribución t como distribución muestral de la media, por lo que el error máximo de estimación es:
Los valores de t son los que dejan un intervalo central correspondiente a una probabilidad de uno menos alpha. Puesto que la varianza poblacional es desconocida, hay que estimarla a partir de su estimador (sesgado o insesgado) por lo que el error típico de la media, es:
Quedando el error máximo de estimación de la siguiente forma:
Según se utilice la cuasi-desviación típica de la muestra (su estimador insesgado), en el primer caso, o la desviación típica de la muestra (estimador sesgado) en el segundo caso.
Ejemplo 1.4. En un experimento sobre atención, un psicólogo presenta durante 300 mseg un grupo de 16 letras del alfabeto (con una disposición de 4 filas y 4 columnas). Cada uno de los 12 sujetos que participan en el experimento debe verbalizar tantas letras como recuerde de cada presentación estimular. El promedio de letras bien recordadas es de 7 y la desviación típica insesgada (cuasi-desviación típica) es de 1,3. Asumiendo que la distribución en la población es normal (necesitamos este supuesto, porque la muestra es pequeña). ¿Entre qué límites se encontrará el verdadero promedio de palabras bien recordadas, con una probabilidad de 0,95?
Se asume que la distribución poblacional es normal con varianza desconocida, y la muestra es pequeña, por lo que la distribución muestral de la media es la t de Student.

En la distribución t de Student con 11 gl (grados de libertad), buscamos los valores que dejan en la zona central una probabilidad de 0,95. Estos valores son -2,201 y +2,201 que se incluyen en la expresión general:

Varianza poblacional desconocida (n>100). 
En este caso, en teoría seguimos trabajando con una distribución t de Student con    n-1 grados de libertad, pero conociendo las propiedades de esta distribución, sabemos que cuanto mayor sea el valor de los grados de libertad, más se aproxima la distribución t a la distribución normal. En las tablas que manejamos, podemos consultar valores en distribuciones t hasta cien grados de libertad.
Para valores superiores a dichos grados de libertad podemos considerar que las diferencias entre los valores Z y t son prácticamente despreciables, por lo que utilizaremos los valores Z de las tablas de curva normal, en sustitución de los valores t, cuando las muestras tengan un tamaño de  n>100.

Ejemplo 1.5. En un experimento sobre atención, un psicólogo presenta durante 300 mseg un grupo de 16 letras del alfabeto (con una disposición de 4 filas y 4 columnas). Cada uno de los 122 sujetos que participan en el experimento debe verbalizar tantas letras como recuerde de cada presentación estimular. El promedio de letras bien recordadas es de 7 y la desviación típica es de 1,3. ¿Entre qué límites se encontrará el verdadero promedio de palabras bien recordadas, con una probabilidad de 0,95?
Aunque se trata de una distribución t, buscamos los valores que dejan en la zona central una probabilidad de 0,95 en la tabla Z, porque  n>100
Estos valores son   -1,96 y +1,96 que se incluyen en la expresión general:

Al buscar en el interior de la tabla Z, procedemos de la siguiente forma:
Buscamos en el interior de la tabla el valor 0,975 y vemos que se encuentra en la intersección de la columna primera con un valor de 1,90 y la primera fila con un valor de 0,06.El número 0,975 corresponde a la probabilidad central del área de la curva, las colas suponen el 0,025/2.

La interpretación correcta del intervalo de confianza es que dentro de él se encontrará, o no, el verdadero valor del parámetro, pero nos permite afirmar que si repitiésemos el proceso con muchas muestras del mismo tipo y tamaño, en una proporción igual a uno menos alpha los intervalos así construidos contendrán al verdadero valor del parámetro (promedio de palabras recordadas en la población). 
Esta interpretación es la que hay que mantener para todo intervalo de confianza de cualquier otro parámetro poblacional que vayamos a estimar, no cayendo en el error de interpretarlo en el sentido de que:
  • una proporción de personas igual a  uno menos alpha –en este ejemplo, el 95% de las personas- tienen un promedio de palabras recordadas comprendido entre 6,768 y 7,232.
Intervalo de confianza para la proporción
Sabemos que la distribución muestral de la proporción es una distribución binomial que se aproxima a la normal cuando se utilizan muestras grandes.

Bajo estas condiciones, la distribución muestral de la proporción es normal con media y error típico iguales a:
Cuando la proporción poblacional, π, es un valor desconocido hay que estimarlo a partir de su estimador insesgado, la proporción muestral, p, y el error típico de la distribución muestral de la proporción queda de la siguiente forma:


Teniendo en cuenta las propiedades de la distribución normal, si fijamos un nivel de confianza del uno menos alpha y siguiendo el mismo razonamiento utilizado para el caso de la media, llegaríamos a la siguiente expresión:
Siendo el error máximo de estimación:
Y de esta forma, la expresión final del intervalo de confianza de la proporción poblacional es la siguiente:

Ejemplo 1.6: Para dejar constancia real de las preferencias de los padres sobre la lengua vehicular en la que prefieren que se eduque a sus hijos, una determinada asociación de padres realiza una encuesta sobre una muestra de 800 familias residentes en una determinada autonomía bilingüe, encontrando que 280 familias son partidarios de que todas de las asignaturas se enseñen en Castellano. Con un nivel de confianza del 95% ¿entre que valores se encontrará la proporción de padres que en esa Comunidad son partidarios de que todas las asignaturas se impartan en Castellano?
La proporción de familias partidarias de la enseñanza en Castellano obtenida en la muestra es p=280/800 = 0,35. 
  • Al tratarse de una muestra grande, la distribución binomial se aproxima a la normal. 
Buscamos en la tabla de la distribución normal los valores Z que dejan una probabilidad central del 95% y son -1,96 y +1,96 y aplicamos la siguiente expresión para calcular el error máximo de estimación:
Intervalo de confianza para la varianza
Cuando tratamos la distribución muestral de la varianza vimos que la variable aleatoria:
Representación genérica de esta  distribución en la que se indica la probabilidad de que un valor de esa variable aleatoria, tomado al azar, se encuentre entre los dos valores que delimitan la zona más clara, que vale uno menos alpha.

Entonces, si fijamos dos valores:
De la distribución de probabilidad de: ji- cuadrado con n - 1 grado de libertad 
De tal forma que la probabilidad 

Que un valor tomado al azar de la variable aleatoria
Se encuentre en la zona delimitada entre estos dos valores (zona clara de la figura) sea igual a un valor que representamos por:
Representa el nivel de confianza.
Quedando de la siguiente forma:
Para obtener el intervalo de confianza de la varianza hay que despejar de la expresión anterior el valor de la varianza poblacional.
 Primeramente al pasar a los lados de la desigualdad el valor de 
   Tendríamos:

1.    A continuación con el fin de aislar la varianza poblacional
Tenemos que invertir los miembros de la desigualdad lo que conlleva que varíe el sentido de la misma y tenemos.
 
Ordenando esta desigualdad de menor a mayor, llegamos a la expresión del intervalo de confianza de la varianza poblacional:








Los límites del intervalo de confianza para la varianza poblacional son:
Con las pertinentes modificaciones, se puede usar también la varianza insesgada (cuasi-varianza) siendo en este caso los límites inferior y superior los siguientes:
Las flechas indican que hay que fijarse en los subíndices ya que según sea el límite superior o el inferior buscaremos valores diferentes dentro de la tabla ji cuadrado.

Cuando el tamaño de la muestra está por encima de 100 sujetos, la distribución muestral de la varianza (distribución ji-cuadrado) se puede aproximar a la normal que al ser una distribución simétrica respecto a su media permite obtener los límites del intervalo de confianza, sumando y restando al estimador, el error máximo de estimación, que para un nivel de confianza determinado es el siguiente:
Donde:

De esta forma, la expresión final del intervalo de confianza para la varianza poblacional, cuando se trabaja con muestras grandes, sería la siguiente:

Ejemplo 1.7: Un grupo de 30 alumnos de enseñanza secundaria seleccionados al azar en una determinada Comunidad realizan un test de comprensión verbal de su lengua autónoma. Las puntuaciones obtenidas se distribuyen normalmente con media 120 y varianza 36. Con una probabilidad de 0’90, ¿entre que valores se encontrará la varianza en comprensión verbal de todos los alumnos de secundaria de esa Comunidad?

Buscamos en la tabla de la distribución ji-cuadrado y con n - 1 = 29  grados de libertad, los dos valores de la variable ji-cuadrado que dejan una probabilidad de 0,90 central. 
Estos valores son 17,708 y 42,557 tal y como se representan a continuación:
Utilizando la cuasi-varianza de la muestra. En este ejemplo, la varianza es 36 por lo que la cuasi-varianza vale:
Y los límites son:

Amplitud del intervalo de confianza y su relación con el tamaño muestral
La amplitud de un intervalo de confianza depende de dos factores:
  1. el nivel de confianza
  2. el error típico de la distribución muestral del estadístico.
Este segundo factor está en proporción inversa al tamaño de la muestra, de tal forma que cuanto mayor es el tamaño de la muestra, menor es el error típico del estadístico.
  • Esta relación es fundamental, pues permite dar al intervalo de confianza el grado de precisión que se desee.
El error típico de este estimador, cuando se desconoce la varianza poblacional, es:

Para obtener el error máximo de estimación se multiplica por el valor de la distribución t de Student (o la Z de la distribución normal, según la situación) correspondiente al nivel de confianza que se haya estipulado.

Es decir, la distancia desde la media muestral a cualquiera de los límites, que vamos a llamar error máximo de estimación y lo designamos con E es:
Si despejamos el tamaño de la muestra, n, y lo ponemos en función del resto de elementos el resultado es:
A continuación se resume el cálculo del tamaño de la muestra para los tres estadísticos básicos: media, varianza y proporción en función del nivel de confianza y del error máximo  de estimación, E, que se quiera fijar:

Las fórmulas  permiten al investigador calcular el tamaño de la muestra en función del error máximo, E, que esté dispuesto a admitir y del nivel de confianza (uno menos alpha) adoptado. 

Ejemplo 1.8.Se desea calcular el tamaño de la muestra que se requiere utilizar en una encuesta electoral de manera que la precisión en la proporción de voto estimada, o error máximo de estimación, con un nivel de confianza del 95%, sea de .más menos 0,02.
El error típico de la proporción es una medida de variabilidad de la distribución muestral de la proporción. La variabilidad en la distribución (la varianza) de una variable dicotómica (éxito/error) viene dado por el producto de p x q = p (1 - q) siendo p la proporción de éxitos y q la proporción de fracasos (una es la complementaria de la otra).
Situándonos en la situación más desfavorable respecto del error típico de la proporción, se tiene que:

Entonces siguiendo la  fórmula para hallar el número de sujetos que tiene que tener la muestra:
Con este número de sujetos, el investigador se asegura que la amplitud del intervalo de confianza será 0,04 (cuatro puntos porcentuales) con un nivel de confianza del 95%.
Podemos comprobar, que si el investigador quisiera trabajar con una precisión en la estimación igual a:

Contraste de hipótesis.
Todo contraste de hipótesis se basa en la formulación de dos hipótesis: Hipótesis nula y la hipótesis alternativa.
Una hipótesis estadística es una conjetura que se formula sobre una población y que puede someterse a prueba, o contrastación empírica, a partir de la información proporcionada por una muestra representativa de esa población.
  • Una vez que la hipótesis se ha contrastado con los datos de la muestra es el momento de tomar alguna decisión respecto a su resultado.
El contraste de hipótesis es, pues, una parte esencial del método científico.
Se parte de algún interrogante que se plantea en el ámbito de una investigación, a la luz de un determinado marco teórico, y debería formularse de una manera sencilla y clara.
Una vez planteada la cuestión, hay que buscar una solución que adopte la forma de afirmación empíricamente verificable, es decir, debemos ser capaces de operativizar nuestras preguntas para que tengan entidad de hipótesis científicas
Es decir, una hipótesis científica se pueden plantear con diferentes hipótesis estadísticas, las cuales, al contrastarse dan respuesta a dicha hipótesis científica.

Las hipótesis estadísticas planteadas para dar respuesta a la hipótesis científica son: 
  1. la hipótesis nula 
  2. la hipótesis alternativa
La hipótesis nula afirma que:
  • no existe diferencia entre el valor del estadístico obtenido en la muestra y el que formulamos como parámetro poblacional 
  • en otras palabras, que la diferencia observada entre estos dos valores es nula. 
  • Es la hipótesis que se somete a contraste.
Como la realidad es que estos valores casi nunca van a coincidir, lo que estamos afirmando es que la diferencia observada puede explicarse como resultado del azar.

Para cada hipótesis nula planteada, es preciso plantear otra, denominada hipótesis alternativa, y que es la negación de la hipótesis nula, de tal forma que:
  • Si la hipótesis nula es falsa la hipótesis alternativa tiene que ser verdadera o viceversa. 
Por tanto, estas dos hipótesis tienen que ser exhaustivas y mutuamente excluyentes

Dependiendo de cómo esté formulada la hipótesis nula se marca la dirección del contraste. Hay tres posibles afirmaciones de las hipótesis nula y alternativa.

  • Si la Hipótesis nula  está planteada como igualdad y la Hipótesis alternativa es simplemente su negación se dice que es un contraste bilateral.
Si, por el contrario:
  • Conocemos la dirección en que la Hipótesis nula puede ser falsa, en general, cuando en la investigación se plantea que un método de aprendizaje, un fármaco, un determinado proceso industrial, etc. tiene efecto positivo (o negativo) sobre lo que estamos estudiando, entonces tenemos un contraste unilateral en la medida en que indicamos la dirección esperada según  ese efecto.
En cualquier caso las hipótesis nula y alternativa son exhaustivas y mutuamente excluyentes, de tal forma que la negación de una conlleva la confirmación de la otra.

Una vez que se ha planteado la hipótesis, es preciso definir lo que se conoce como medida de la discrepancia y que, en general, cuando se trata de hacer contrastes sobre parámetros poblacionales:
  • es una medida estandarizada dentro de alguna distribución de probabilidad, a semejanza de las vistas en los epígrafes de distribuciones muestrales.
La medida de discrepancia no depende de las unidades en que esté medida la variable y su formulación habitual es:
Es preciso considerar qué cantidad de esta discrepancia consideramos admisible para que la discrepancia observada no sea atribuible al azar. 
  • Debemos determinar, a priori, cuál será la diferencia máxima entre el estimador y el parámetro que estamos dispuestos a considerar compatible con la Hipótesis nula. 
Esta decisión dependerá:
  1. la distribución de probabilidad de la medida de discrepancia
  2. la dirección del contraste,
  3. del riesgo que estamos dispuestos a asumir
Este valor de la discrepancia se establece, también, en términos de probabilidad de obtener una diferencia entre el estadístico obtenido en la muestra y el parámetro formulado en la hipótesis igual o mayor que la observada.
  • Esta probabilidad es la que se conoce como nivel crítico p, y en la mayor parte de las investigaciones se rechazará la Hipótesis nula si este valor es menor de 0,05 o 0,01.
Metodología clásica del contraste de hipótesis

La metodología del contraste es fruto de los trabajos de Fisher, Neyman y Pearson y su lógica recuerda a la de un juicio en un estado de derecho, en el cual el acusado siempre es inocente (la hipótesis nula) hasta que las pruebas no demuestren lo contrario (la hipótesis alternativa). 

Las etapas de un contraste de hipótesis: 

1.- Condiciones de la investigación y supuestos que cumplen los datos observados.
Al diseñar cualquier investigación se puede trabajar con una, dos, tres o más muestras, las cuales pueden ser independientes o relacionadas, en las que se recoge información sobre una o más variables medidas con la misma o con diferentes escalas de medida (nominal, ordinal, de intervalo o de razón). Por otra parte, estos datos pueden provenir de poblaciones en las que la variable de estudio tiene una distribución de probabilidad conocida o desconocida. Todas estas características tanto del diseño como de los datos condicionan tanto la hipótesis que se puede someter a contrastación empírica como el procedimiento de análisis de datos más adecuado para someter a contrastación empírica la hipótesis.

2.- Formulación de la hipótesis nula y de la alternativa.
Conforme al contexto de la investigación se formulan las hipótesis nula y alternativa, de las cuales se deriva un contraste bilateral o unilateral en función de sus objetivos. Por lo general la hipótesis científica, dirigida a encontrar resultados significativos, es la hipótesis alternativa que se aceptará como verdadera si la investigación aporta evidencias contra la hipótesis nula que es la que se somete a contrastación empírica.

3.- Estadístico de contraste.
Representa una medida de la discrepancia entre la información proporcionada por los datos empíricos recogidos en la muestra y la proposición teórica planteada en la hipótesis nula. 
  • Esta medida es una variable aleatoria con una determinada distribución de probabilidad (distribuciones muestrales como la normal, t, chi-cuadrado, etc.) que va a aportar información empírica sobre la afirmación formulada en la Hipótesis nula.
4.- Regla de decisión.
Una vez calculado el estadístico de contraste o discrepancia entre los datos empíricos observados en la muestra y los datos teóricos que planteamos en la hipótesis nula queda tomar una decisión respecto al rechazo o no de la hipótesis nula. Para ello, el investigador establece previamente el nivel de significación, α. 
  • Según Fisher, el nivel de significación, α, representa el máximo riesgo que el investigador está dispuesto a cometer al tomar la decisión errónea de rechazar una hipótesis nula verdadera. 
Por tanto, a la luz de sus resultados y del estadístico de contraste, el investigador calcula la probabilidad de obtener unos resultados como los observados en la muestra o más extremos. Esta probabilidad recibe el nombre de nivel crítico p
  • Si el nivel crítico p es muy pequeño en comparación con el nivel de significación, α, rechazamos la  hipótesis nula y en caso contrario la mantenemos.

El nivel de significación que suele utilizarse en la mayoría de las investigaciones es del 0,05, aunque en investigaciones más rigurosas se trabaja con un nivel de significación de 0,01. 
  • En cualquiera de los casos, se rechazaría la hipótesis nula siempre que la probabilidad de explicar los resultados obtenidos en relación a la hipótesis nula sea menor que el nivel de significación.
Otra alternativa a la hora de tomar la decisión de rechazar o no la hipótesis nula consiste en fijar el nivel de significación α, por lo que automáticamente se fija el valor o valores críticos de la distribución muestral que marcarán la máxima diferencia que podemos admitir, por simple azar, entre el valor teórico planteado en la hipótesis nula  y el valor obtenido en la muestra. Este valor, o valores críticos, definen -en la distribución muestral del estadístico de contraste- los límites entre la zona de rechazo o no de la hipótesis nula .


  1. La zona de rechazo o zona crítica depende del nivel de significación, α, y es el área de la distribución muestral que corresponde a un valor de la discrepancia tan alejado de hipótesis nula que la probabilidad de que se produzca es muy baja, si efectivamente la hipótesis nula  es verdadera. 
  • En otras palabras, es aquella zona de la distribución muestral constituida por el conjunto de muestras para las cuales se rechaza la hipótesis nula.
  1. La región de no rechazo o de aceptación, complementaria a la anterior, depende del nivel de confianza, uno menos alpha, y es el área de la distribución muestral que corresponde a valores pequeños de la discrepancia tan poco alejados del valor formulado en la hipótesis nula que la probabilidad de que se produzca es alta si efectivamente la hipótesis nula es verdadera, por lo que no representa evidencia suficiente para rechazarla. 
  • En otras palabras, es aquella zona de la distribución muestral constituida por el conjunto de muestras para las cuales se mantiene la hipótesis nula .
El valor o valores críticos corresponden a la máxima diferencia que cabe esperar por simple azar entre los datos empíricos obtenidos en la muestra y los datos teóricos que formulamos para la población
  • Si el estadístico de contraste se sitúa en la zona de NO rechazo, podemos concluir que la diferencia observada no es significativa y se debe a los errores aleatorios por lo que no podemos rechazar la hipótesis nula con un determinado nivel de confianza.


De forma similar:
  • Si el estadístico de contraste alcanza la zona de rechazo indicaría que la diferencia observada entre los datos empíricos y los datos teóricos es muy poco probable que pueda atribuirse a errores aleatorios y concluimos que la diferencia observada es significativa, lo que nos lleva a rechazar la hipótesis nula con un determinado nivel de confianza.


Aunque existen contrastes de hipótesis, que veremos posteriormente, en los que siempre se deja todo el nivel de significación en una parte de la distribución, en general y con independencia de la forma de la función de distribución del estadístico de contraste, si el contraste es bilateral tendremos tres zonas delimitadas por los dos valores críticos que se sitúan en el eje horizontal de la distribución muestral como las  esquematizadas en el siguiente gráfico:

Si el contraste es unilateral izquierdo solo tendremos dos zonas, siendo la región de rechazo la situada en la parte izquierda de la distribución, como se representa en el siguiente gráfico esquemático:

De forma similar, si el contraste es unilateral derecho, la región de rechazo se situará en la parte derecha de la distribución muestral como se representa en el siguiente gráfico esquemático:


En cualquier caso, ya sea comparando el estadístico de contraste con el valor crítico o comparando el nivel crítico p con el nivel de significación alpha, la decisión que se toma respecto a la hipótesis nula es la misma. 
  • Puesto que no hay verdades absolutas y siempre existe un riesgo de error, formalmente la hipótesis nula NUNCA se acepta, sino que la estrategia de la investigación es buscar evidencias para rechazarla.


5.- Conclusión.
Formulada la hipótesis nula, que es la que sometemos a contrastación empírica asumiendo que es provisionalmente verdadera y una vez calculado el estadístico de contraste, se concluye rechazando o no la hipótesis nula (no hay un punto intermedio). 
  • Si no tenemos evidencia suficiente para rechazarla, se está señalando que la hipótesis se mantiene porque es compatible con la evidencia muestral,
  • Si se rechaza se quiere significar que la evidencia muestral no avala la hipótesis y por tanto se rechaza.

Cuando la medida de discrepancia cae justo en la región crítica de la zona de aceptación o rechazo, es difícil tomar una decisión sobre H0. En estas circunstancias se suele coger nueva evidencia y proceder a un nuevo contraste.

6.- Interpretación.
La conclusión simple y llana en términos de rechazo o no de la hipótesis nula tiene su correspondiente interpretación dentro del contexto de la investigación y de la hipótesis y objetivos que el investigador formula en su trabajo.
Ilustremos este razonamiento con un sencillo ejemplo, similar al que plantea R.A. Fisher en su libro El Diseño de Experimentos, en el cual refería la afirmación de una dama según la cual, cuando tomaba el té, podía detectar si se había vertido antes la leche o la infusión en la taza. Para refutar esta “facultad” de la dama podríamos realizar un contraste con los siguientes datos ficticios.

Ejemplo 1.9. Para contrastar la presunta “habilidad detectora” de la dama se preparan 16 tazas de té, siguiendo ambos procedimientos: en ocho se vierte primero la leche, y en otros ocho se vierte primero la infusión. La presentación se realiza al azar y la dama sólo tiene que decir cuál ha sido el procedimiento. Supongamos, por ejemplo, que la dama acierta en 12 ocasiones. ¿Es compatible este resultado muestral con la afirmación de la dama? Como nivel de significación, tomaremos  alpha= 0,05.

Seguiremos los 6 pasos del proceso pero utilizando sólo el nivel crítico p como regla de decisión, dejando el cálculo del estadístico de contraste para los siguientes temas.

1.- Condiciones y supuestos.
  • 16 ensayos independientes con dos resultados posibles en cada uno: acierto o error, y la probabilidad del resultado permanece constante en todos ensayos.

2.- Formulación de las hipótesis nula y alternativa

  • Planteamos un contraste unilateral en el que la hipótesis nula presupone que la dama, en principio, no tiene dicha habilidad, y por tanto la proporción de veces que acertaría sería un valor igual a 0,5 o inferior (es decir, tendría la misma habilidad que el resto de los mortales). 

La hipótesis alternativa plantea que la dama si tiene esa habilidad y por tanto es capaz de acertar en más del 50% de los ensayos.

3.- Estadístico de contraste.

Como estamos contrastando una proporción cuya distribución de probabilidad es la distribución binomial, vamos a calcular la probabilidad de que, bajo el supuesto de que la dama no tiene esa extraña facultad (y por tanto su proporción de aciertos es la de cualquier persona normal del 50% que se formula en la hipótesis nula)la dama no tiene esa extraña facultad (y por tanto su proporción de aciertos es la de cualquier persona normal del 50% (formulado en la hipótesis alternativa):



4.- Regla de decisión.
Este resultado quiere decir que, bajo el supuesto de que la hipótesis nula es cierta y la probabilidad de acierto de la dama es de 0,5, la probabilidad de que en 16 ensayos la dama acierte en 12 ocasiones o más es de 0,0384, o que hay un 3,84% de probabilidades de que la dama, sin tener esa extraña habilidad, acierte por puro azar en 12 ocasiones o más.
  • Como regla de decisión para rechazar o no la hipótesis nula comparamos esta probabilidad con el nivel de significación (0,05) y puesto que la probabilidad encontrada es menor que 0,05, rechazamos la Hipótesis nula.


Por tanto, la regla de decisión bajo la interpretación de Fisher consiste en calcular la probabilidad de obtener unos resultados como los observados en la muestra o más extremos (nivel crítico p).
Si esta probabilidad es muy pequeña en comparación con α, pueden ocurrir dos cosas:   
  1.  bien la hipótesis nula es cierta (la dama no goza de tal habilidad) y se ha producido una situación muy poco probable (pero no imposible) 
  2. bien la hipótesis nula es falsa. Parece más lógico (o probable) inclinarse por esta segunda opción que descarta el azar como explicación del resultado obtenido y ante la evidencia que proporciona este resultado, el investigador opta por rechazar la hipótesis nula,

Asumiendo que esta afirmación tiene un cierto riesgo o probabilidad de error, que ha establecido en el 5%. Si, por el contrario, la probabilidad hubiese sido mayor que el nivel de significación, entonces no se podría descartar el azar, como explicación de la diferencia y se opta por no rechazar la hipótesis nula.

5.- Conclusión:
Rechazamos la hipótesis nula, ya que el nivel crítico p es menor que 0,05
  • El nivel crítico p=0,0384, nos indica la probabilidad de acertar por simple azar en 12 o más de las 16 ocasiones. 

Es un valor lo suficientemente pequeño que nos conduce a descartar el azar como explicación de este número de aciertos tan alto. 
En consecuencia:
  • si descartamos el azar como explicación de que la dama acierte en 12 o más de los 16 ensayos es porque la dama si tiene realmente esa capacidad.

6.- Interpretación:
Rechazar la hipótesis nula quiere decir que:
  •  la dama tiene esa habilidad para distinguir si en una taza de té se ha puesto primero la leche o la infusión con un nivel de confianza del 95%.

Si se establece el nivel de significación en 0,01 la conclusión sería otra y sería necesario obtener evidencias más fuertes o una probabilidad mucho menor para descartar el azar como explicación de esta extraña habilidad de la señora.

Seguiremos esta metodología pero utilizando, no solo el nivel crítico p, sino también y fundamentalmente el estadístico de contraste como medida de la discrepancia entre los valores teóricos que formulamos en la población y la información empírica que nos proporcionan los datos recogidos en la muestra, para los diseños de investigación que utilizan una, dos o más muestras. 
  • Y partir de estos estadísticos de contraste podremos calcular también el nivel crítico p.

Errores al tomar una decisión en un contraste clásico de hipótesis

Hemos visto que el contraste de hipótesis es un proceso por el cual se toma una decisión acerca de lo que se afirma en la hipótesis nula. No obstante, una cosa es la decisión que se adopta sobre y otra es la propia naturaleza de la hipótesis nula
Tenemos dos opciones posibles acerca de la decisión sobre la hipótesis nula:
  1.  o se Acepta
  2.  o se Rechaza,

Y dos opciones sobre la naturaleza de la hipótesis nula:
  • o es verdadera 
  • o es falsa.

El error que supone rechazar una hipótesis nula cuando en realidad es verdadera
  •  se denomina Error Tipo I, y su probabilidad asociada es α. 

El error que supone aceptar una hipótesis nula cuando en realidad es falsa, siendo verdadera la hipótesis alternativa, 
  • se conoce como Error Tipo II, y su probabilidad asociada es  beta.
  • Su complementario es uno menos beta y corresponde a la potencia de contraste que es la decisión correcta de rechazar la hipótesis nula cuando es falsa.


Y ahora a realizar ejercicios......

Comentarios

Publicar un comentario

Entradas populares