Probablemente no se entiende

Hace un tiempo que leo la prensa científica de manera más o menos regular y con ojo más o menos crítico. Hacerlo me ha permitido ver que hay algunas lagunas a la hora de comprender los resultados de los trabajos científicos, sobre todo a lo referente a estadística. Esta sensación se confirmó cuando conocí los resultados sobre la percepción pública de la ciencia, en distintos estudios en España, Europa y EUA.

Se interpretan mal los porcentajes. Que una enfermedad se encuentre en un 40% de la población significa que 4 de cada 10 personas están afectadas. Esto quiere decir que si cogiéramos 10 personas al azar, 4 estarían enfermas. Pero es simplemente una probabilidad. Al ser al azar, no siempre ocurre: una vez puedes encontrarte solo 1 persona enferma, otra hay 5 y en otra hay 6 (en ninguna ha habido 4). Si sumamos toda esta gente tenemos que en una muestra de 30 personas hay 12 que tienen la enfermedad. 12 sobre 30 es el 40%. Da el porcentaje sin que necesariamente sean siempre 4 personas (aunque lo más probable es que te salgan 4 cada vez que hagas el experimento con gente escogida al azar).

Este es un poco el truco de la estadística. Es inexacta, pero sirve para crear modelos y encontrar tendencias. Un ejemplo más fácil: yo tengo dos coches y mi vecino no tiene ninguno. Si se hace un estudio de cuantos coches tenemos mi vecino y yo, sale que tenemos 1 cada uno… y no es cierto. La estadística es una disciplina matemática que ayuda mucho, pero hay que cogerla un poco con pinzas. Obviamente, cuantos más datos se tengan, más fiable será el estudio estadístico, porque habrá menos espacio para que haya una desviación (el campo de la “Big Data” es relativamente nuevo y se basa en la búsqueda de tendencias a lo largo de una inmensa, gigantesca cantidad de datos para poder hacer previsiones… en ciencia se puede usar para prever cuando puede aparecer una epidemia de una enfermedad [se relaciona con la búsqueda de síntomas en Google] o para prever con mayor exactitud el tiempo que hará [o cómo afectará el cambio climático]).

Otra malinterpretación demasiado frecuente con esta disciplina matemática es la probabilidad de tener un hijo con una enfermedad X. Si se dice que es un 25%, se puede leer que 1 de cada 4 hijos la tendrá. Pero esto no quiere decir que si has tenido 3 hijos, el 4º tendrá la enfermedad. Esto quiere decir que TODOS los hijos que tengas, tienen una probabilidad de 1 contra 4 a tener la enfermedad. Puedes tener 4 hijos sin la enfermedad, 4 con ella, 2 con y 2 sin, 1 con y 3 sin o 3 con y 1 sin (así pongo todas las opciones en caso de tener cuatro hijos). Pero puedes tener 1 hijo y que tenga la enfermedad, o tener 2 y que ninguno la tenga. Una probabilidad no es algo exacto, simplemente dice las opciones que hay de que ocurra algo, pero no necesariamente tiene que ocurrir. Cuanto mayor sea, más probabilidades de que ocurra, pero aun así, el hecho puede no ocurrir (a menos que sean del 100%, es decir, que pase en todos los casos).

Habiendo entendido esto, subamos un poco más el listón. En ciencia, la estadística sirve como validación de los resultados. Se usa para comprobar si la hipótesis que teníamos se confirma con los resultados. Para esto se utiliza una técnica llamada contraste de hipótesis: tenemos una hipótesis 0 (o nula) que propone que los resultados apoyan nuestra sospecha (por ejemplo: cuando se tiene gripe, siempre se acompaña de fiebre) y una hipótesis 1 (o alternativa) que dice lo contrario que la hipótesis nula (en el ejemplo: se puede tener gripe sin fiebre). ¿Y cómo sabemos cuál es la correcta? Pues mediante un conjunto detests con fórmulas distintas según el tipo de datos que se hayan obtenido de los experimentos y su distribución, que tienen que mostrar que la hipótesis nula se cumple en un 95% de los casos. En caso que no sea así, se confirma la hipótesis alternativa. En casos de experimentos que necesitan unos resultados más estrictos se tiene que cumplir en un 99% de los casos.

Para validar la hipótesis nula, es decir, para comprobar que es verídica y no se tiene que rechazar enseguida, se usa el p-valor. El p-valor parte de la suposición que la hipótesis nula es cierta. Para poder interpretarlo, necesitamos determinar el nivel de significación, que suele ser 0’05 o 0’01 (fijaos que es la diferencia entre 1-0’95 o 1-0’99, es decir, equivalen al 5% o al 1%). El p-valor nos muestra la probabilidad de obtener un resultado si nuestra suposición es correcta (aceptación de la hipótesis nula). Si este valor es menor que el nivel de significación escogido, se rechaza la hipótesis nula. Aunque esto a veces se puede deber a una muestra demasiada pequeña (habría que aumentarla) o a una observación atípica (habría que bajar el nivel de significación para saber si lo es o no). Recordemos que el p-valor no acepta la hipótesis nula, solo la verifica, la valida. Para saber si es cierta, hay que usar unos tests concretos dependiendo de los datos y su distribución.

Cuando el análisis estadístico de los datos obtenidos en los experimentos nos confirma una u otra hipótesis, podemos discutir los resultados y podemos decir qué se saca de ellos y qué consecuencias hay. También es verdad que no siempre es necesario hacer un contraste de hipótesis para hacer el análisis estadístico, porque con algún test más sencillo se puede saber la validez de los resultados. Aun así, es recomendable hacerlo, porque es un soporte más fuerte para los resultados. Obviamente para los trabajos más descriptivos no hay que hacer ningún o casi ningún análisis, pero aquí estamos hablando de los trabajos con un gran número de datos o que pueden tener una gran repercusión científica y social.

Espero que a partir de ahora podáis entender lo que significan todas las estadísticas que veáis en las noticias, y no solo para temas científicos.

DH

PD: lo he hecho lo más llano posible. Pido perdón por si no se entiende bien. Cualquier duda, escribid un comentario 😉

PD2: si alguien que sepa más estadística que yo ve algún error en lo que he dicho, le estaré muy agradecido que me lo diga para corregirlo.

Anuncios

7 Comments on “Probablemente no se entiende

  1. Pingback: Ahora se puede entender | Divulgador Herbívoro

            • No, no la estoy haciendo. Me la ofrecieron pero la rechacé (lo sé, un poco inconsciente por mi parte), ya que no me veía especializándome en ese campo (paleobiología en caballos). Además, que el mundo científico tal y como está hecho, dependiendo tanto de las revistas no me termina de gustar.
              Realmente ahora estoy pasando de hacer ciencia a comunicar ciencia, con un máster en Barcelona. Aun así, colaboro en un centro de reproducción de especies amenazadas.

              Me gusta

TALK to me

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

misedades.wordpress.com/

IMAGEN CORPORATIVA | COMUNICACIÓN

VueltaenterA

Neogeografía, apps y medio ambiente

Los Mundos de Brana

«I love physics with all my heart... It is a kind of personal love, as one has for a person to whom one is grateful for many things». Lise Meitner

AveNaturia

Un blog para conocer y disfrutar la naturaleza

Gaia's Mind

~ Inspired by nature • Historias en la naturaleza ~

Esquilant la Dolly

Esquilant la Dolly

Andanzas de un Trotalomas

Andanzas, aventuras y desventuras de un naturalista apasionado

Galiana y Cía.

El arte de contar lo que vemos

UNA INVESTIGADORA EN APUROS

En constante estado metaestable desde la década de los 70

A %d blogueros les gusta esto: