https://www.youtube.com/watch?v=7NJqUN9TClM
Según nos indican las estadísticas, cada habitante del planeta tiene una teta y un testículo, lo que corrobora la creencia generalizada de que con las estadísticas se puede afirmar cualquier cosa.
Sin embargo, la Estadística es una rama de las Matemáticas, una ciencia exacta. La explicación a esto es que en asuntos estadísticos hay que saber qué mirar: la visión correcta de las características de los habitantes del planeta, por seguir con el chascarrillo de entrada, es que cada uno tiene o dos tetas y ningún testículo, o dos testículos y ninguna teta. Con una probabilidad de acierto superior al 99,999%. Lo que nos ha engañado es creernos la media.
La Estadística nos sirve para reducir una miríada de valores a unos pocos valores concretos que equivalen al conjunto y que, por ser pocos, sí podemos asimilar. Por ejemplo, en vez de meternos en la cabeza los salarios de todos los españoles nos es más fácil reducirlo a un valor, el promedio o media. Y así podemos afirmar que los españoles ganan menos que los holandeses pero más que los ugandeses, o que ingieren menos calorías al día que los estadounidenses pero más que los etíopes.
Lo que pasa es que en muchas ocasiones la media no es una imagen correcta del conjunto, pero como estamos acostumbrados a emplearla como resumen para todo no nos damos cuenta del error.
Pongamos un ejemplo con números. Imaginemos un emprendedor que tiene una idea y reúne a un ingeniero, un encargado y 12 hombres más para llevarla a cabo. Una vez liquidados los gastos y los impuestos, se reparten el beneficio resultante según los acuerdos previos. Imaginemos que el beneficio total es de 500.000 € y que el reparto es de 36.000 para el ingeniero, 24.000 para el encargado y 18, 15, 14, 14, 13, 12, 12, 12, 12, 11, 9 y 8 miles de euros para los obreros (pongamos que las tres últimas cifras son para trabajadores en formación en distintos grados). El emprendedor se lleva lo restante, 290.000 euros.
Muy bien: la media de lo que se lleva cada uno es de 33.333 euros, unos sueldos muy razonables. Si pensamos en el ingeniero, el dato de la media está bien, él se lleva un poco más pero por algo es ingeniero. Pero los demás... creo que estamos todos de acuerdo en que la media no es la medida correcta de los salarios de todos.
¿Y si descontamos al emprendedor de la lista? La cosa cambia: la media es de 15.000 euros. A mí no me parece un salario representativo: el ingeniero, el encargado y un trabajador lo superan, un cuarto lo alcanza y diez obreros se quedan por debajo. Además, implica manipular en exceso la muestra: sacamos a uno de ellos, porque intuimos que nos va a falsear el resultado que queremos obtener.
Aquí un estadístico nos hablaría de la desviación típica, de la varianza y la covarianza y de no sé cuántos más conceptos que, reconozcámoslo, cuestan un poco entender y requieren un cálculo cuidadoso para establecerlos. ¿Acaso la Estadística no tiene herramientas sencillas para casos como éste? Herramientas que pueda aplicar cualquier hijo de vecino, quiero decir.
Sí, sí las tiene. Y de hecho se estudian en el colegio (y me atrevo a decir que todavía); otra cosa es que las hubiéramos olvidado al día siguiente del examen.
La herramienta más sencilla de aplicar se llama moda. La moda es el valor que más se repite. En el ejemplo, el salario que más se repite es de 12.000 euros. Eso ya debería darnos qué pensar, 33.333 euros es la media pero muchos se están llevando sólo 12.000 euros.
En general la moda, aunque muy fácil de aplicar en grupos pequeños, no es muy representativa, porque es casi una casualidad que las cifras coincidan. Dicho esto, hay un valor que también es muy fácil de calcular: la mediana.
La mediana es el valor del centro una vez ordenados los números. En nuestro caso, la mediana es 13.000: 7 trabajadores sacan menos, 7 (incluyendo al emprendedor) sacan más y uno de ellos saca exactamente eso. Como anécdota, si sacásemos al emprendedor del conjunto (como hemos propuesto antes, al falsear la media), la mediana sería de 12.500 euros. Más baja, pero no habría mucha diferencia. La mediana nos puede servir para muchas cosas. Nos indica el valor tal que la mitad gana más y la mitad gana menos, así que si queremos establecer una campaña de ayudas a los que ganen poco o saber qué mercado hay para un producto que no es de primera necesidad, el tiro rápido que supone la mediana nos es mucho más útil que la sencilla media.
La mediana. Que no le cuenten milongas: cuando le digan la media, que le digan también la mediana. Si se parecen, pues adelante (y, por cierto, si se parecen entonces tanto da emplear la media como la mediana como valor representativo). Si no se parecen, entonces no se fíe de la media.
Por ejemplo: la renta per cápita es la media de lo que produce un país entre sus habitantes. Suele emplearse para ordenar a los países por su riqueza, pero sería interesante saber la mediana de los ingresos personales o familiares; diría que unos cuantos países árabes y algunos otros países bajarían bastantes puestos. Así que la foto buena del país sería la dupla media y mediana.
Eso sí: la mediana de la población del planeta es tener una teta y un testículo. Ya ve, tampoco es la panacea.
The Band Perry - If I die young
Estrictamente hablando, la última frase solo es correcta si exactamente la mitad de la población es masculina. Si hay 3.500 millones de hombres y 3.500 millones y una mujer, la mediana sería dos tetas.
ResponderEliminarJajajá, cierto. Si además contamos que mueren/nacen 4 personas por segundo, determinar la mediana sería como decir si la bola de la ruleta está en rojo o en negro. Supongo que en realidad la mediana cambiaría tantas veces que emplearíamos... la media de las medianas.
EliminarAunque siendo estrictos del todo, la última frase es que la mediana tampoco es la panacea (como valor representativo). Y, como tu explicación demuestra, en efecto no lo es.