«El 74% de las empresas dicen querer estar «orientadas a los datos», sólo el 29% dicen ser buenas para conectar la analítica con la acción». – Forrester
Generar, procesar y compartir estadísticas y datos: ¿estas acciones le convierten en una empresa «orientada a los datos»?
Claro que sí, pero si los datos y las estadísticas que impulsan sus decisiones son inexactos, o completamente falsos, los consiguientes resultados negativos pueden provocar confusión y un mal rendimiento.
Los datos creíbles eliminan la aterradora perspectiva de depender de conjeturas caprichosas y «sensaciones viscerales». Combina la experiencia humana y la intuición con números concretos y análisis para que nazcan decisiones capaces de mover la aguja.
Pero los cuadros de mando intuitivos, las tablas, las estadísticas y los gráficos a menudo enmascaran una realidad espuria:
Estadísticas y datos engañosos.
Con la tecnología avanzando rápidamente y los usuarios adaptándose al mismo ritmo, las empresas se han vuelto dependientes de los datos y las estadísticas para navegar en un entorno empresarial competitivo.
Pero es fácil dejarse cegar por lo absoluto de los números, especialmente cuando dan credibilidad a hipótesis o puntos favorables.
No reconocer las estadísticas y los datos falsos es una amenaza para la toma de decisiones basada en datos.
Le anima a pulsar los proverbiales botones equivocados con plena confianza, y ahí es donde reside el peligro.
En este post, aprenderá a detectar estadísticas y datos engañosos. Veremos las formas más comunes en las que engañan y cómo determinar cuándo los datos pueden soportar el peso de las decisiones críticas.
- ¿Qué es una estadística engañosa?
- Tipos selectivos para crear estadísticas falsas
- Tamaño de muestra descuidado que da lugar a una falsa precisión
- Correlaciones y causas defectuosas para crear estadísticas falsas
- Gráficos y visuales engañosos
- Conclusión: Cómo protegerse de los datos y las estadísticas engañosas
- Acerca del autor
¿Qué es una estadística engañosa?
Fuente
Las estadísticas engañosas se crean cuando un fallo -deliberado o no- está presente en uno de los 3 aspectos clave de la investigación:
-
Recoger: Utilizar tamaños de muestra pequeños que proyectan grandes números pero que tienen poca significación estadística.
-
Organización: Omitir hallazgos que contradicen el punto que el investigador está tratando de probar.
-
Presentar: Manipular los datos visuales/numéricos para influir en la percepción.
Las malas estadísticas se cuelan en los medios de comunicación, las campañas publicitarias e incluso la literatura científica. Un escandaloso 33,7% de los científicos -los superlativos de la neutralidad de los datos- han admitido el uso indebido de las estadísticas para apoyar la investigación. Sí, incluso algunos de los guardianes de la información en los que confía la sociedad son culpables.
Para ayudarle a tomar decisiones críticas basadas en los datos correctos, hemos enumerado las formas más comunes en que las estadísticas engañan y desinforman.
Tipos selectivos para crear estadísticas falsas
Un estudio realizado por Elizabeth Loftus puso a prueba la influencia del lenguaje en los testimonios de los testigos presenciales. Se mostró a los sujetos una película que mostraba varios accidentes de coche. Después de verla, se les preguntó: «¿a qué velocidad iban los coches cuando chocaron entre sí?»
Luego se hizo la misma pregunta a otros sujetos, aunque sustituyendo la palabra «chocaron» por verbos sugerentes como:
-
Contactaron
-
Golpearon
-
Chocaron
-
Colisionaron
¿Los resultados?
Cuanto más fuerte era el verbo «cargado» utilizado, mayor era la estimación de velocidad de los testigos.
Fuente
Además, el estudio descubrió que cuando se utilizaba un verbo más fuerte, los sujetos eran más propensos a informar de que había cristales rotos en el accidente, a pesar de que los cristales rotos no se mostraban en el vídeo.
El uso del lenguaje para influir en las respuestas y los resultados de las encuestas es sólo un ejemplo de sesgo de selección. En 2007, la Autoridad de Normas Publicitarias (ASA) obligó a Colgate a abandonar su afirmación de que «más del 80% de los dentistas recomiendan el uso de Colgate» porque la afirmación implicaba de forma engañosa que «el 80% de los dentistas recomiendan la pasta de dientes Colgate con preferencia a todas las demás marcas».
La pregunta real de la encuesta era «si tuvieran que elegir entre cepillarse solo y usar una pasta de dientes -como Colgate-, ¿cuál recomendarían?»
Al seleccionar la respuesta de la encuesta, Colgate dio la impresión de que los dentistas la recomendaban por encima de las marcas de la competencia; la recomendación real era que el uso de cualquier pasta de dientes es superior al cepillado solo.
El sesgo selectivo suele producirse cuando las muestras o los datos elegidos son incompletos o se seleccionan para influir en la percepción de las estadísticas y los datos, e incluso para sesgarlos.
Tamaño de muestra descuidado que da lugar a una falsa precisión
(fuente)
90 personas que responden «sí» de 100 personas ( 90%), frente a 900 personas que responden «sí» de 1000 personas (también 90%); los porcentajes son similares, pero la diferencia en el valor y la validez de los datos es estadísticamente significativa.
Los tamaños de muestra más pequeños casi garantizan resultados alarmantemente significativos. Tenga siempre cuidado con los resultados extremos y no acepte nunca los porcentajes al pie de la letra. En palabras de la investigadora en bioquímica Ana-maria Sundic:
«Para garantizar que la muestra es representativa de una población, el muestreo debe ser aleatorio, es decir, cada sujeto debe tener la misma probabilidad de ser incluido en el estudio. Hay que tener en cuenta que el sesgo de muestreo también puede producirse si la muestra es demasiado pequeña para representar a la población objetivo»
Correlaciones y causas defectuosas para crear estadísticas falsas
«Correlación no significa causalidad».
Sin duda ha escuchado esta frase antes, pero por una buena razón, es cierta.
Cuando dos variables se correlacionan se suele aplicar lo siguiente:
-
Y causa X.
-
X causa Y.
-
Un tercer factor desencadena X + Y.
-
La correlación se debe al azar.
La correlación y la causalidad merecen muchas sospechas porque los investigadores -y los consumidores de dicha investigación- son presa de:
-Fetichismo numérico
-Caza de la correlación
Tyler Vegihn recopiló algunos divertidos ejemplos de estadísticas engañosas para demostrar exactamente este punto:
Este gráfico muestra una correlación convincente entre el número de personas que se ahogaron al caer en una piscina y el número de películas en las que apareció Nicolas Cage:
Otro muestra una correlación entre el número de personas que murieron enredadas en sábanas, con el consumo de queso:
¿Significa esto que reducir el consumo de queso y los papeles de actor de Nicolas Cage salvará vidas? Probablemente no.
Dado que los investigadores están presionados para descubrir datos útiles o probar una hipótesis, la tentación de declarar prematuramente un momento «ajá» o «eureka» es alta.
Esto supone un problema para los análisis y las estadísticas saludables; si se introducen suficientes variables, está casi garantizado que se encontrará una correlación, con cualquier cosa.
Gráficos y visuales engañosos
Las visualizaciones de datos convierten los números en bruto en representaciones visuales de las relaciones, tendencias y patrones clave. Aunque son capaces de dar vida a sus datos, también son un medio popular para las estadísticas y los datos engañosos.
En su libro «Gráficos, mentiras, visuales engañosos», el periodista de datos Alberto Cairo expone ejemplos de estadísticas engañosas de anuncios de marketing, campañas políticas y cobertura de noticias.
Un ejemplo popular de las noticias es el caso de Terri Schiavo, un caso legal de derecho a morir en los Estados Unidos.
Durante el caso, la CNN utilizó un gráfico como el que se muestra a continuación para representar la opinión de los diferentes grupos políticos sobre la retirada del soporte vital de Terri:
Fuente
Un vistazo a este gráfico sugiere que, en comparación con los republicanos y los independientes, hay 3 veces más demócratas que están de acuerdo con el tribunal
Sin embargo, una mirada más cercana revela una pequeña diferencia del 14% en los votos.
El gráfico truncado y el eje Y manipulado (que comienza en 50 en lugar de 0) distorsionan los datos, y le llevan a creer una idea exagerada sobre un determinado grupo.
Evite ser engañado al ver gráficos y visuales prestando atención a:
-
La omisión de la línea de base o el eje truncado en un gráfico.
-
Los intervalos y las escalas. Compruebe si hay incrementos desiguales y medidas extrañas (uso de números en lugar de porcentajes, etc.).
-
El contexto completo y otros gráficos comparativos para ver cómo se miden y representan datos similares.
Conclusión: Cómo protegerse de los datos y las estadísticas engañosas
Las estadísticas y los datos engañosos presumen de grandiosas mejoras de la tasa de conversión con «ajustes de CTA» y «simples cambios de color».
Crean titulares impactantes que atraen enjambres de tráfico pero que, en el mejor de los casos, proporcionan conocimientos defectuosos.
Las estadísticas y los datos erróneos son peligrosos.
En lugar de ayudarte a sortear los desvíos, los baches y las trampas, te dirigen a sabiendas -o sin saberlo- hacia ellos. Pero usted es lo suficientemente inteligente como para detectarlos.
La próxima vez que se encuentre con datos convincentes, hágase estas sencillas pero poderosas preguntas:
¿Quién está realizando la investigación?
La investigación es cara y requiere mucho tiempo. Comprueba quién la patrocina, sopesa su predisposición sobre el tema y cómo podrían beneficiarse de los resultados. ¿Son una empresa B2C con un producto? ¿Un servicio de consultoría? ¿Un estudio independiente financiado por una universidad?
¿Se puede tomar en serio el tamaño de la muestra y la duración del estudio?
Inspeccionar los números de apoyo o velados expondrá una fuerza estadística débil.
¿Se representan los datos visualmente de forma justa?
¿Son las escalas y los intervalos uniformemente espaciados y neutrales? ¿Una estadística está impulsando una idea o una agenda específica? ¿Hay demasiadas métricas en el cuadro de mandos?
¿Se representa la investigación de forma honesta e imparcial?
Revise el lenguaje utilizado, la forma en que se formula la pregunta y las personas encuestadas.
Para evitar que las estadísticas y los datos engañosos contaminen sus cuadros de mando, informes y análisis, reciba la nueva información con una actitud curiosa y escéptica.
Acerca del autor
Hassan Uddeen es un escritor independiente con sede en el Reino Unido para empresas B2B, SaaS y Fintech. Le encanta todo lo relacionado con el marketing de contenidos. Cuando puede alejarse del teclado, le gusta saltar en el gimnasio de su casa (mientras juega al rol de Goku) y sumergirse en una buena novela de James Patterson.