“74% das empresas dizem que querem ser “orientadas por dados”, apenas 29% dizem que são boas a ligar a análise à acção”. – Forrester

Criar, processar e compartilhar estatísticas e dados – essas ações fazem de você uma empresa “movida por dados”?

Certo que sim, mas se os dados e estatísticas que orientam suas decisões forem imprecisos, ou completamente falsos, os resultados negativos resultantes podem gerar confusão e mau desempenho.

Dados credíveis eliminam a perspectiva assustadora de confiar em suposições caprichosas e “sensação de intuição”. Ele combina experiência humana e intuição com números concretos e análises para decisões de nascimento capazes de mover a agulha.

Mas painéis intuitivos, gráficos, estatísticas e gráficos muitas vezes escondem uma realidade espúria:

Estatísticas e dados líderes.

Com a tecnologia avançando rapidamente e os usuários se adaptando em um ritmo igual, as empresas se tornaram dependentes de dados e estatísticas para navegar em um ambiente de negócios competitivo.

Mas é fácil ficar cego pela absolutez dos números, especialmente quando eles dão credibilidade a hipóteses ou pontos favoráveis.

Falecer de reconhecer estatísticas e dados falsos é uma ameaça à tomada de decisão orientada por dados.

Apromovele-o a apertar os proverbiais botões errados com total confiança, e é aí que reside o perigo.

Neste post, você aprenderá como detectar estatísticas e dados enganosos. Vamos olhar para as maneiras comuns que eles enganam, e como determinar quando os dados podem suportar o peso de decisões críticas.

O que é uma estatística enganosa?

Fonte

As estatísticas enganosas são criadas quando uma falha – deliberada ou não – está presente em um dos 3 aspectos chave da pesquisa:

  1. Colher: Usando pequenos tamanhos de amostra que projetam grandes números mas têm pouco significado estatístico.

  2. Organizar: Omitindo resultados que contradizem o ponto que o pesquisador está tentando provar.

  3. Apresentar: Manipulando dados visuais/numéricos para influenciar a percepção.

As estatísticas ruins se infiltram em veículos de notícias, campanhas publicitárias, e até mesmo na literatura científica. Um chocante 33,7% dos cientistas – os superlativos de serem neutros em relação aos dados – admitiram o mau uso das estatísticas para apoiar a pesquisa. Sim, até mesmo alguns gate-keepers de informação confiáveis da sociedade são culpados.

Para ajudar você a tomar decisões críticas baseadas nos dados certos, listamos as formas comuns de estatísticas enganarem e desinformarem.

Vias seletivas para criar estatísticas falsas

Um estudo de Elizabeth Loftus testou a influência da linguagem nos testemunhos de testemunhas oculares. Foi mostrado um filme que retratava vários acidentes de carro. Depois de assistir, eles foram questionados, “sobre a velocidade com que os carros iam quando batiam um no outro?”

A outros sujeitos foi então feita a mesma pergunta, embora com a palavra “esmagados” substituída por verbos sugestivos como:

  • Contactado

  • >

    Hit

  • Bumped

  • Collided

Os resultados?

Quanto mais forte o verbo “carregado” usado, maior a estimativa de velocidade das testemunhas.

Fonte

Outras vezes, o estudo descobriu que, ao usar um verbo mais forte, os sujeitos tinham mais probabilidade de relatar vidro partido no acidente, mesmo que o vidro partido não fosse mostrado no vídeo.

Usar linguagem para influenciar as respostas e resultados da pesquisa é apenas um exemplo de viés de seleção. Em 2007, a Advertising Standards Authority (ASA) forçou a Colgate a abandonar sua alegação de que “mais de 80% dos dentistas recomendam o uso da Colgate” porque a alegação implicava enganosamente que “80% dos dentistas recomendam a Colgate em preferência a todas as outras marcas”.

A pergunta da pesquisa propriamente dita foi “dada a escolha entre escovar sozinho e usar uma pasta de dente – como a Colgate – o que eles recomendariam”.

Ao escolher a resposta da pesquisa, a Colgate deu a impressão de que os dentistas os recomendaram em relação às marcas da concorrência; a recomendação propriamente dita foi o uso de qualquer pasta de dente é superior à escovação sozinha.

O viés seletivo freqüentemente ocorre quando as amostras ou dados escolhidos estão incompletos ou são escolhidos com cereja para influenciar a percepção das estatísticas e dados – e até mesmo o enviesamento.

Tamanho de amostra negligenciado resultando em falsa precisão

(fonte)

90 pessoas respondendo “sim” de 100 pessoas ( 90%), contra 900 pessoas respondendo “sim” de 1000 pessoas (também 90%); as porcentagens são semelhantes, mas a diferença no valor e validade dos dados é estatisticamente significativa.

Tamanho de amostra mais pequeno quase garante resultados alarmantemente significativos. Tenha sempre cuidado com os resultados extremos, e nunca aceite percentagens ao valor facial. Nas palavras da pesquisadora bioquímica Ana-maria Sundic:

“Para garantir que a amostra seja representativa de uma população, a amostragem deve ser aleatória, ou seja, cada sujeito precisa ter a mesma probabilidade para ser incluído no estudo. Deve-se notar que o viés de amostragem também pode ocorrer se a amostra for muito pequena para representar a população alvo”

Correlações e Causas para Criar Falsas Estatísticas

“Correlação não significa causa”.

Sem dúvida você já ouviu esta frase antes, mas por uma boa razão, é verdade.

Quando duas variáveis se correlacionam, geralmente se aplica:

  • Y causa X.

  • X causa Y.

  • Um terceiro fator desencadeia X + Y.

  • A correlação é por acaso.

Correlação e causalidade justificam muitas suspeitas porque os pesquisadores – e consumidores de tais pesquisas – caem presas a:

-fetichismo numérico

-Caça à correlação

Tyler Vegihn compilou alguns exemplos engraçados de estatísticas enganosas para provar este ponto exato:

Este gráfico mostra uma correlação convincente entre o número de pessoas que se afogaram a cair numa piscina e o número de filmes em que Nicolas Cage apareceu:

Outra mostra uma correlação entre o número de pessoas que morreram ao ficarem enredadas em lençóis, com o consumo de queijo:

Isso significa reduzir o consumo de queijo e os papéis de Nicolas Cage vão salvar vidas? Provavelmente não.

Dado que os investigadores são pressionados a descobrir dados úteis ou a provar uma hipótese, a tentação de declarar prematuramente um momento “aha” ou “eureka” é alta.

Isso representa um problema para análises e estatísticas saudáveis; insira variáveis suficientes, e você está quase certo de encontrar uma correlação, com qualquer coisa.

Gráficos e Visuais Enganosos

Visualizações de dados transformam números brutos em representações visuais de relações, tendências e padrões chave. Embora eles sejam capazes de dar vida aos seus dados, eles também são um meio popular para estatísticas e dados enganosos.

Em seu livro “Graphics, Lies, Misleading Visuals”, o jornalista de dados Alberto Cairo expõe exemplos de estatísticas enganosas de anúncios de marketing, campanhas políticas e cobertura jornalística.

Um exemplo popular das notícias é o caso de Terri Schiavo, um caso legal de direito de morrer nos EUA.

Durante o caso, um gráfico como o abaixo foi usado pela CNN para retratar como diferentes grupos políticos se sentiram sobre a remoção do suporte de vida de Terri:

Fonte

Um olhar para este gráfico sugere que, quando comparado aos Republicanos e Independentes, 3 vezes mais Democratas concordaram com o tribunal

Um olhar mais atento, no entanto, revela uma pequena diferença de 14% nos votos.

O gráfico truncado e o eixo Y adulterado (começando em 50 em vez de 0) distorcem os dados, e levam-no a acreditar numa ideia exagerada sobre um determinado grupo.

Evite ser enganado ao visualizar gráficos e imagens olhando para:

  • A omissão da linha de base ou eixo truncado num gráfico.

  • Os intervalos e escalas. Verifique se há incrementos irregulares e medidas ímpares (uso de números em vez de percentagens, etc.).

  • O contexto completo e outros gráficos comparativos para ver como dados semelhantes são medidos e representados.

Conclusão: Salvaguarda contra dados e estatísticas enganosas

As estatísticas e os dados estatísticos enganosos apresentam melhorias grandiosas na taxa de conversão com “ajustes CTA” e “simples mudanças de cor”.

Criam manchetes chocantes que atraem multidões de tráfego, mas, na melhor das hipóteses, fornecem percepções erradas.

As estatísticas e os dados são perigosos.

Em vez de o ajudar a navegar através de desvios, buracos e armadilhas, eles dirigem-no conscientemente – ou inconscientemente – para dentro deles. Mas você é esperto o suficiente para identificá-los.

Próxima vez que você encontrar dados convincentes, executado por estas simples mas poderosas perguntas:

Quem está fazendo a pesquisa?

Pesquisa é cara e demorada. Verifique quem está patrocinando a pesquisa, pondere seu viés sobre o tópico e como eles podem se beneficiar dos resultados. Eles são uma empresa B2C com um produto? Um serviço de consultoria? Um estudo independente financiado por universidades?

Pode ser levado a sério o tamanho da amostra e a duração do estudo?

Inspeccionar os números de suporte ou velados exporá uma força estatística fraca.

Os dados visuais são representados de forma justa?

As escalas e os intervalos são igualmente espaçados e neutros? Uma estatística está empurrando uma idéia ou agenda específica? Há demasiadas métricas no seu painel?

A pesquisa é representada de forma honesta e imparcial?

Reveja a linguagem utilizada, a forma como a pergunta é enquadrada, e as pessoas que estão a ser inquiridas.

Para evitar que estatísticas e dados enganosos poluam seus dashboards, relatórios e análises, receba novas informações com uma atitude curiosa e céptica.

Sobre o autor

Hassan Uddeen é um escritor freelance baseado no Reino Unido para empresas B2B, SaaS, e Fintech. Ele adora todas as coisas de marketing de conteúdo. Quando ele consegue se afastar do teclado, ele gosta de saltar em volta do ginásio de sua casa (enquanto faz RPG como Goku) e cavar um bom romance de James Patterson.

Deixe uma resposta

O seu endereço de email não será publicado.