”74 % yrityksistä sanoo haluavansa olla ”datalähtöisiä”, mutta vain 29 % sanoo olevansa hyviä yhdistämään analyysit toimintaan.” – Forrester
Tilastojen ja datan tuottaminen, käsittely ja jakaminen – tekevätkö nämä toimet sinusta ”dataan perustuvan” yrityksen?
Totta kai tekevät, mutta jos päätöksiäsi ohjaavat tiedot ja tilastot ovat epätarkkoja tai täysin vääriä, siitä seuraavat negatiiviset tulokset voivat herättää hämmennystä ja huonoa suorituskykyä.
Luotettava data poistaa pelottavan vaihtoehdon, jossa on pakko tukeutua oikullisiin arvailuihin ja ”vaistomaisiin tunteisiin”. Se yhdistää inhimillisen kokemuksen ja intuition konkreettisiin numeroihin ja analytiikkaan, jotta voidaan synnyttää päätöksiä, jotka kykenevät liikuttamaan neulaa.
Mutta intuitiiviset kojelaudat, kaaviot, tilastot ja kuviot peittävät usein harhaanjohtavan todellisuuden:
Vääristeleviä tilastoja ja dataa.
Teknologian edetessä nopeasti ja käyttäjien sopeutuessa samaan tahtiin yritykset ovat tulleet riippuvaisiksi datan ja tilastojen varaan, jotta ne pystyvät selviytymään kilpailullisessa yritysympäristössä.
Mutta numeroiden ehdottomuus sokaisee helposti, varsinkin kun ne antavat uskottavuutta suotuisille hypoteeseille tai seikoille.
Vääränlaisten tilastojen ja datan tunnistamatta jättäminen on uhka tietoon perustuvalle päätöksenteolle.
Se rohkaisee painamaan sananmukaisesti vääriä nappeja täydellä luottamuksella, ja juuri siinä piilee vaara.
Tässä postauksessa opit tunnistamaan harhaanjohtavat tilastot ja data. Tarkastelemme yleisiä tapoja, joilla ne johtavat harhaan, ja miten määritetään, milloin data voi kantaa kriittisten päätösten painoa.
- Mikä on harhaanjohtava tilasto?
- Selektiivinen ennakkoasenne vääränlaisten tilastojen luomiseksi
- Neglected Sample Size Resulting In False Precision
- Väärät korrelaatiot ja syy-yhteydet luovat vääriä tilastoja
- Vääristelevät kaaviot ja visuaaliset esitykset
- Johtopäätös: Suojautuminen harhaanjohtavilta tiedoilta ja tilastotiedoilta
- Tekijästä
Mikä on harhaanjohtava tilasto?
Lähde
Hämäriä tilastoja syntyy, kun jossakin tutkimuksen kolmesta keskeisestä osa-alueesta on vika – oli se sitten tarkoituksellinen tai tahaton -:
-
Keräys: Käytetään pieniä otoskokoja, jotka ennustavat suuria lukuja, mutta joiden tilastollinen merkitys on vähäinen.
-
Organisointi: Jätetään pois havainnot, jotka ovat ristiriidassa sen kanssa, mitä tutkija yrittää todistaa.
-
Esittely: Visuaalisten/numeeristen tietojen manipulointi käsitykseen vaikuttamiseksi.
Väärät tilastot hiipivät uutisiin, mainoskampanjoihin ja jopa tieteelliseen kirjallisuuteen. Järkyttävät 33,7 % tiedemiehistä – dataneutraaliuden superlatiivit – on myöntänyt tilastojen väärinkäytön tutkimuksen tukena. Kyllä, jopa jotkut yhteiskunnan luotetuista tiedon portinvartijoista ovat syyllistyneet.
Voidaksemme auttaa sinua tekemään kriittisiä päätöksiä oikeiden tietojen perusteella, olemme listanneet tavallisimmat tavat, joilla tilastot johtavat harhaan ja antavat väärää tietoa.
Selektiivinen ennakkoasenne vääränlaisten tilastojen luomiseksi
Elizabeth Loftuksen tutkimuksessa testattiin kielen vaikutusta silminnäkijälausuntoihin. Koehenkilöille näytettiin elokuva, joka kuvasi useita auto-onnettomuuksia. Katsomisen jälkeen heiltä kysyttiin: ”Noin kuinka kovaa autot ajoivat, kun ne törmäsivät toisiinsa.”
Toisille koehenkilöille esitettiin sitten sama kysymys, joskin sana ”törmäsi” korvattiin vihjailevilla verbeillä, kuten:
-
Törmäsi
-
Törmäsi
-
Törmäsi
-
Törmäsi
-
Törmäsi
Tulokset?
Mitä vahvempaa ”kuormitettua” verbiä käytettiin, sitä korkeampi oli silminnäkijöiden nopeusarvio.
Lähde
Tutkimuksessa havaittiin lisäksi, että kun käytettiin vahvempaa verbiä, koehenkilöt ilmoittivat todennäköisemmin lasinsiruja onnettomuushetkellä, vaikka lasinsiruja ei näkynytkään videolla.
Kielen käyttäminen vaikuttamaan tutkimusvastauksiin ja -tuloksiin on vain yksi esimerkki valikoitumisharhapainotteisuudesta. Vuonna 2007 Advertising Standards Authority (ASA) pakotti Colgaten luopumaan väitteestään, jonka mukaan ”yli 80 prosenttia hammaslääkäreistä suosittelee Colgaten käyttöä”, koska väite antoi harhaanjohtavasti ymmärtää, että ”80 prosenttia hammaslääkäreistä suosittelee Colgate-hammastahnaa mieluummin kuin kaikkia muita merkkejä”.
Todellinen tutkimuskysymys kuului: ”Jos he saisivat valita pelkän harjauksen ja hammastahnan – kuten Colgaten – käytön välillä, kumpaa he suosittelisivat.”
Poimimalla kyselyvastauksen Colgate antoi vaikutelman, että hammaslääkärit suosittelivat niitä enemmän kuin kilpailijoiden tuotemerkkejä; varsinainen suositus oli, että minkä tahansa hammastahnan käyttäminen on parempaa kuin pelkkä harjaus.
Valikoivaa harhaa esiintyy usein silloin, kun valitut otokset tai tiedot ovat epätäydellisiä tai kirsikkapoimintoja, joilla vaikutetaan tilastojen ja tietojen käsitykseen – ja jopa vääristetään niitä.
Neglected Sample Size Resulting In False Precision
(lähde)
90 ihmistä vastaa ”kyllä” sadasta ihmisestä ( 90 %), vs. 900 ihmistä vastaa ”kyllä” tuhannesta ihmisestä (niin ikään 90 %)
prosenttiosuudet ovat samankaltaisia, mutta ero tietojen arvossa ja pätevyydessä on tilastollisesti merkitsevä.
Pienemmät otoskoot takaavat melkeinpä huolestuttavan merkitseviä tuloksia. Varo aina äärimmäisiä tuloksia, äläkä koskaan hyväksy prosenttiosuuksia nimellisarvona. Biokemian tutkijan Ana-maria Sundicin sanoin:
”Sen varmistamiseksi, että otos edustaa perusjoukkoa, otannan on oltava satunnaista, eli jokaisella tutkittavalla on oltava yhtäläinen todennäköisyys päästä mukaan tutkimukseen. On huomattava, että otantaharhaa voi esiintyä myös, jos otos on liian pieni edustamaan kohdejoukkoa.”
Väärät korrelaatiot ja syy-yhteydet luovat vääriä tilastoja
”Korrelaatio ei tarkoita syy-yhteyttä.”
Olet epäilemättä kuullut tämän lauseen aiemminkin, mutta hyvästä syystä se on totta.
Kun kaksi muuttujaa korreloi keskenään, pätee yleensä seuraava:
-
Y aiheuttaa X:n.
-
X aiheuttaa Y:n.
-
Kolmas tekijä laukaisee X + Y:n.
-
Korrelaatio on sattuman syytä.
Korrelaatio ja kausaatio aiheuttavat runsaasti epäluuloa, koska tutkijat – ja mainitun tutkimuksen kuluttajat – sortuvat:
-lukufetisismiin
-korrelaatioiden metsästykseen
Tyler Vegihn kokosi hauskoja harhaanjohtavia tilasto-esimerkkejä todistaakseen täsmälleen tämän:
Tämä kuvaaja kuvaa pakottavaa korrelaatiota uima-altaaseen pudonneiden hukkuneiden ihmisten määrän ja Nicolas Cagen näyttelemien elokuvien määrän välillä:
Toinen osoittaa korrelaation lakanoihin sotkeutumalla kuolleiden ihmisten määrän ja juuston kulutuksen välillä:
Tarkoittaako tämä, että juustonkulutuksen ja Nicolas Cagen näyttelijäroolien vähentäminen pelastaa ihmishenkiä? Todennäköisesti ei.
Koska tutkijoilla on paineita löytää hyödyllistä tietoa tai todistaa hypoteesi, houkutus julistaa ennenaikaisesti ”aha”- tai ”heureka”-hetki on suuri.
Tämä aiheuttaa ongelman terveille analyyseille ja tilastoille; heittäkää tarpeeksi muuttujia, ja löydätte lähes taatusti korrelaation, millä tahansa.
Vääristelevät kaaviot ja visuaaliset esitykset
Datan visualisoinnit muuttavat raa’at luvut visuaalisiksi esityksiksi keskeisistä suhteista, trendeistä ja kuvioista. Vaikka ne pystyvät herättämään datan eloon, ne ovat myös suosittu väline harhaanjohtavien tilastojen ja tietojen esittämiseen.
Datatoimittaja Alberto Cairo paljastaa kirjassaan ”Grafiikat, valheet, harhaanjohtavat visuaalit” harhaanjohtavia tilastoesimerkkejä markkinointimainoksista, poliittisista kampanjoista ja uutisoinnista.
Yksi suosituksi esimerkiksi uutisoinnissa nousee Terri Schiavon tapaus, kuoleman oikeuteen perustuva oikeusjuttu USA:ssa.
Jutun aikana CNN käytti alla olevan kaltaista kuvaajaa kuvaamaan sitä, miten eri poliittiset ryhmät suhtautuivat Terrin elintoimintojen poistamiseen:
Lähde
Tämän kuvaajan vilkaisu antaa ymmärtää, että republikaaneihin ja sitoutumattomiin verrattuna kolme kertaa useampi demokraatti oli samaa mieltä oikeusistuimen kanssa,
Tarkempi tarkastelu paljastaa kuitenkin pienen 14 %:n eron äänten välillä.
Lyhennetty kuvaaja ja peukaloitu Y-akseli (alkaa 50:stä 0:n sijasta) vääristävät tietoja ja saavat uskomaan liioiteltuun käsitykseen jostakin tietystä ryhmästä.
Välttääksesi harhaanjohtamisen tarkastellessasi kuvaajia ja visuaalista aineistoa kiinnittämällä huomiota seuraaviin seikkoihin:
-
perusviivan poisjättäminen tai lyhennetty akseli kuvaajasta.
-
Välien väliset arvot ja skaalat. Tarkista epätasaiset lisäykset ja parittomat mittaukset (numeroiden käyttö prosenttilukujen sijasta jne.).
-
Kokonaisyhteys ja muut vertailevat kuvaajat, jotta näet, miten samankaltaiset tiedot on mitattu ja esitetty.
Johtopäätös: Suojautuminen harhaanjohtavilta tiedoilta ja tilastotiedoilta
Hämärtävät tilastot ja tiedot ylpeilevät mahtipontisilla konversioluvun parannuksilla ”CTA-virityksillä” ja ”yksinkertaisilla värimuutoksilla”.
Näillä luodaan shokeeraavia otsikoita, jotka houkuttelevat liikennettä, mutta jotka parhaimmillaankin tuottavat virheellisiä näkemyksiä.
Pahat tilastot ja data ovat vaarallisia.
Sen sijaan, että ne auttaisivat sinua navigoimaan kiertotien, kuoppien ja sudenkuoppien läpi, ne tietoisesti – tai tietämättään – ohjaavat sinut suoraan niihin. Mutta sinä olet tarpeeksi fiksu havaitaksesi ne.
Ensi kerralla, kun kohtaat vakuuttavaa dataa, käy läpi nämä yksinkertaiset mutta tehokkaat kysymykset:
Kuka tekee tutkimuksen?
Tutkimus on kallista ja aikaa vievää. Tarkista, kuka sitä sponsoroi, punnitse heidän puolueellisuuttaan aihetta kohtaan ja sitä, miten he saattavat hyötyä tuloksista. Ovatko he B2C-yritys, jolla on tuote? Konsultointipalvelu? Riippumaton yliopiston rahoittama tutkimus?
Voidaanko otoskoko ja tutkimuksen pituus ottaa vakavasti?
Tarkistamalla tukevia tai verhottuja lukuja paljastuu heikko tilastollinen vahvuus.
Ovatko datan visuaaliset esitystavat oikeudenmukaisia?
Ovatko asteikot ja välit tasaisesti ja neutraalisti sijoitettuja? Edistääkö tilasto tiettyä ajatusta tai agendaa? Onko mittaristossasi liikaa mittareita?
Edustetaanko tutkimus rehellisesti ja puolueettomasti?
Tarkastele käytettyä kieltä, kysymyksen muotoilua ja tutkittavia henkilöitä.
Välttääksesi harhaanjohtavien tilastojen ja tietojen saastuttamasta mittaristojasi, raporttejasi ja analytiikkaasi, suhtaudu uusiin tietoihin uteliaalla ja skeptisellä asenteella.
Tekijästä
Hassan Uddeen on Yhdistyneessä kuningaskunnassa työskentelevä freelance-kirjoittaja, joka kirjoittaa tutkimuksia B2B-, SaaS- ja fintech-yrityksille. Hän rakastaa kaikkea sisältömarkkinointia. Kun hän saa itsensä irti näppäimistöltä, hän tykkää pomppia kotikuntosalillaan (roolipelaten samalla Gokua) ja kaivautua kunnon James Patterson -romaaniin.