“A cégek 74%-a azt mondja, hogy “adatvezérelt” akar lenni, csak 29% mondja, hogy jól tudja összekapcsolni az analitikát a cselekvéssel”. – Forrester
A statisztikák és adatok előállítása, feldolgozása és megosztása – ezek a tevékenységek teszik Önt “adatvezérelt” vállalattá?
Az biztos, hogy igen, de ha a döntéseit vezérlő adatok és statisztikák pontatlanok vagy teljesen hamisak, az ebből következő negatív eredmények zavart és rossz teljesítményt okozhatnak.
A hiteles adatok megszüntetik a szeszélyes találgatásokra és “megérzésekre” való támaszkodás ijesztő kilátását. Az emberi tapasztalatot és intuíciót konkrét számokkal és elemzésekkel kombinálja, hogy olyan döntések szülessenek, amelyek képesek elmozdítani a tűt.
Az intuitív műszerfalak, diagramok, statisztikák és grafikonok azonban gyakran hamis valóságot takarnak:
Megtévesztő statisztikák és adatok.
A technológia gyors fejlődésével és a felhasználók azonos ütemű alkalmazkodásával a vállalatok az adatokra és statisztikákra támaszkodnak a versenyképes üzleti környezetben való navigálásban.
A számok abszolút volta azonban könnyen elvakít, különösen, ha azok kedvező hipotéziseknek vagy pontoknak kölcsönöznek hitelességet.
A hamis statisztikák és adatok felismerésének elmulasztása veszélyezteti az adatvezérelt döntéshozatalt.
Ez arra ösztönöz, hogy teljes magabiztossággal nyomogassa a közmondásos rossz gombokat, és ebben rejlik a veszély.
Ebben a bejegyzésben megtudhatja, hogyan ismerheti fel a félrevezető statisztikákat és adatokat. Megnézzük, milyen gyakori módokon vezetnek félre, és hogyan határozhatjuk meg, hogy az adatok mikor bírják el a kritikus döntések súlyát.
- Mi a félrevezető statisztika?
- Selective Bias To Create False Statistics
- Hanyagolt mintaméret, ami hamis pontosságot eredményez
- Hibás összefüggések és ok-okozati összefüggések hamis statisztikák létrehozásához
- Megtévesztő grafikonok és vizuális ábrák
- Következtetés: A félrevezető adatok és statisztikák elleni védekezés
- A szerzőről
Mi a félrevezető statisztika?
Forrás
A félrevezető statisztikák akkor jönnek létre, ha a kutatás 3 fő szempontjának egyikében – szándékos vagy szándéktalan – hiba van:
-
A gyűjtés: Kis mintaméretek használata, amelyek nagy számokat vetítenek előre, de kevés statisztikai szignifikanciával rendelkeznek.
-
Szervezés: Olyan eredmények kihagyása, amelyek ellentmondanak annak, amit a kutató bizonyítani akar.
-
Bemutatás: A vizuális/numerikus adatok manipulálása az észlelés befolyásolása érdekében.
A rossz statisztikák bekúsznak a hírekbe, a reklámkampányokba és még a tudományos irodalomba is. A tudósok megdöbbentő 33,7%-a – az adatsemlegesség szuperlatívuszai – elismerte, hogy visszaéltek a statisztikákkal a kutatások alátámasztására. Igen, még a társadalmak néhány megbízható információs kapuőrje is bűnös.
Azért, hogy segítsünk a helyes adatokon alapuló kritikus döntések meghozatalában, felsoroltuk a statisztikák gyakori félrevezetési és félretájékoztatási módjait.
Selective Bias To Create False Statistics
Elizabeth Loftus tanulmányában a nyelvnek a szemtanúk vallomásaira gyakorolt hatását tesztelte. Az alanyoknak egy több autóbalesetet ábrázoló filmet mutattak be. Miután megnézték, megkérdezték tőlük: “körülbelül milyen gyorsan mentek az autók, amikor egymásnak ütköztek?”
Más alanyoknak ezután ugyanezt a kérdést tették fel, bár az “összeütközött” szót olyan szuggesztív igékkel helyettesítették, mint:
-
összeütközött
-
összeütközött
-
összeütközött
Az eredmények?
Minél erősebb volt a használt “terhelt” ige, annál magasabb volt a szemtanúk által becsült sebesség.
Forrás
A tanulmány szerint továbbá, ha erősebb igét használtak, az alanyok nagyobb valószínűséggel számoltak be törött üvegről a balesetnél, még akkor is, ha a videón nem látszott törött üveg.
A nyelvhasználat a felmérési válaszok és eredmények befolyásolására csak egy példa a szelekciós torzításra. 2007-ben a Reklámfelügyelet (ASA) arra kényszerítette a Colgate-et, hogy hagyjon fel azzal az állítással, miszerint “a fogorvosok több mint 80%-a ajánlja a Colgate fogkrém használatát”, mivel az állítás félrevezető módon azt sugallta, hogy “a fogorvosok 80%-a a Colgate fogkrémet ajánlja minden más márkával szemben”.
A tényleges felmérési kérdés így szólt: “Ha választhatnának a fogmosás és egy fogkrém – például a Colgate – használata között, melyiket ajánlanák.”
A felmérés válaszainak cseresznyézésével a Colgate azt a benyomást keltette, hogy a fogorvosok őket ajánlják a versenytársak márkáival szemben; a tényleges ajánlás az volt, hogy bármelyik fogkrém használata jobb, mint a fogmosás önmagában.
A szelektív torzítás gyakran akkor fordul elő, amikor a kiválasztott minták vagy adatok hiányosak vagy cseresznyeválogatással befolyásolják a statisztikák és adatok megítélését – és akár torzítják is azokat.
Hanyagolt mintaméret, ami hamis pontosságot eredményez
(forrás)
90 ember, aki 100 emberből “igennel” válaszol ( 90%), szemben 900 emberrel, aki 1000 emberből “igennel” válaszol (szintén 90%); a százalékok hasonlóak, de a különbség az adatok értékében és érvényességében statisztikailag jelentős.
A kisebb mintaméretek szinte garantálják a riasztóan szignifikáns eredményeket. Mindig óvakodjunk a szélsőséges eredményektől, és soha ne fogadjuk el a százalékokat névértéken. Ana-maria Sundic biokémikus kutató szavaival:
“Ahhoz, hogy a minta reprezentatív legyen a populációra nézve, a mintavételnek véletlenszerűnek kell lennie, azaz minden alany számára azonos valószínűséggel kell a vizsgálatba bekerülnie. Meg kell jegyezni, hogy a mintavételi torzítás akkor is előfordulhat, ha a minta túl kicsi ahhoz, hogy reprezentálja a célsokaságot.”
Hibás összefüggések és ok-okozati összefüggések hamis statisztikák létrehozásához
“Az összefüggés nem jelent ok-okozati összefüggést.”
Kétségtelenül hallotta már ezt a mondatot, de jó okkal igaz.
Amikor két változó korrelál, általában a következők érvényesek:
-
Y okozza X-et.
-
X okozza Y-t.
-
Egy harmadik tényező váltja ki X + Y-t.
-
A korreláció a véletlennek köszönhető.
A korreláció és az oksági összefüggés rengeteg gyanakvást indokol, mert a kutatók – és az említett kutatások fogyasztói – áldozatul esnek:
-számfetisizmus
-korrelációvadászat
Tyler Vegihn összeállított néhány vicces félrevezető statisztikai példát, hogy pontosan ezt bizonyítsa:
Ez a grafikon meggyőző összefüggést ábrázol a medencébe zuhanva megfulladt emberek száma és a Nicolas Cage által játszott filmek száma között:
Egy másik korrelációt mutat az ágyneműbe gabalyodva meghalt emberek száma és a sajtfogyasztás között:
Ez azt jelenti, hogy a sajtfogyasztás és Nicolas Cage színészi szerepeinek csökkentése életeket ment? Valószínűleg nem.
Mivel a kutatókra nagy nyomás nehezedik, hogy hasznos adatokat fedezzenek fel vagy egy hipotézist bizonyítsanak, nagy a kísértés, hogy idő előtt kijelentsék az “aha” vagy “heuréka” pillanatot.
Ez problémát jelent az egészséges elemzések és statisztikák számára; dobj be elég változót, és szinte garantáltan találsz összefüggést, bármivel.
Megtévesztő grafikonok és vizuális ábrák
Az adatvizualizációk a nyers számokat a legfontosabb összefüggések, trendek és minták vizuális ábrázolásává alakítják. Miközben képesek életre kelteni az adatokat, népszerű médiumai a félrevezető statisztikáknak és adatoknak is.
A “Grafikonok, hazugságok, félrevezető vizuális eszközök” című könyvében Alberto Cairo adatújságíró félrevezető statisztikai példákat mutat be marketingreklámokból, politikai kampányokból és híradásokból.
Egy népszerű példa a hírekből a Terri Schiavo-ügy, a halálhoz való jog jogi ügye az Egyesült Államokban.
Az ügy során a CNN az alábbi grafikonhoz hasonlót használt, hogy bemutassa, hogyan vélekedtek a különböző politikai csoportok Terri életfenntartó berendezésének eltávolításáról:
Forrás
Egy pillantás erre a grafikonra azt sugallja, hogy a republikánusokhoz és a függetlenekhez képest a demokraták közül háromszor annyian értettek egyet a bírósággal
A közelebbről nézve azonban kiderül, hogy csak 14%-os különbség van a szavazatok között.
A csonka grafikon és a manipulált Y-tengely (0 helyett 50-nél kezdődik) torzítja az adatokat, és arra késztet, hogy egy bizonyos csoportról eltúlzott elképzelést higgyen.
A grafikonok és látványtervek megtekintésekor elkerülheti a félrevezetést, ha odafigyel:
-
A grafikonon az alapvonal vagy a csonka tengely kihagyása.
-
Az intervallumok és skálák. Ellenőrizze az egyenlőtlen növekményeket és a páratlan méréseket (számok használata százalékok helyett stb.).
-
A teljes összefüggés és más összehasonlító grafikonok, hogy lássa, hogyan mérik és ábrázolják a hasonló adatokat.
Következtetés: A félrevezető adatok és statisztikák elleni védekezés
A félrevezető statisztikák és adatok grandiózus konverziós arány javulásokkal büszkélkednek a “CTA-csípésekkel” és “egyszerű színváltoztatásokkal”.
Sokkoló címeket hoznak létre, amelyek tömeges forgalmat vonzanak, de a legjobb esetben is hibás betekintést nyújtanak.
A rossz statisztikák és adatok veszélyesek.
Ahelyett, hogy segítenének eligazodni a kitérők, kátyúk és buktatók között, tudatosan – vagy tudtán kívül – egyenesen beléjük terelnek. De Ön elég okos ahhoz, hogy észrevegye őket.
Amikor legközelebb meggyőző adatokkal találkozik, futtassa végig ezeket az egyszerű, de erőteljes kérdéseket:
Ki végzi a kutatást?
A kutatás drága és időigényes. Ellenőrizze, ki szponzorálja, mérlegelje a témával kapcsolatos elfogultságát, és azt, hogy milyen hasznot húzhat az eredményekből. B2C vállalatról van szó, amelynek terméke van? Egy tanácsadói szolgáltatás? Egy független egyetem által finanszírozott tanulmány?
A mintaméret és a vizsgálat hossza komolyan vehető?
A támogató vagy burkolt számok vizsgálata leleplezi a gyenge statisztikai erőt.
Az adatok vizuális megjelenítése tisztességes?
A skálák és intervallumok egyenletesen és semlegesen vannak elhelyezve? Egy statisztika egy adott gondolatot vagy napirendet támogat? Túl sok mérőszám van a műszerfalon?
A kutatás őszintén és pártatlanul van ábrázolva?
Vizsgálja meg a használt nyelvezetet, a kérdés megfogalmazásának módját és a megkérdezetteket.
Hogy a félrevezető statisztikák és adatok ne szennyezzék műszerfalait, jelentéseit és analitikáját, az új információkat kíváncsian és szkeptikusan fogadja.
A szerzőről
Hassan Uddeen az Egyesült Királyságban élő szabadúszó író B2B, SaaS és fintech vállalatok számára. Imád mindenféle tartalommarketinget. Amikor el tudja szakítani magát a billentyűzettől, szeret otthoni edzőtermében ugrálni (miközben Goku szerepjátékot játszik) és beleássa magát egy jó James Patterson-regénybe.