keskiviikko 12. syyskuuta 2012

Poikkitieteellistä tilastointia



Suomen Kuvalehti


Suomen Kuvalehti  teki jutun kuntavaaleista. Sen taustamateriaalina on Taloustutkimuksen  tekemä tutkimus, jolla koetettiin selvittää ihmisten äänestyskäyttäytymistä ja syitä siihen. Tutkimukseen haastateltiin 960 ihmistä. 

Kysymykset ja vastausvaihtoehdot olivat tällaisia.

Lokakuun lopulla pidetään Suomessa kunnallisvaalit. Miten paljon seuraavat asiat vaikuttavat siihen, ketä aiotte äänestää syksyn kunnallisvaaleissa?

Hallituksen ajama kuntauudistus

4 = Vaikuttaa erittäin paljon
3 = Vaikuttaa jonkin verran
2 = Vaikuttaa vähän
1 = Ei vaikuta lainkaan

Ei osaa sanoa

Tässä graafinen esitys tuloksista. 



Huomiota kiinnittää se, että tulokset on esitetty graafisesti yhtä pitkillä  lineaarisella asteikoilla riippumatta siitä, mitkä ovat lukemat kussakin osiossa.  Ääripäiden sanallinen kuvailu on aina sama riippumatta siitä, millaisia lukuarvoja on saatu. Tulosten keskinäinen vertailu on aika hankalaa, eikä siinä auta kahden desimaalin tarkkuuskaan. Mitä voidaan pitää aika rohkeana tilastomatemaattisena vetona. Onhan kyseessä vain järjestysasteikko.

Ihmetystä herättää myös se, että kaikkia puolueita ei ole grafiikassa. Nythän siinä suurin osa on tyhjää tilaa.

Jostain syystä tuloksien väitetään olevan keskiarvoluku asteikolla 1-5, vaikka itse tutkimuksessa on käytetty asteikkoa 1-4.

Tällä palstalla vakiokommentti on, että olisitko itse osannut tehdä paremmin. No olisin. Tässä esimerkki yhden kysymyksen osalta. 


Vaikka kyselyssä asteikko on 1-4, niin tässä käytetty olisi minusta loogisempi. Arvo nolla olisi "nollatulos", eli varmasti ei äänestäisi.

3 = Vaikuttaa erittäin paljon
2 = Vaikuttaa jonkin verran
1 = Vaikuttaa vähän
0 = Ei vaikuta lainkaan


Mitä tästä ihan oikeasti voidaan päätellä on se,
että keskustalaiset itse kokevat hallituksen kuntauudistuksen vaikuttavan heidän ehdokkaan valintaansa keskimäärin enemmän kuin muita puolueita äänestävät kokevat. Ei mitään sen enempää. Mitä itse kullekin tarkoittaa "vaikuttaa vähän" ja mitä "vaikuttaa jonkin verran", sitä voidaan vain arvailla.

 Myös keskihajonta on oleellinen. Ruotsalaiset ovat yhtenväisä kannastaan, kuten aina.  Kristilliset taas hapuilevat eniten.

Milenkiintoista on tarkastella myös kannastaan tässä vaiheessa epävarmojen osuuksia. Herra ei ole varmaan vielä ilmestynyt unessa kaikille kristillisille kertoen, ketä pitää äänestää.

Tulihan jälleen kerran todistettua: valhe, emävalhe, tilaston tulkinta. Ehkä lievää totuuden muuntelua on ollut vastaajillakin, kun varmasti ja melko varmasti kertoo äänestävänsä 86%. Todellisuudessa äänestysprosentti kunnallisvaaleissa on viime aikoina ollut siellä 60 korvilla.

5 kommenttia:

Anonyymi kirjoitti...

Mikäs tässä nyt on ongelmana?

Timo Suvanto kirjoitti...

Keskiarvojen ja keskihajonten numeeriset arvot ovat vain karkeasti suuntaa antavia. Tilastolliseti ei voida laskea muita keskilukuja kuin mediaani ja tyyppiarvo, jos muuttuja on järjestysasteikollinen. Kuten tässä siis on.

Sakari kirjoitti...

Käyttäytymistieteille on tyypillistä ja tavanomaista (vakiintunut käytäntö), että järjestysasteikosta tehdään suhdeasteikko, vaikka sekä välimatkat että nollapiste puuttuvat. Siitähän ei voi seurata kuin nollatutkimusta, kun sitten tilastomatemaattisia keinoja sovelletaan huteroon tai järjettömään aineistoon. Mutta, muutakaan ei ole, niin niillähän on pärjäiltävä. Hupaisia ovat sitten esim. nuo "virhemarginaali on 2,5 %-yksikköä suuntaansa" -jutut.... Koko aineiston laatu riippuu vahvasti kysymysten muotoilusta, ja yleiset "mitä kuuluu ja mitäs tykkäät" - tyyliset kysymysasettelut saavat lukijan/katsojan/kuulijan lähinnä niitten vaihtoehtojen eteen, ettei tiedä itkisikö vai nauraisiko.

Uutisiahan noista "tutkimuksista" saadaan suureen puutteeseen. Minkään sortin ennustavuutta niillä ei ole. Hyvä esimerkki taisi olla viime pressanvaaleissa; Paavo V:n kannatuslukemat olivat kaikissa tutkimuksissa 5-7 %. Paavo itse veti hihasta paljon osuvamman ennusteen sanomalla vaalitentissä 15 %. Lopputulos oli 17,5 %, siis yli kymmenen yksikköä heittoa "tutkimusten" tuloksista. -Siinä tosin taisi vastaajajoukon valinta olla suurempi ongelma kuin kysymysten huono muotoilu, mutta täydellistä osaamattomuutta se kuitenkin kaupallisten tutkimuslaitosten osalta viestii.

Sakari kirjoitti...

Vastikään uutisoitiin suurella touhulla, kuinka Taloustutkimuksen mukaan SDP on laskussa ja Kokoomus nousussa (siis kuukauden aikajaksolla.... :)

Heinäkuussa SDP:n kannatus oli 20,3 % ja elokuussa 18,7 %. Kokoomuksella luvut olivat 20,8 ja 22,7 %. Selvä muutos, johtui varmaankin elokuun sateisuudesta.... Tilastolliseksi virhemarginaaliksi ilmoitetaan +/- 1,8 prosenttiyksikköä. Kahden mittauksen erotus voi siis heittää 3,6 prosenttiyksikköä ihan tilastomatemaattisestikin, jos toisen heitto on ylös- ja toisen alaspäin. Kummakin puolueen osalta muutokset mahtuvat hyvin siihen virhemarginaaliin. Eli siis aikuisten oikeasti jutusta ei voi päätellä yhtikäs mitään.

Eipä se uutisointia jarruttele.... ja ainahan joku saattaa ottaa nuo "tutkimukset" ihan todestakin :)

http://www.taloustutkimus.fi/tuotteet_ja_palvelut/puolueiden_kannatusarviot/puolueiden-kannatusarviot-2012/

Timo Suvanto kirjoitti...

Ei se nyt ihan noinkaan mene. Paremman lähteen puutteessa vaikka tässä blogissa otsikolla "Virhemarginaalissa".

Sen sijaan uutisoinneissa puuttuu säännöllisesti vähäisinkin tieto tutkimuksesta. Ketä haastateltiin, miten haastateltiin, mitä kysyttiin. Esimerkiksi tässä elokuun luvut koskevat kuntavaaleihin liittyvää kyselyä, aiemmat jotain muuta. Kuntavaalit ovat paljon enemmän henkilövaalit kuin eduskuntavaalit. Yli puoluerajojen äänestetään runsaasti. Eri kysymykset, eri tulokset.