Tilastoja, otoksia sekä johtopäätöksiä, osa 4

 

Tilasto- ja todennäköisyystieteen käyttöä pörssimenetelmien arviointiin käytetään luvattoman vähän. Syynä on mielestäni varsinkin tilastotieteen termien sekavuus ja myös ristiriitaisuus.

Tilastotiede perustuu historiansa puolesta kaikenlaiseen epämääräiseen kuten uhkapeleihin, salakirjoitukseen ja vaaleihin. Ne ovat sosiaalisia ilmiötä ja tilastotiede taas abstraktia matematiikkaa. Terminologia kuulostaa tutulta suomenkieleltä, mutta sen merkitys on jotain muuta kuin suomea tai englantia. On merkitsevä ja ei merkitsevä, ikään kuin noiden raja olisi terävä ja täsmällinen. Monesti merkitsevyystasona pidetään 5% eli yksi tapaus kahdestakymmenestä tapauksesta ei mene näiden rajojen sisälle. Miksi ei rajana ole 4,9% tai 5,1% tai miksi ylipäätään on tällainen verbaalinen raja? Yksi sotkeva ja älytön termi on nollahypoteesi. Minä joudun aina miettimään erikseen, että onko hypoteesi totta jos nollahypoteesi on totta tai ei-totta. Kolmas tilastotiedettä vaivaava seikka on jakaumien nimet. Meillä on studentin jakauma, gaussin jakauma, F-jakauma,p-arvo, t-testi,… Nimet eivät kerro mitään vaan ovat syntyneet historiansa vuoksi. Monet tilastotieteelliset asiat ovat syntyneet maatalouden ja laadunvalvonnan sivutuotteena. Yksi merkittävä paikka on ollut oluttehdas Guinness. Tehdas palkkasi tilastotieteilijäksi Gossetin, missä hän kehitti merkittävän studentin jakauman ja t-testin. Ei ihme, että termit ovat sekavat jos ne on tehty kaljahuuruisessa ympäristössä.

Tilasto- ja todennäköisyyslaskenta liittää todellisen elämän matematiikan täsmällisen keinotekoiseen maailmaan. Meillä on aina sosiaalisessa elämässä, kuten vaikka pörssissä, tekijöitä joita emme voi mallintaa. Näiden mallintamattomien tekijöiden suuruutta ja todennäköisyyttä voimme arvioida matemaattisesti. Satunnaisia tekijöitä on kahden laisia, on tekijöitä mitkä ovat aidosti satunnaisia. Tällainen aidosti satunnainen tekijä on esimerkiksi lotto. Se voidaan mallintaa täydellisesti vaikka kyseessä on täysin satunnainen ilmiö. Toisenlainen satunnainen ilmiö on sää. Jos pystyisimme mittaamaan kaikki pisteet maapallolla ja ymmärtäisimme täysin fysiikan me emme ennustaisi säätä vaan tietäisimme millainen sää tulee huomenna. Nyt joudumme tilastollisella päättelyllä ennustamaan säätä, koska emme pysty mallintamaan täysin ilmakehäämme. Näiden kahden ilmiön yhdistelmä on pörssimaailma, sen epävarmuus syntyy siitä, että emme pysty mallintamaan koko pörssimaailmaa ja toisaalta siellä on paljon myös aidosti satunnaisia tekijöitä. Miksi ihmeessä yleisessä pörssikeskustelussa saa julkisuutta paljon ennustajat ja menetelmät joiden ennusteiden paikkansapitävyyttä ei arvioida tilastotieteellisin menetelmin?

Uskon, että kyseessä on pitkälle tilastotieteen terminologian hankaluus ja tietenkin näiden ennustajien haluttomuus altistua analyyttiseen tutkimiseen. Miksi korteista tai kahvinpuruista ennustajiin suhtaudutaan väheksyvämmin kuin pörssiennustajiin, kysyn minä. Tämä ei ole reilua, vaikka useasti kummankin ennustajaryhmän suurin ja useasti ainoana selittävänä tekijänä on sattuma.

6 thoughts on “Tilastoja, otoksia sekä johtopäätöksiä, osa 4

  1. Täsmälliset menetelmät – osaamattomat tutkijat

    Väittäisin että menetelmät ovat täsmällisiä (matemaattisesti perusteltavissa) sellaisenaan ja takaa löytyy ihan kaunis logiikka. Minusta ongelmat liittyvät useammin siihen mistä data tulee (kuinka se on kerätty, mitä se edustaa), onko sitä analysoitu oikeilla menetelmillä, oikeaoppisesti (tehty vain sellaisia asioita joita voi ja saa ko. menetelmällä tehdä) ja voipa vielä tulosten tulkintakin mennä pieleen mutta tästä viimeisestä jää helpommin kiinni. Tosin viimeiseen liittyy tutkimusongelman operationalisointi eli vastaako tutkittava data ja sen analyysi oikeasti ilmiöön ja kysymykseen johon halutaan vastausta. Tästä esimerkkinä tuli mieleen ympäristöasioiden sosiaalisen paineen tutkimus jenkeissä, jossa käytetään paikallista ympäristöjärjestön (Sirra Club) jäsenmäärän kokoa (suhdetta) osoituksena sosiaalisesta paineesta ympäristöasioisssa.Onko tällainen luku hyvä proxy johonkin? Näin tutkimuksessa usein tehdää, ajatellaan että tietyn datan avulla voidaan muodostaa käsitys siitä mitä jonkin sosiaalinen ilmiö on. Kyse on usein siitä että parempaakaan numeerista dataa ei ole olemassa ja saatavilla.

    Viime viikon SPSS:n parissa viettäneenä tuntuu myös siltä että kynnys käyttää tilastollista analyysia on laskenut. SPSS ei ole minun core competence lainkaan. Ohjelmilla saa aikaa aika nopeasti jotain kun joku neuvoo, mutta sellainen varmuus että tekee oikeita asioita oikein, jää usein saavuttamatta. Liian paljon yksinkertaisesti väärin tehtyä tutkimusta pääsee läpi, luonnollisesti näin ilman vertaisarviointia mutta myös vertaisarvioinnin läpikäyneenä.

    Tämä Gobon kirjoitus voi olla kiinnostava tilastollisen (ja laadullisenkin tutkimuksen) pohtimiseen: G. Gobo: "Sampling, representativeness and generaliability", teoksessa Seale, Gobo, Gubrium, Silverman (eds) Qualitative Research Practice, 2004, s. 405–424.

    http://ggobors.ariel.ctu.unimi.it/repository/ggobors/sage2004.pdf

     
     
    1. Tilasto ja keskimääräisesti oikeassa oleminen

       

      Logiikkaa löytyy vaikka mistä. Jos ajatellaan vaikka CAPM-mallia niin mallina se on kaunis ja looginen. Mutta valitettavasti osakkeiden heilunta ei juurikaan selitä osakkeiden tuottoa. Tai vaikka moderni portfolioteoria joka näyttää loogisen optimaalisen portfolion. Malli on vain äärettömän herkkä tuotolle, volatiliteetille ja keskinäiselle korrelaatiolle. Sitä ei kauheasti pysty käyttämään käytännön salkun rakentamisessa, vaikka kaunis rakennelma se on. Matemaattisesti ne ovat tietenkin johdettu oikein, mutta käytännön tekemistä niillä ei juurikaan ole. Tai makrotaloustieteessä vaikka phillippsin käyrä, mikä oikeasti ennustaa paremmin menneisyyttä vuosina 1861-1957 kuin tulevaisuutta, ettei vain homma olisi tehty käyttäen syntistä curve fittingiä. Moni on saanut jopa Nobel-palkintoja kun on kritisoinut mallia. Näitä on makrotaloustieteessä paljonkin kuten vaikka verojen ja kansantuotteen kasvuvauhdin suhde….

      Puhtaassa sijoittamisessa verrataan taas herkästi vaikka kansantuotteen kasvua ja pörssikursseja, nekin korreloivat huonosti keskenään. Tai vaikka indeksien 200 päivän kasvu suhteessa tulevaan kasvuun tai oikeastaan mikä tahansa TA:n menetelmä. Esimerkkejä on paljon ja vain harvoja yleensä kyseenalaistetaan. Monet pörssiajatelmat voidaan testata, nuo makrotaloustieteen asiat ovat vaikeampi testata koska aineistoa on niin vähän ja niihin vähäisiin asioihin vaikuttaa niin monet muutkin asiat. Mutta monet makrotaloudelliset ideat kuitenkin perustellaan jollakin tilastollisella menetelmällä vaikka ko. tilastollinen menetelmä ei kerro oikeastaan mitään.

      Luin jostakin, että taloustieteelliset teoriat ovat muiden tieteiden piirissä kaikkein vähiten siteerattuja. Ehkä siihenkin on syy jos miettii vaikka tehokkaiden markkinoiden hypoteesia.

    2. Tilastollisten menetelmien käyttö vaatii ammattitaitoa

      Olen samaa mieltä; monet tilastolliset menetelmät vaativat käyttäjältään aivan hurjan määrän ymmärrystä ja ammattitaitoa.

      Yritin pari vuotta sitten ratkaista tilastollista ennestamistehtävää ja perehdyin asiaan kirjallisuuden perusteella. Päädyin sitten käyttämään "Linear Prediction Coding" nimistä teoreettisesti haastavaa menetelmää. Luin menetelmään liittyvät teoriat ja rakensin laskennan tämän perusteella. Mutta systeemi ei toiminut. Minulta meni varmaan parin kuukauden työ ymmärtää, miksi tuo menetelmä ei minun silloisessa ongelmassani toiminut.

      Loppujen lopuksi vaihdoin menetelmää ja aikanaan löysin minun ongelmassani toimivan menetelmän. Piti loppujen lopuksi rakentaa (ohjelmoida) ihan oma työkalu.

      En ole tilastotieteen ammattilainen, mutta tämä seikkailu opetti minua kunnioittamaan tuota ammattikuntaa. Oikeilla menetelmillä saa tulosta, mutta alalla on hirveän monimutkaisia työkaluja ja menetelmiä, joiden luonne täytyisi ymmärtää ennen kuin saa kunnon tuloksia.

      1. Kuinka arvioida tuloksien oikeellisuutta?

        Mutta kuinka voi arvioida tuloksien oikeellisuutta tai riskiä menetelmien tuottamista virheistä jos ei itse osaa tehdä vastaavaa tutkimusta? Mielestäni lähes kaikissa tutkimuksissa on ongelmana se, että ei tarpeeksi laajasti tuoda julki tutkimuksessa olevia virhelähteitä sekä epävarmuuksia. Tekijä ne tuntee kuitenkin parhaiten. Ajankohtainen esimerkkinä vaikka tämä D-vitamiini kohu. Siinä ilmeisesti kerrottiin, että tällä uudella tavalla mitattuna tietyissä D-vitamiinivalmisteissa ei ole luvattua määrää vitamiinia. Ei pohdittu ainakaan lehdistötiedotteessa analyysimenetelmän eroavaisuuksia verrattuna standarditestiin. Ei myöskään tuotu julki kovinkaan painokkaasti, että eroavaisuus saattaa johtua juuri tästä.
         

      2. Tiede ja teolliset analyysit

         

        D-vitamiinikohun suhteen täytyy huomata, että teollisuuden analyysimenetelmät usein perustuvat toimialan itse sopimiin standardeihin. Niiden tuloksella ei välttämättä ole kovin suurta korrelaatiota itse mitattuun suureeseen. Useimmiten mittauksia tarvitaan yhtiön sisällä prosessien ohjaamiseen, ei niinkään loppukuluttajalle. Toisinaan toimialan standardien ainoa tarkoitus on estää uusien tulokkaiden tulo alalle, ei niinkään kuluttajan etu.

        Itse muistan lukeneeni kummallisuudesta bensiinin sisältäminen haihtuvien mittaamisesta ASTM standardin mukaan. Analyysistä jätettiin pois yksi pentaani-yhdiste. Miksikö, en muista oliko syynä mittauksen vaikeus vai se, että kaikki USA:n jalostamot olisivat ylittänet sallitun haihtuvien määrän. Mutta näin vai tehtiin ja hyvin saatiin autot kulkemaan eikä ainakaan liian moni huoltoaseman asiakas kuollut bensiinihöyryihin.

        Ja itse aihe tilastot ja osakesijoittaminen. Osakemarkkinoilla on niin paljon hälyä ja väärää signaalia, että ilmeisesti kaikki mitattavissa oleva hukkuu hälyn alle. Jos näin ei olisi, me sijoittajat olisimme kaikki yhtä rikkaita kuin Warren Buffet wink.

      3. Osakemarkkinat ovat pieneltä osin ennustettavia

        Osakemarkkinoilla on erittäin paljon hälyä ja vääriä signaaleita. Mutta kaikki mitattavissa oleva ei osakemarkkinoillakaan huku hälyn alle. Siksi jotkut pärjäävät hieman paremmin kuin toiset. Todistettavasti esimerkiksi Warren Buffet ja Suomessa sijoitusyhtiö Lokki Oy ovat pärjänneet hieman muita paremmin pitkällä aikavälillä. 

Comments are closed.

Related Posts