Tilastoja, otoksia sekä johtopäätöksiä, osa 1

 

Pörssitutkijat tai ainakin palstoille johtopäätöksiään kirjoittavat ihmiset käyttävät yleensä aivan liian pieniä otoskokoja eli aineistoja. Kukapa sitä viitsisi tutkia tilastotiedettä hyväksikäyttäen vaikka tuki- vastustasoja, anomalioita tai edes pörssivoittojaan. Johtopäätöksistä saattaisi tulla turhan usein turhan sattumaperustainen. Mielestäni on kuitenkin hyvä, että lääketiede käyttää tilastotiedettä hyväkseen kun testataan lääkkeiden vaikutuksia se vaikuttaa ihmisten terveyteen. Systeemien testauksien laatu vaikuttaa taas varallisuuden siirtoon, mikä ei aina ole ehdottoman huono asia.

Kuitenkin lähdetään hieman yksinkertaistetusta esimerkistä. Kuvitellaan, että pörssiliike olisi täysin satunnaista ja edellisestä liikkeestä riippumatonta. Tällä liikkeellä olisi vain kuusi mahdollista arvoa (ne arvot voisivat vastata vaikka arvoja -3%-2%-1%-0%+1%+2%+3% ja nämä arvot valittaisiin arpakuutiolla. Arpakuutiota heitettäisiin 1000 kertaa. Kaikkia näitä arvoja pitäisi tulla yhtä paljon ja määrä oli 6/1000. 

Alla olevan kuvan tein juuri noin. Huomataan, että tässä satunnaisessa esimerkissä pörssi liikkui 18 % tapahtumista -3 % ja vastaavasti kuutosia tuli 14,5 % tapahtumista eli liike oli noissa tapahtumissa 3 % . Laskurytinää oli paljon enemmän kuin nousua, vaikka kyse oli ehdottomasti sattumasta. Teoriassa kaikkia näitä pitäisi tulla yhtä paljon ja havaitaan myös että noin 400 päivää nämä arvot lähestyivät melko voimakkaasti toisiaan ja sitten lähentyminen hidastui. Itse asiassa aineiston kasvaminen vaikuttaa tuohon lähentymiseen keskimäärin otoksen suuruuden neliöjuuren verran. Tämä 1000 päivän jakso tarkoittaa noin neljää vuotta ja se vastaa myös 1000 arvausta. Kymmenestä arvauksesta kasvu sataan vaikuttaa yhtä paljon kuin 1000 arvauksesta miljoonaan.

Aivan hyvin suurenkin voiton (tai tappion) voi saada onnella tai menetelmällä minkä pääasiallinen lähde on sattuma vaikka tekisi tuhat arvausta. Tämä on valtaosissa teknisen analyysin ennustemenetelmissä myös ennustekyvyn lähde eli sattuma. Näissä on vielä toinen mielenkiintoinen mutta valitettava virhelähde. Voimme laskea tuolle, vaikka 1000 pörssipäivälle välin mihin se päätyy 90 % todennäköisyydellä. Tämä tarkoittaa, että jos toisistaan riippumattomia 1000 päivän jaksoja on ääretön määrä, niin 18 kahdestakymmenestä satunnaisesta jaksosta osuu tuohon haarukkaan. Mutta jos meillä on vain yksi tällainen 1000 päivän jakso, niin emme voi mitenkään tietää kuinka poikkeuksellinen jakso se on. Eli toisin sanoen, mikäli testaamme jotain systeemiä, niin meidän pitää jakaa testattava jakso vaikka 20 vuotuiseen ajan jaksoon ja tutkia kuinka paljon tulee vaihtelua näiden vuotuisten tuottojen jaksossa. Ja samanaikaisesti jokaisena vuotena pitää tulla monta kauppaa, jotta voimme arvioida uskottavasti ja jollakin luotettavalla todennäköisyydellä sen ennustekykyä. 

Laitoin liitteeksi myös Excel-taulukon jolla arvotaan näitä arpakuutiopörssin arvoja.

Related Posts