Mutta jos jaksat niin kuulisin toki vastauksesi vaikka yksityisviestinä (tässä ketjussa on tosiaan ehkä turha sillä linjalla jatkaa) - tilastollisessa päättelyssä kun tuntuu toisinaan vallitsevan oma logiikkansa, jonka perusteluita haluaisin ymmärtää, ts. "Olen nähnyt meidän mummolassa vain valkoisia lampaita, siispä kaikki lampaat ovat todennäköisesti valkoisia"
Ehkäpä tätä voisi yrittää jatkaa samassa ketjussa, sillä ajatuksella että kuitenkin mietitään sitä, kuinka hyviä neuvoja aktiiviharrastaja voi ylipäänsä antaa aloittelijalle. Melkoisen abstrakteista lähtökohdista vaan... Laitan kuitenkin näin erilliseen viestiin, niin saa myös helposti omaksi ketjukseen.
Mitä alunperin sanoit, oli jotain tämänsuuntaista predikaattilogiikalla esitettynä:
( p(X) -> kaikille Y p(Y) ) = EPÄTOSI
Eli yhdelle X:lle, tässä tapauksessa henkilölle, pätevästä asiasta p ei voida johtaa, että sama asia p pätee kaikille. Ja näinhän se toki on.
Mitä tarvitaan lisää, jotta tuonkaltaisia johtopäätöksiä voi tehdä? Absoluuttisia johtopäätöksiä ei voida tehdä, joten tarvitaan formalismi, jolla voidaan käsitellä epävarmuutta, eli esimerkiksi frekventistinen tai bayesilainen todennäköisyyskalkyyli.
Pelkästä yhdestä havainnosta ei voida vielä päätellä mitään, edes epävarmuus sallien. Tarvitaan myös alkuoletuksia. Tässä tapauksessa tärkeimmät niistä olivat: "minun havainnot ovat samansuuntaisia kuin muidenkin, koska olemme kaikki ihmisiä", ja: "jos en minäkään jaksa, niin miten jaksaa aloittelija, joka ei ole sisäistänyt myllyn veivaamisen tärkeyttä". Ensimmäinen on aika selvä, mutta toki myös triviaali. Toinen sanoo, että aloittelijoiden populaatioon sijoitettuna minä edustaisin keskimääräistä motivoituneempaa myllyn käyttäjää. Sen voi toki kyseenalaistaakin.
Bayesilainen ajattelisi asian kai jotenkin näin. Meillä on data D (havainto yhden henkilön myllynkäytöstä) ja malli H (myllynkäyttötottumukset koko populaatiossa). Näiden todennäköisyydet noudattavat Bayesin lakiin perustuvaa kaavaa:
P(H|D) = ( P(D|H) P(H) ) / P(D)
P(H|D) on "lopputilanne", eli datan pohjalta päivitetyn mallin todennäköisyys. P(H) on "lähtötilanne", eli malli ennen datan näkemistä. P(D|H) on datan todennäköisyys kun malli on annettu eli datan "yllätyksellisyys". P(D) on datan todennäköisyys, joka usein jätetään huomiotta. Päättely on todennäköisyyksien päivittämistä datan pohjalta. Jos meidän malli olisi "käsimyllyn käyttö ei ole ihmeempi vaiva kenellekään" ja data "yhden henkilön mielestä käsimyllyn käyttö on vaivalloista", niin data olisi yllätyksellinen ja sen pohjalta voitaisiin päivittää todennäköisyyksiä. Päättelyä olisi siis tapahtunut. Kuitenkin jos todennäköisyydet olisi järkevästi määritetty, niin yhden henkilön pohjalta populaatioita koskevia todennäköisyyksiä päivitettäisiin minimaalisen vähän.
Frekventistinen versio voisi lähteä nollahypoteesista "myllyn käyttö ei ole vaivalloista", ja määrittää todennäköisyyden datalle, kun nollahypoteesi pätee. Empiirisellä p-arvon määritelmällä se olisi p=0.5, joka ei ole millään kohtuudella merkitsevä. Olettamalla vaivalloisuuden kokemukselle sopivan jakauman saataisiin p-arvo, joka olisi pienempi eli p<0.5, mutta vain vähän. Johtopäätös siis olisi, että nollahypoteesi pätee, josta kai voinee myös sanoa, että tapahtui päättelyä. Ja toki "oikeaakin" päättelyä eli nollahypoteesin hylkäämistä voitaisiin tehdä, jos alkuoletus jakaumasta olisi riittävän hurja ("kenenkään mielestä käsimylly ei ole vaivalloinen"), mutta tällöin jouduttaisiin tekemään kyllä aika kohtuuttomia alkuoletuksia.
Eli joillakin päättelyjärjestelmillä ja alkuoletuksilla voidaan ainakin teoriassa tehdä päättelyä, jossa yhdestä havainnosta päätellään jotain yleispätevää - tietyllä epävarmuudella. Sitten on tietysti kysymys, että mitkä päättelyjärjestelmät ja alkuoletukset ovat "oikein". Pelkkä logiikka ja tyhjät alkuoletukset eivät mahdollista mitään havaintoihin perustuvaa päättelyä eri paikkojen tai ajanhetkien välillä. Minun tähänastiset kokemukseni eivät siis kerro mitään tulevasta tai muiden ihmisten kokemuksista - tällöin esimerkiksi nettifoorumeilla olisi aika turha keskustella, koska siitä mistä ei voi puhua jne. Muun muassa edellä mainituilla tavoilla voidaan omista kokemuksista päätellä jotain, jonka voidaan uskoa todennäköisesti koskevan myös muita. Jos minun pitäisi siis valita vallitseva järjestelmä, niin valitsisin sellaisen järjestelmän, joka mahdollistaa ihmisten välisen kanssakäynnin ja muut arkiset asiat. En siis haluaisi, että esimerkiksi kaikkia nettifoorumien viestejä tulkittaisiin ilman alkuoletuksia ja loogisina rakenteina...
Tilastollisen päättelyn järjestelmät kontrolloivat johtopäätösten voimakkuutta ja todennäköisyyttä kiinnittämällä huomiota eri asioihin ja tekemällä sen formaalisti. Nettikeskustelija harvemmin perustaa viestejään formalismien varaan, vaikka toki sellaistakin saattaa tapahtua. Mutta formaalitkin päättelyjärjestelmät voivat antaa jotain hyödyllisiä pointteja.
Esimerkiksi empiirisessä frekventistisessä tapauksessa kiinnitetään huomioita havaintojen määrään. Itselläni on n=2: omistin alunperin sellaisen koristemyllyn, joka oli vähän työläs veivata. Muistaakseni asiasta varoittelin silloinkin foorumilla, tosin epävarmuussanojen siivittämänä. Sitten hankin Hario Mini Slimin, joka ei parantanut asiaa mielestäni paljon ollenkaan. Tämän jälkeen olen vähentänyt epävarmuussanojen määrää. Toki kahden myllyn kokemuksella ei voida vielä henkseleitä paukutella. Varsinkin aloittelijoita neuvoessa aika usein tulee nojattua vähäisiin kokemuksiin varsinaisesta asiasta: harva on kokeillut montaa aloittelijan tietyntyyppistä välinettä, vaan useimmiten nollaa tai yhtä. Tämä saattaa aina joskus unohtua.
Toiseksi voisi nostaa alkuoletuksen siitä, että mitä muut ihmiset tai tässä tapauksessa aloittelijat asioista ajattelevat. Harva väittää pystyvänsä kertomaan, mikä on yleinen käsitys asiasta X, mutta kuitenkin vähän epähuomioissa monella voi olla vahva käsitys siitä, että missä suhteessa oma käsitys asiasta X on yleiseen käsitykseen. Eli esimerkiksi harva osaa sanoa, että millaiset ajotaidot koko populaatiolla on, mutta silti samaan aikaan ajattelee, että itse on keskimääräistä parempi kuljettaja (eli vertaa populaatioon, jota ei kuvittelekaan tuntevansa). Minun oletukseni "jos en minäkään jaksa, niin miten jaksaa aloittelija, joka ei ole sisäistänyt myllyn veivaamisen tärkeyttä", menee vähän tähän kategoriaan. Puolustukseksi pitää sanoa, että oletukseen kuitenkin sisältyi vähän jotain perusteluakin.