Tilastollinen merkitys: määritelmä, käsite, merkitsevyys, regressioyhtälöt ja hypoteesien testaus

Sisällysluettelo:

Tilastollinen merkitys: määritelmä, käsite, merkitsevyys, regressioyhtälöt ja hypoteesien testaus
Tilastollinen merkitys: määritelmä, käsite, merkitsevyys, regressioyhtälöt ja hypoteesien testaus

Video: Tilastollinen merkitys: määritelmä, käsite, merkitsevyys, regressioyhtälöt ja hypoteesien testaus

Video: Tilastollinen merkitys: määritelmä, käsite, merkitsevyys, regressioyhtälöt ja hypoteesien testaus
Video: World's Largest FREE WILL Debate w/ Top Physicists & Philosophers 2024, Saattaa
Anonim

Tilastot ovat pitkään olleet olennainen osa elämää. Ihmiset kohtaavat sen kaikkialla. Tilastojen perusteella tehdään johtopäätöksiä siitä, missä ja mitkä sairaudet ovat yleisiä, mikä on kysytympää tietyllä alueella tai tietyllä väestösegmentillä. Jopa hallituksen ehdokkaiden poliittisten ohjelmien rakentaminen perustuu tilastotietoihin. Niitä käyttävät myös vähittäiskauppaketjut tavaroita ostaessaan, ja valmistajat ohjaavat näitä tietoja ehdotuksissaan.

Tilastot ovat tärkeässä roolissa yhteiskunnan elämässä ja vaikuttavat jokaiseen sen yksittäiseen jäseneen, pienissäkin asioissa. Jos esimerkiksi tilastojen mukaan useimmat ihmiset suosivat tummia värejä vaatteissa tietyllä kaupungissa tai alueella, niin kirkkaan keltaisen kukkakuvioisen sadetakin löytäminen paikallisista myyntipisteistä on erittäin vaikeaa. Mutta mitkä määrätonko näillä tiedoilla yhteenlaskettu vaikutus? Esimerkiksi mikä on "tilastollisesti merkittävä"? Mitä tällä määritelmällä tarkalleen ottaen tarkoitetaan?

Mikä tämä on?

Tilastot tieteenä koostuu erilaisten suureiden ja käsitteiden yhdistelmästä. Yksi niistä on "tilastollisen merkityksen" käsite. Tämä on muuttujien arvon nimi, jossa muiden indikaattoreiden esiintymisen todennäköisyys on mitätön.

Tilastollisten indikaattoreiden laskenta
Tilastollisten indikaattoreiden laskenta

Esimerkiksi yhdeksän kymmenestä ihmisestä laittaa kumikengät jalkaansa aamulla sieneskävelyllä syysmetsässä sateisen yön jälkeen. Todennäköisyys, että jossain vaiheessa 8 heistä laittoi kankaalle mokasiineja, on mitätön. Näin ollen tässä nimenomaisessa esimerkissä numero 9 on niin kutsuttu "tilastollinen merkitsevyys".

Jos siis kehitämme annettua käytännön esimerkkiä edelleen, kenkäliikkeet ostavat kumisaappaat kesäkauden loppuun mennessä enemmän kuin muina vuodenaikoina. Näin ollen tilastoarvon suuruus vaikuttaa normaaliin elämään.

Tietenkin monimutkaisissa laskelmissa, esimerkiksi virusten leviämisen ennustamisessa, otetaan huomioon suuri määrä muuttujia. Mutta tilastotietojen merkittävän indikaattorin määrittämisen ydin on samanlainen riippumatta laskelmien monimutkaisuudesta ja muuttuvien arvojen määrästä.

Miten se lasketaan?

Käytetään laskettaessa yhtälön "tilastollisen merkityksen" indikaattorin arvoa. Eli voidaan väittää, että tässä tapauksessa kaiken päättää matematiikka. Yksinkertaisin laskentavaihtoehto on matemaattisten operaatioiden ketju, jossa ovat mukana seuraavat parametrit:

  • kahden tyyppisiä tuloksia, jotka on saatu tutkimuksista tai objektiivisten tietojen, kuten ostojen määrän, tutkimuksesta, merkitty a:lla ja b:llä;
  • otoskoon ilmaisin molemmille ryhmille – n;
  • yhdistetyn otososuuden arvo - p;
  • vakiovirhe - SE.

Seuraava vaihe on määrittää testin kokonaispistemäärä - t, sen arvoa verrataan numeroon 1,96. 1,96 on keskiarvo, joka ilmaisee vaihteluvälin 95 % Studentin t-jakaumafunktion mukaan.

Kaava yksinkertaiseen laskemiseen
Kaava yksinkertaiseen laskemiseen

Usein herää kysymys, mikä ero on n:n ja p:n arvojen välillä. Tämä vivahde on helppo selventää esimerkillä. Oletetaan, että lasketaan miesten ja naisten uskollisuuden tilastollinen merkitys mille tahansa tuotteelle tai brändille.

Tässä tapauksessa kirjaimia seuraa seuraava:

  • n - vastaajien määrä;
  • p - tuotteeseen tyytyväisten määrä.

Haastateltujen naisten määräksi tässä tapauksessa merkitään n1. Näin ollen miehet - n2. Samalla arvolla on symbolin numerot "1" ja "2".

Kokeen tuloksen vertaamisesta Studentin laskentataulukoiden keskiarvoon tulee niin sanottu "tilastollinen merkitsevyys".

Mitä tarkistuksella tarkoitetaan?

Kaikkien matemaattisten laskelmien tulokset voidaan aina tarkistaa, tämä opetetaan lapsille alakoulussa. On loogista olettaaettä koska tilastot määritetään laskentaketjun avulla, ne tarkistetaan.

Tilastollisen merkitsevyyden testaus ei kuitenkaan ole vain matematiikkaa. Tilastot käsittelevät suurta määrää muuttujia ja erilaisia todennäköisyyksiä, jotka eivät läheskään aina ole laskettavissa. Eli jos palataan artikkelin alussa olevaan kumikenkien esimerkkiin, niin looginen tilastotietojen rakentaminen, johon kauppojen tavaroiden ostajat luottavat, voi häiriintyä syksylle epätyypillisen kuivan ja kuuman sään takia.. Ilmiön seurauksena kumisaappaiden ostajien määrä vähenee ja myymälät kärsivät tappioita. Matemaattinen kaava ei tietenkään pysty ennakoimaan sääpoikkeavuutta. Tätä hetkeä kutsutaan "virheeksi".

Työkaluja tilastotietojen visualisointiin
Työkaluja tilastotietojen visualisointiin

Se on vain tällaisten virheiden todennäköisyys ja ottaa huomioon lasketun merkitsevyyden tason tarkistuksen. Se ottaa huomioon sekä lasketut indikaattorit että hyväksytyt merkittävyystasot sekä suuret, joita kutsutaan perinteisesti hypoteesiksi.

Mikä on merkitystaso?

"Tason" käsite sisältyy tilastollisen merkitsevyyden pääkriteereihin. Sitä käytetään soveltavassa ja käytännön tilastoissa. Tämä on eräänlainen arvo, joka ottaa huomioon mahdollisten poikkeamien tai virheiden todennäköisyyden.

Taso perustuu valmiiden näytteiden erojen tunnistamiseen, sen avulla voit määrittää niiden merkityksen tai päinvastoin satunnaisuuden. Tällä käsitteellä ei ole vain digitaalisia merkityksiä, vaan myös niiden omituisia tulkintoja. He selittävätkuinka sinun on ymmärrettävä arvo, ja itse taso määritetään vertaamalla tulosta keskimääräiseen indeksiin, tämä paljastaa erojen luotettavuuden.

Keskustelua tilastoista
Keskustelua tilastoista

Voimme siis kuvitella tason käsitteen yksinkertaisesti - se on indikaattori hyväksyttävästä, todennäköisestä virheestä tai virheestä saaduista tilastotiedoista tehdyissä johtopäätöksissä.

Mitä merkitystasoja käytetään?

Virheen todennäköisyyskertoimien tilastollinen merkitsevyys käytännössä perustuu kolmeen perustasoon.

Ensimmäinen taso on kynnys, jolla arvo on 5 %. Eli virheen todennäköisyys ei ylitä 5 %:n merkitsevyystasoa. Tämä tarkoittaa, että luottamus tilastollisen tutkimusaineiston perusteella tehtyjen johtopäätösten moitteettomuuteen ja erehtymättömyyteen on 95%.

Toinen taso on 1 %:n kynnys. Näin ollen tämä luku tarkoittaa, että tilastolaskelmissa saatuja tietoja voidaan ohjata 99 %:n varmuudella.

Kolmas taso - 0,1 %. Tällä arvolla virheen todennäköisyys on yhtä suuri kuin prosenttiosuus, eli virheet käytännössä eliminoituvat.

Mikä on hypoteesi tilastoissa?

Virheet käsitteenä on jaettu kahteen alueeseen, jotka koskevat nollahypoteesin hyväksymistä tai hylkäämistä. Hypoteesi on käsite, jonka taakse määritelmän mukaan piilotetaan joukko tutkimustuloksia, muuta dataa tai lausuntoa. Eli kuvaus jonkin tilastollisen laskentatoimen aiheeseen liittyvästä todennäköisyysjakaumasta.

regression tilastollinen merkitsevyys
regression tilastollinen merkitsevyys

Yksinkertaisissa laskelmissa on kaksi hypoteesia - nolla ja vaihtoehto. Niiden välinen ero on siinä, että nollahypoteesi perustuu ajatukseen, että tilastollisen merkitsevyyden määrittämiseen osallistuvien näytteiden välillä ei ole perustavanlaatuisia eroja ja vaihtoehtoinen on täysin sen vastainen. Toisin sanoen vaihtoehtoinen hypoteesi perustuu siihen, että näissä näytteissä on merkittävä ero.

Mitä ovat virheet?

Virheet tilastojen käsitteenä ovat suorassa suhteessa tämän tai toisen hypoteesin hyväksymiseen todeksi. Ne voidaan jakaa kahteen suuntaan tai tyyppiin:

  • ensimmäinen tyyppi johtuu nollahypoteesin hyväksymisestä, joka osoittautui vääräksi;
  • sekunti - aiheutuu vaihtoehdon seuraamisesta.
Tilastokaavioiden katselu
Tilastokaavioiden katselu

Ensimmäistä virhetyyppiä kutsutaan vääräksi positiiviseksi ja se on melko yleinen kaikilla tilastojen käyttöalueilla. Vastaavasti toisen tyypin virhettä kutsutaan vääräksi negatiiviseksi.

Miksi tarvitsemme regressiota tilastoissa?

Regression tilastollinen merkitys on, että sen avulla voidaan selvittää, kuinka paljon tietojen perusteella laskettu eri riippuvuuksien malli vastaa todellisuutta; voit tunnistaa tekijöiden riittävyyden tai puutteen kirjanpitoon ja johtopäätöksiin.

Regressioarvo määritetään vertaamalla tuloksia Fisher-taulukoissa lueteltuihin tietoihin. Tai käyttämällä varianssianalyysiä. Regressioindikaattorit ovat tärkeitä, kunmonimutkaisia tilastollisia tutkimuksia ja laskelmia, jotka sisältävät suuren määrän muuttujia, satunnaisia tietoja ja todennäköisiä muutoksia.

Suositeltava: