Grunnleggende begreper brukt i hypotesetesting. Nullhypotesekonsept

På ulike stadier av statistisk forskning og modellering blir det nødvendig å formulere og eksperimentelt verifisere visse antakelser (hypoteser) angående arten og størrelsen på ukjente parametere for den analyserte generelle befolkningen (sett). For eksempel gjør forskeren en antagelse: «Utvalget er trukket fra en normalpopulasjon» eller «det generelle gjennomsnittet av den analyserte populasjonen er lik fem». Slike antakelser kalles statistiske hypoteser.

Sammenligning av den oppgitte hypotesen angående den generelle populasjonen med tilgjengelige utvalgsdata, ledsaget av kvantifisering graden av pålitelighet av den oppnådde konklusjonen, utføres ved å bruke et eller annet statistisk kriterium og kalles testing av statistiske hypoteser .

Den foreslåtte hypotesen kalles null (grunnleggende) . Det refereres ofte til H 0.

I forhold til den uttrykte (hoved)hypotesen kan man alltid formulere alternativ (konkurrerende) som motsier det. En alternativ (konkurrerende) hypotese er vanligvis betegnet H 1.

Hensikten med statistisk hypotesetesting er å ta stilling til gyldigheten av hovedhypotesen basert på utvalgsdata H 0.

Hvis den fremsatte hypotesen reduseres til påstanden om at verdien av en eller annen ukjent parameter for den generelle befolkningen er nøyaktig lik gitt verdi, så kalles denne hypotesen enkel, for eksempel: "gjennomsnittlig totalinntekt per innbygger for befolkningen i Russland er 650 rubler per måned"; "arbeidsledigheten (andelen av arbeidsledige i den økonomisk aktive befolkningen) i Russland er 9%". I andre tilfeller kalles hypotesen vanskelig.

Som en nullhypotese H 0 det er vanlig å sette frem en enkel hypotese, fordi det er vanligvis mer praktisk å kontrollere en strengere påstand.

Hypoteser om formen til fordelingsloven til den undersøkte tilfeldige variabelen;

Hypoteser om de numeriske verdiene til parametrene til den studerte generelle befolkningen;

Hypoteser om homogeniteten til to eller flere prøver eller noen kjennetegn ved de analyserte populasjonene;

Hypoteser om den generelle formen til modellen som beskriver den statistiske sammenhengen mellom trekk mv.

Siden testing av statistiske hypoteser er utført på grunnlag av utvalgsdata, d.v.s. et begrenset sett med observasjoner, beslutninger angående nullhypotesen H 0 er sannsynlige. Med andre ord, en slik avgjørelse er uunngåelig ledsaget av noen, men kanskje svært liten, sannsynlighet for en feilaktig konklusjon i begge retninger.



Så i en liten brøkdel av tilfellene α nullhypotesen H 0 kan bli avvist, mens det i realiteten er rettferdig i befolkningen generelt. En slik feil kalles skriv inn én feil . Og sannsynligheten kalles Signifikansnivå og utpeke α .

Omvendt, i en liten brøkdel av tilfellene β nullhypotesen H 0 er akseptert, mens det faktisk i den generelle befolkningen er feil, og den alternative hypotesen er sann H 1. En slik feil kalles type II feil . Sannsynligheten for en feil av den andre typen angis vanligvis β . Sannsynlighet 1-β kalt kraften til kriteriet .

Med en fast utvalgsstørrelse kan du etter eget skjønn velge sannsynlighetsverdien for kun én av feilene α eller β . En økning i sannsynligheten for en av dem fører til en reduksjon i den andre. Det er vanlig å sette sannsynligheten for en feil av den første typen α - Signifikansnivå. Som regel brukes noen standard signifikansnivåverdier. α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Da, åpenbart, fra to kriterier preget av samme sannsynlighet α avvise en sann hypotese H 0, bør man akseptere den som er ledsaget av en mindre feil av den andre typen β , dvs. mer makt. Reduserer sannsynligheten for begge feilene α og β kan oppnås ved å øke prøvestørrelsen.

Riktig avgjørelse angående nullhypotesen H 0 kan også være av to typer:

Nullhypotesen vil bli akseptert. H 0, mens faktisk nullhypotesen er sann i befolkningen generelt H 0; sannsynligheten for en slik avgjørelse 1 - a;

Nullhypotesen H 0 vil bli avvist til fordel for et alternativ H 1, mens faktisk i den generelle befolkningen nullhypotesen H 0 avvist til fordel for alternativ H 1; sannsynligheten for en slik avgjørelse 1 - β - potens av kriteriet.

Resultatene av nullhypotesebeslutningen kan illustreres ved hjelp av tabell 8.1.

Tabell 8.1

Statistiske hypoteser testes vha statistisk kriterium(la oss kalle det generisk Til), som er en funksjon av observasjonsresultatene.

Et statistisk kriterium er en regel (formel) der graden av avvik mellom resultatene av en prøveobservasjon og den oppgitte hypotesen H 0 bestemmes.

Et statistisk kriterium, som enhver funksjon av observasjonsresultatene, er en tilfeldig variabel og, forutsatt at nullhypotesen er gyldig H 0 er underlagt en eller annen godt studert (og tabulert) teoretisk distribusjonslov med distribusjonstetthet f(k).

Valg av kriterium for testing av statistiske hypoteser kan gjennomføres ut fra ulike prinsipper. Oftest brukt til dette sannsynlighetsforholdsprinsippet, som lar deg bygge det kraftigste kriteriet blant alle mulige kriterier. Dens essens er redusert til valget av et slikt kriterium Til med kjent tetthetsfunksjon f(k) underlagt gyldigheten av hypotesen H 0 , slik at på et gitt nivå av signifikans α man kunne finne det kritiske punktet K kr.fordeling f(k), som vil dele verdiområdet til kriteriet i to deler: området med akseptable verdier, der resultatene av prøveobservasjonen ser mest plausible ut, og den kritiske regionen, der resultatene av prøveobservasjonen ser mindre ut. plausibel med hensyn til nullhypotesen H 0.

Hvis et slikt kriterium Til er valgt, og tettheten av dens distribusjon er kjent, reduseres oppgaven med å teste den statistiske hypotesen til å sikre at, ved et gitt signifikansnivå, α beregne den observerte verdien av kriteriet fra prøvedataene Til obl. og avgjøre om det er mer eller mindre plausibelt med hensyn til nullhypotesen H 0.

Testing av hver type statistiske hypoteser utføres ved å bruke det aktuelle kriteriet, som er det kraftigste i hvert enkelt tilfelle. For eksempel kan testing av hypotesen om formen til distribusjonsloven for en tilfeldig variabel utføres ved å bruke Pearsons godhet-of-fit-test χ 2; verifisering av hypotesen om likheten mellom de ukjente verdiene av variansene til to generelle populasjoner - ved å bruke kriteriet F- Fisher; en rekke hypoteser om ukjente verdier av parametrene til de generelle populasjonene testes ved å bruke kriteriet Z- normalfordelt tilfeldig variabel og kriterium T- Student osv.

Verdien av kriteriet, beregnet etter spesielle regler basert på prøvedata, kalles den observerte verdien av kriteriet (Til obl.).

Kriterieverdier som deler settet med kriterieverdier med toleranseområde(mest plausibelt med hensyn til nullhypotesen H 0) og kritisk region(verdiområde mindre plausibelt i forhold til distribusjonstabeller for en tilfeldig variabel Til valgt som et kriterium kalles kritiske punkter (K ​​kr.).

Området med akseptable verdier (området for aksept av nullhypotesen H 0) Til H 0 blir ikke avvist.

Kritisk område kall settet med verdier for kriteriet Til , hvorunder nullhypotesen H 0 avvek til fordel for en rival H 1 .

Skille ensidig(høyre eller venstre hånd) og bilaterale kritiske regioner.

Hvis den konkurrerende hypotesen er høyrehendt, f.eks. H 1: a > a 0, så er den kritiske regionen høyresidig(Figur 1). Under den høyrehendte konkurrerende hypotesen, det kritiske punktet (For å cr. høyresidig) tar positive verdier.

Hvis den konkurrerende hypotesen er venstrehendt, for eksempel, H 1: a< а 0 , så er den kritiske regionen venstresidig(Figur 2). Under den venstresidige konkurrerende hypotesen tar det kritiske punktet negative verdier (For å cr. venstresidig).

Hvis den konkurrerende hypotesen er tosidig, for eksempel, H 1: a¹ en 0, så er den kritiske regionen bilateralt(Figur 3). Med en tosidig konkurrerende hypotese defineres to kritiske punkter (K kr. venstresidig og Til cr. høyre hånd).


Tillatt område Kritisk

verdiområdet

På grunnlag av dataene som er samlet inn i statistiske studier, etter behandlingen, trekkes konklusjoner om de studerte fenomenene. Disse konklusjonene er gjort ved å sette frem og teste statistiske hypoteser.

Statistisk hypotese ethvert utsagn om formen eller egenskapene til fordelingen av tilfeldige variabler observert i eksperimentet kalles. Statistiske hypoteser testes med statistiske metoder.

Hypotesen som skal testes kalles hoved (null) og betegnet H 0 . I tillegg til null er det også alternativ (konkurrerende) hypotese H 1, negerer det viktigste . Som et resultat av testen vil altså én og kun én av hypotesene bli akseptert , og den andre vil bli avvist.

Feiltyper. Den fremsatte hypotesen testes på grunnlag av en studie av et utvalg hentet fra befolkningen generelt. På grunn av utvalgets tilfeldighet trekker ikke testen alltid den riktige konklusjonen. I dette tilfellet kan følgende situasjoner oppstå:
1. Hovedhypotesen er sann og den er akseptert.
2. Hovedhypotesen er sann, men den forkastes.
3. Hovedhypotesen er ikke sann og den forkastes.
4. Hovedhypotesen er ikke sann, men den er akseptert.
I tilfelle 2 snakker man om feil av den første typen, i sistnevnte tilfelle er det det feil av den andre typen.
For noen prøver blir derfor riktig avgjørelse tatt, og for andre feil. Beslutningen tas i henhold til verdien av en eller annen prøvetakingsfunksjon, kalt statistisk karakteristikk, statistisk kriterium eller rett og slett statistikk. Settet med verdier til denne statistikken kan deles inn i to ikke-overlappende delsett:

  • H 0 er akseptert (ikke avvist), kalt hypoteseakseptområde (tillatt område);
  • delsett av statistiske verdier som hypotesen for H 0 forkastes (forkastes) og hypotesen aksepteres H 1 kalles kritisk område.

Konklusjoner:

  1. kriterium kalt tilfeldig verdi K , som lar deg akseptere eller forkaste nullhypotesen H0 .
  2. Ved testing av hypoteser kan det gjøres feil av 2 slag.
    Type I feil er å forkaste hypotesen H 0 hvis det er sant ("hopp over mål"). Sannsynligheten for å gjøre en type I feil er betegnet med α og kalles Signifikansnivå. Oftest antas det i praksis at α = 0,05 eller α = 0,01.
    Type II feil er at hypotesen H0 aksepteres hvis den er falsk ("falsk positiv"). Sannsynligheten for denne typen feil er angitt med β.

Hypoteseklassifisering

Hovedhypotese H 0 om verdien av den ukjente parameteren q i distribusjonen ser vanligvis slik ut:
H 0: q \u003d q 0.
Konkurrerende hypotese H 1 kan se slik ut:
H 1: q < q 0 , H 1:q> q 0 eller H 1: qq 0 .
Følgelig viser det seg venstre side, høyre side eller bilateralt kritiske områder. Grensepunkter for kritiske regioner ( kritiske punkter) bestemmes fra fordelingstabellene for den relevante statistikken.

Når man tester en hypotese, er det rimelig å redusere sannsynligheten for å ta feil beslutninger. Tillatt type I feilsannsynlighet vanligvis betegnet en og ringte Signifikansnivå. Verdien er vanligvis liten ( 0,1, 0,05, 0,01, 0,001 ...). Men en reduksjon i sannsynligheten for en type 1 feil fører til en økning i sannsynligheten for en type 2 feil ( b), dvs. ønsket om å akseptere bare sanne hypoteser fører til en økning i antall forkastede korrekte hypoteser. Derfor bestemmes valget av betydningsnivå av betydningen av problemet som stilles og alvorlighetsgraden av konsekvensene av en feil beslutning.
Testing av en statistisk hypotese består av følgende trinn:
1) definisjon av hypoteser H 0 og H 1 ;
2) valg av statistikk og tildeling av signifikansnivå;
3) definisjon av kritiske punkter K kr og kritisk område;
4) beregning av verdien av statistikk fra utvalget K eks;
5) sammenligning av statistikkverdien med den kritiske regionen ( K kr og K eks);
6) beslutningstaking: hvis verdien av statistikken ikke er inkludert i den kritiske regionen, aksepteres hypotesen H 0 og forkast hypotesen H 1, og hvis den går inn i det kritiske området, forkastes hypotesen H 0 og hypotesen er akseptert H en . Samtidig bør resultatene av testing av den statistiske hypotesen tolkes som følger: hvis hypotesen er akseptert H 1 , så kan vi anse det som bevist, og hvis vi aksepterer hypotesen H 0 , da ble det erkjent at det ikke motsier resultatene av observasjoner.Men denne egenskapen, sammen med H 0 kan ha andre hypoteser.

Hypotesetestklassifisering

La oss videre vurdere flere forskjellige statistiske hypoteser og mekanismer for å teste dem.
JEG) Hypotese om det generelle gjennomsnittet av normalfordelingen med ukjent varians. Vi antar at den generelle befolkningen har en normalfordeling, dens gjennomsnitt og varians er ukjent, men det er grunn til å tro at det generelle gjennomsnittet er lik a. Ved et signifikansnivå på α er det nødvendig å teste hypotesen H 0: x=a. Som et alternativ kan en av de tre hypotesene som er diskutert ovenfor brukes. I dette tilfellet er statistikken en tilfeldig variabel , som har en Students fordeling med n– 1 frihetsgrad. Den tilsvarende eksperimentelle (observerte) verdien bestemmes t eks t cr H 1: x >a finnes det ved signifikansnivået α og antall frihetsgrader n– 1. Hvis t eks < t cr H 1: x ≠a den kritiske verdien er funnet fra signifikansnivået α / 2 og samme antall frihetsgrader. Nullhypotesen aksepteres hvis | t eks | II) Hypotesen om likheten mellom to midler for vilkårlig fordelte generelle populasjoner (store uavhengige utvalg). Ved et signifikansnivå på α er det nødvendig å teste hypotesen H 0:x≠y. Hvis volumet av begge prøvene er stort, kan vi anta at prøvemidlene har en normalfordeling, og deres varians er kjent. I dette tilfellet kan en tilfeldig variabel brukes som statistikk
,
ha en normalfordeling, og M(Z) = 0, D(Z) = 1. Den tilsvarende eksperimentelle verdien bestemmes z eks. Fra tabellen til Laplace-funksjonen er den kritiske verdien funnet z cr. Under den alternative hypotesen H 1: x >y det finnes fra tilstanden F(z cr) = 0,5 – en. Hvis en z eks< z кр , da aksepteres nullhypotesen, ellers forkastes den. Under den alternative hypotesen H 1: x ≠ y den kritiske verdien er funnet fra tilstanden F(z cr) = 0,5×(1 – en). Nullhypotesen aksepteres hvis | z eks |< z кр .

III) Hypotesen om likheten mellom to gjennomsnitt av normalfordelte generelle populasjoner, hvis varians er ukjente og de samme (små uavhengige utvalg). Ved et signifikansnivå på α er det nødvendig å teste hovedhypotesen H 0: x=y. Som statistikk bruker vi en tilfeldig variabel
,
som har en studentdistribusjon med ( n x + n– 2) frihetsgrader. Den tilsvarende eksperimentelle verdien bestemmes t eks. Fra tabellen over kritiske punkter i studentens fordeling finner man den kritiske verdien t cr. Alt løses på samme måte som hypotese (I).

IV) Hypotesen om likheten mellom to varianser av normalfordelte populasjoner. I dette tilfellet på signifikansnivå en trenger å teste hypotesen H 0: D(X) = D(Y). Statistikken er en tilfeldig variabel , som har Fisher-Snedecor-fordelingen med f 1 = n b– 1 og f 2 = n m- 1 frihetsgrader (S 2 b - stor varians, volumet av prøven n b). Den tilsvarende eksperimentelle (observerte) verdien bestemmes F eks. kritisk verdi F cr under den alternative hypotesen H 1: D(X) > D(Y) er funnet fra tabellen over kritiske punkter for Fisher-Snedecor-fordelingen etter signifikansnivå en og antall frihetsgrader f 1 og f 2. Nullhypotesen aksepteres hvis F eks < F cr.

Instruksjon. For beregningen må du spesifisere dimensjonen til kildedataene.

V) Hypotesen om likheten mellom flere varianser av normalfordelte populasjoner over prøver av samme størrelse. I dette tilfellet på signifikansnivå en trenger å teste hypotesen H 0: D(X 1) = D(X 2) = …= D(Xl). Statistikken er en tilfeldig variabel , som har Cochran-fordelingen med frihetsgrader f = n– 1 og l (n- størrelsen på hver prøve, l er antall prøver). Denne hypotesen testes på samme måte som den forrige. Tabellen over kritiske punkter i Cochran-distribusjonen brukes.

vi) Hypotese om betydningen av korrelasjonen. I dette tilfellet på signifikansnivå en trenger å teste hypotesen H 0: r= 0. (Hvis korrelasjonskoeffisienten er lik null, så er de tilsvarende størrelsene ikke relatert til hverandre). I dette tilfellet er statistikken en tilfeldig variabel
,
å ha en Students distribusjon med f = n– 2 frihetsgrader. Verifikasjonen av denne hypotesen utføres på samme måte som verifiseringen av hypotesen (I).

Instruksjon. Angi mengden kildedata.

VII) Hypotese om verdien av sannsynligheten for at en hendelse skal inntreffe. Brukte nok et stort nummer av n uavhengige forsøk der arrangementet MEN skjedde m en gang. Det er grunn til å tro at sannsynligheten for at denne hendelsen inntreffer i en rettssak er lik p 0. Påkrevd på signifikansnivå en teste hypotesen om at sannsynligheten for en hendelse MEN lik den hypotetiske sannsynligheten p 0. (Fordi sannsynligheten estimeres av den relative frekvensen, kan den testede hypotesen formuleres på en annen måte: den observerte relative frekvensen og den hypotetiske sannsynligheten skiller seg betydelig eller ikke).
Antall forsøk er ganske stort, så den relative frekvensen av hendelsen MEN fordelt etter normalloven. Hvis nullhypotesen er sann, er den forventede verdien p 0, og variansen . I samsvar med dette velger vi som statistikk en tilfeldig variabel
,
som er fordelt tilnærmet etter normalloven med null matematisk forventning og enhetsvarians. Denne hypotesen testes på nøyaktig samme måte som i tilfelle (I).

Instruksjon. For beregningen må du fylle inn de første dataene.

STATISTISKE HYPOTESER

Prøvedataene innhentet i eksperimenter er alltid begrenset og er stort sett tilfeldige. Det er derfor matematisk statistikk brukes til å analysere slike data, som gjør det mulig å generalisere mønstrene som er oppnådd i utvalget og utvide dem til hele befolkningen generelt.

Dataene innhentet som et resultat av eksperimentet på ethvert utvalg tjener som grunnlag for å bedømme den generelle befolkningen. På grunn av tilfeldige sannsynlighetsårsaker vil imidlertid et estimat av parametrene til den generelle populasjonen gjort på grunnlag av eksperimentelle (prøve)data alltid være ledsaget av en feil, og derfor bør slike estimater betraktes som antagelser, og ikke som sluttuttalelser. Lignende antakelser om egenskapene og parameterne til den generelle befolkningen kalles statistiske hypoteser . Som G.V. Sukhodolsky: "En statistisk hypotese blir vanligvis forstått som en formell antakelse om at likheten (eller forskjellen) til noen parametriske eller funksjonelle egenskaper er tilfeldig eller omvendt ikke tilfeldig."

Essensen av å teste en statistisk hypotese er å fastslå om de eksperimentelle dataene og hypotesen som er fremsatt er konsistente, om det er tillatt å tilskrive avviket mellom hypotesen og resultatet Statistisk analyse eksperimentelle data på grunn av tilfeldige årsaker. En statistisk hypotese er altså en vitenskapelig hypotese som tillater statistisk testing, og matematisk statistikk er en vitenskapelig disiplin som har som oppgave å vitenskapelig underbygge testing av statistiske hypoteser.

Statistiske hypoteser er delt inn i null og alternativ, retningsbestemte og ikke-retningsbestemte.

Nullhypotesen(H0) er hypotesen om ingen forskjell. Hvis vi ønsker å bevise betydningen av forskjeller, kreves nullhypotesen tilbakevise, ellers kreves det bekrefte.

Alternativ hypotese (H 1) er en hypotese om betydningen av forskjeller. Det er dette vi ønsker å bevise, og det er derfor hun noen ganger blir kalt eksperimentell hypotese.

Det er oppgaver når vi ønsker å bevise nøyaktig ubetydelighet forskjeller, det vil si for å bekrefte nullhypotesen. For eksempel hvis vi må sørge for at ulike forsøkspersoner får oppgaver, selv om de er forskjellige, men balanserte i vanskelighetsgrad, eller at forsøks- og kontrollprøvene ikke skiller seg fra hverandre i noen vesentlige egenskaper. Men oftere enn ikke må vi fortsatt bevise betydningen av forskjellene for de er mer informative for oss i vår søken etter det nye.

Null- og alternativhypotesene kan være retningsbestemte eller ikke-retningsbestemte.

Regisserte hypoteser - hvis det antas at i en gruppe er de karakteristiske verdiene høyere, og i den andre lavere:

H 0: X 1 mindre enn X 2,

H 1: X 1 overskrider X 2.

Urettede hypoteser - hvis det antas at formene for fordeling av en egenskap i grupper er forskjellige:

H 0: X 1 ikke forskjellig fra X 2,

H 1: X 1 er annerledes X 2.

Hvis vi legger merke til at i en av gruppene, de individuelle verdiene til fagene for en hvilken som helst egenskap, for eksempel for sosial aktivitet, ovenfor og i den andre nedenfor, så for å teste betydningen av disse forskjellene, må vi formulere retningshypoteser.

Hvis vi vil bevise det i gruppen MEN under påvirkning av noen eksperimentelle påvirkninger skjedde det mer uttalte endringer enn i gruppen B, da må vi også formulere rettet hypoteser.

Hvis vi ønsker å bevise at formene for fordeling av en egenskap i grupper er forskjellige MEN og B, så formuleres urettede hypoteser.

Hypotesetesting utføres ved bruk av kriteriene for statistisk vurdering av forskjeller.

Den resulterende konklusjonen kalles en statistisk beslutning. Vi understreker at en slik løsning alltid er sannsynlig. Når du tester en hypotese, kan eksperimentelle data motsi hypotesen H 0, da forkastes denne hypotesen. Ellers, dvs. hvis de eksperimentelle dataene stemmer overens med hypotesen H 0 Hun avviker ikke. Det sies ofte i slike tilfeller at hypotesen H 0 akseptert. Dette viser at statistisk testing av hypoteser basert på eksperimentelle utvalgsdata uunngåelig er forbundet med risikoen (sannsynligheten) for å ta en falsk beslutning. I dette tilfellet er feil av to typer mulig. En type I-feil vil oppstå når det tas en beslutning om å forkaste hypotesen. H 0, selv om det i virkeligheten viser seg å være sant. En type II feil vil oppstå når beslutningen tas om ikke å forkaste hypotesen. H 0, selv om det i realiteten vil være feil. Det er klart at man også kan trekke riktige konklusjoner i to tilfeller. Tabell 7.1 oppsummerer ovenstående.

Tabell 7.1

Det er mulig at psykologen kan ta feil i sin statistiske avgjørelse; som vi ser av tabell 7.1 kan disse feilene bare være av to typer. Siden det er umulig å utelukke feil i vedtakelsen av statistiske hypoteser, er det nødvendig å minimere de mulige konsekvensene, dvs. akseptere en feil statistisk hypotese. I de fleste tilfeller er den eneste måten å minimere feil på å øke prøvestørrelsen.

STATISTISKE KRITERIER

Statistisk test er en beslutningsregel som sikrer pålitelig atferd, det vil si å akseptere en sann hypotese og avvise en falsk med høy sannsynlighet.

Statistiske kriterier indikerer også metoden for å beregne et visst tall og dette tallet selv.

Når vi sier at betydningen av forskjeller ble bestemt av kriteriet j *(kriteriet er Fisher vinkeltransformasjonen), da mener vi at vi brukte metoden j *å beregne et bestemt tall.

Ved forholdet mellom de empiriske og kritiske verdiene til kriteriet kan vi bedømme om nullhypotesen er bekreftet eller tilbakevist.

I de fleste tilfeller, for at vi skal anerkjenne forskjeller som signifikante, er det nødvendig at den empiriske verdien av kriteriet overstiger det kritiske, selv om det er kriterier (for eksempel Mann-Whitney-testen eller tegntesten) der vi må følge den motsatte regelen.

I noen tilfeller inkluderer beregningsformelen for kriteriet antall observasjoner i studieutvalget, betegnet som n. I dette tilfellet er den empiriske verdien av kriteriet samtidig en test for å teste statistiske hypoteser. Ved hjelp av en spesiell tabell bestemmer vi hvilket nivå av statistisk signifikans av forskjeller som tilsvarer en gitt empirisk verdi. Et eksempel på et slikt kriterium er kriteriet j *, beregnet på grunnlag av Fisher-vinkeltransformasjonen.

I de fleste tilfeller kan imidlertid den samme empiriske verdien av kriteriet vise seg å være signifikant eller ubetydelig avhengig av antall observasjoner i studieutvalget ( n) eller på det såkalte antall frihetsgrader, som er betegnet som v eller hvordan df.

Antall frihetsgrader v lik antall klasser variantserie minus antall forhold den ble dannet under. Disse forholdene inkluderer prøvestørrelsen ( n), gjennomsnitt og varians.

Anta at en gruppe på 50 personer ble delt inn i tre klasser i henhold til prinsippet:

Kunne arbeide på en datamaskin;

Kunne utføre visse operasjoner;

Kan ikke jobbe på en datamaskin.

Det var 20 personer i den første og andre gruppen, og 10 i den tredje.

Vi er begrenset av én betingelse - prøvestørrelsen. Derfor, selv om vi har mistet data om hvor mange som ikke vet hvordan de skal bruke en datamaskin, kan vi fastslå dette, vel vitende om at det er 20 testpersoner i første og andre klasse. Vi står ikke fritt til å bestemme antall fag i den tredje kategorien, "frihet" strekker seg bare til de to første cellene i klassifiseringen: