Innhold
Et avvik er en verdi i et datasett som er langt fra andre verdier. Avvik kan være forårsaket av eksperimentelle feil eller målefeil. I de første tilfellene kan det være ønskelig å identifisere avvikere og fjerne dem fra andre data før du utfører en statistisk analyse for å unngå å påvirke resultatene, siden de ikke trofast representerer utvalgspopulasjonen. Den enkleste måten å identifisere avvik er med kvartilmetoden.
Trinn 1
Liste dataene i stigende rekkefølge. Vurder datasettet {4, 5, 2, 3, 15, 3, 3, 5}. Bestilt, er datasetteksemplet: {2, 3, 3, 3, 4, 5, 5, 15}.
Steg 2
Finn medianen. Dette er det sentrale tallet, som deler den største halvdelen fra den mindre halvdelen. Hvis det er et jevnt antall data, bør gjennomsnittet av de to beregnes. For eksempel: i datasettet som er sitert, er midtpunktene 3 og 4, så medianen er (3 + 4) / 2 = 3,5.
Trinn 3
Finn det øvre kvartilet, Q2, datapunkt som deler gruppen mellom 75% minste og 25% største. Hvis datasettet er jevnt, gjennomsnitt to poeng rundt kvartilen. I forrige eksempel: (5 + 5) / 2 = 5.
Trinn 4
Finn den laveste kvartilen, Q1, datapunktet som skiller de minste 25% fra de største 75%. Hvis datasettet er jevnt, gjennomsnitt to poeng rundt kvartilen. I eksemplet: (3 + 3) / 2 = 3.
Trinn 5
Trekk den nedre kvartilen fra den øvre kvartilen for å oppnå interkvartilområdet, IQ. I eksemplet: Q2 - Q1 = 5 - 3 = 2.
Trinn 6
Multipliser interkvartilområdet med 1,5. Legg den øvre kvartilen til resultatet og trekk den nedre kvartilen. Ethvert datapunkt utenfor disse verdiene er et mildt avvik. For eksemplet som er gitt: 1,5 x 2 = 3. 3 - 3 = 0 og 5 +3 = 8. Enhver verdi mindre enn 0 eller større enn 8 vil derfor være et lite avvik. Dette betyr at 15 kvalifiserer som et lite avvik.
Trinn 7
Multipliser interkvartilområdet med 3. Legg til det øvre kvartilet og trekk det nedre kvartilet. Ethvert datapunkt utenfor disse verdiene er et ekstremt avvik. For eksemplet gitt, 3 x 2 = 6. 3-6 = -3 og 5 + 6 = 11. Enhver verdi mindre enn -3 eller større enn 11 er således et ekstremt avvik. Dette betyr at 15 kvalifiserer som et ekstremt avvik.