Innhold
Medianen er midtpunktet av et sett bestilt data. For eksempel har settet (2,4,7,9,10) en median på 7. De bestilte dataene aggregeres i kategorier, med den nøyaktige detalj av hvert punkt av tap av data. Derfor kan den eksakte medianen ikke være kjent fra klyngede data alene. Men hvis du vet antall data i hvert intervall, kan du fortelle hva som er "mellomstore", det vil si hva inneholder punktet som er medianen. Vi kan viderefinere medianpoengestimatet med en formel, basert på antagelsen om at midtpunktsdataene er jevnt fordelt.
retninger
Lære å beregne medianen til en datagruppe er en enkel oppgave (Hemera Technologies / AbleStock.com / Getty Images)-
Grupper verdiene i intervaller, hvis de ikke allerede er. Bestem hvilket intervall som skal inneholde midtpunktet.
For didaktiske formål, vurder datasettet (1,2,4,5,6,7,7,7,9). Medianen her er 6. Du kan gruppere settet i bredder som tilsvarer 4, for eksempel. Deres frekvensfordeling kan da være, for eksempel: 1-4: 3 5-8: 5 9-12: 1 I de ikke-grupperte dataene er medianen tydelig i kategori 5-8. Du kan til og med si det uten å se det opprinnelige datasettet.
-
Beregn forskjellen i antall datapunkter over midtlinjen og halvparten av det totale antall datapunkter.
I følge det som er nevnt, er dette lik 9/2 - 3 = 1,5. Denne beregningen anslår hvor langt fra midtområdet medianen skal finnes.
-
Del med antall poeng i midtområdet.
Fortsetter med eksemplet, 1,5 / 5 = 0,3. Dette gir et forhold på hvor langt midtområdet medianen er.
-
Multipliser verdien som er oppnådd ovenfor ved bredden av midtområdet.
Fortsetter med eksemplet, 0,3 x 4 = 1,2. Dette konverterer forholdet innenfor rekkevidden til en faktisk dataforhøyelse.
-
Legg det ovennevnte resultatet til verdien mellom mellomområdet og det nedre området.
Siden kuttet mellom gjennomsnittet og det nedre området er 4,5, får vi ligningen 4,5 + 1,2 = 5,7, som kan få resultatet avrundet til 6, det riktige svaret.
tips
- Faktisk er beregningen ovenfor den samme som i formelen "L + (n / 2 - c) / fxw", der L er tallet mellom midten og det neste nedre intervallet, n er det totale antall datapunkter, c er det totale antall punkter under midtlinjen, f er antall datapunkter i mellomområdet, og w er bredden.