Hvordan tolke en scatter plot

Forfatter: Lewis Jackson
Opprettelsesdato: 6 Kan 2021
Oppdater Dato: 21 Juni 2024
Anonim
Scatter Plot - SPSS (part 1)
Video: Scatter Plot - SPSS (part 1)

Innhold

Et spredningsdiagram er et viktig diagnostisk verktøy i en statistikerens arsenal, oppnådd ved å konstruere den to-variable grafen og formulere en funksjonell hypotese om relasjonen. Av denne grunn er de vanligvis utformet før en regresjonsanalyse utføres. Statistikeren tester deretter hypotesen ved hjelp av en regresjonsanalyse og bestemmer nøyaktig tegnet og størrelsen på forholdet. I tillegg kan en regresjonsgraf identifisere uoverensstemmende data - verdier som er unormalt fjernt fra de fleste prøvedata. Å eliminere uoverensstemmende data bidrar til å forbedre regresjonsmodellen.


retninger

Et spredningsdiagram viser korrelasjonen mellom to variabler (NA / AbleStock.com / Getty Images)
  1. Se etter et negativt forhold mellom de to variablene i spredningsdiagrammet. Hvis de lave verdiene til den første variabelen svarer til høye verdier av den andre variabelen, er det en negativ korrelasjon. I dette tilfellet vil en linje trukket gjennom dataene ha en negativ helling.

  2. Undersøk diagrammet for et positivt forhold mellom variablene. Hvis de lave verdiene til den første variabelen svarer til de lave verdiene til den andre variabelen, og de høye verdiene til den første variabelen tilsvarer tilsvarende de høye verdiene til den andre, har variablene en positiv korrelasjon. I dette tilfellet vil en linje trukket gjennom dataene ha en positiv helling.

  3. Kontroller spredningsdiagrammet for å finne ut om det ikke er noen sammenheng mellom variablene. Hvis dataene i grafen er randomisert, uten tilsynelatende forhold mellom variablene, har de ingen korrelasjon, eller en liten og statistisk ubetydelig korrelasjon. I dette tilfellet er en linje trukket gjennom data horisontal, med en skråning lik null.


  4. Lag en regresjonslinje gjennom dataene, undersøk form og vurder innholdet av forholdet mellom de to variablene. En rett linje tolkes med et lineært forhold, en kurvet form antyder et kvadratisk forhold, og en linje som starter relativt flat før stigning eller fall plutselig tolkes som en eksponentiell relasjon.

  5. Se etter uoverensstemmende data i diagrammet. Verdier som er unormalt langt borte fra datasettet. Avvik mellomviker forholdet mellom variabler. Eliminere dem, men bare hvis deres tilstedeværelse ikke påvirker analysen av forholdet mellom de to variablene.