Major Components Analysis Software

Forfatter: Lewis Jackson
Opprettelsesdato: 14 Kan 2021
Oppdater Dato: 1 Juni 2024
Anonim
Top 10 Data Analysis Tools | Top Data Analytics tools | Data Analytics | Simplilearn
Video: Top 10 Data Analysis Tools | Top Data Analytics tools | Data Analytics | Simplilearn

Innhold

Analysen av hovedkomponentene reduserer et sett med variabler korrelert med et mindre sett av ukorrelerte variabler, forenkling av et komplekst datasett for senere analyse. Denne komplekse statistiske prosedyren kan utføres av mange programmer for dataanalyse, eller tilleggsprogrammer som utvider evnen til det samme, og legger til nye funksjoner.


Regnearkprogrammer som Excel kan utføre større komponentanalyse ved hjelp av en utvidelse (Bilde av Flickr.com, takket være Casey Serin)

Forenkle et datasett

Analysen av hovedkomponentene er en teknikk for leting og reduksjon av data. En analytiker kan bruke teknikken til å trekke ut relevant informasjon fra et stort og forvirrende sett med data. Teknikken brukes ofte når antall observerte variabler er svært store og korrelasjonene mellom dem gjør at dataene er vanskelige å analysere direkte. For eksempel kan korrelasjonen mellom variablene i noen tilfeller skape et falskt inntrykk av data redundans, gjøre teknisk analyse vanskelig eller kompromittere evalueringen av dataene. Analysen av hovedkomponentene forenkler variablene som uttrykker dem som en funksjon av et mindre antall elementer, hovedkomponentene, som representerer flertallet av variasjonene i målingene av dataene.


Bruk i programmet

Kompleksiteten ved å analysere hovedkomponentene krever bruk av et bestemt program. Det finnes et bredt utvalg av statistiske programmer, og de fleste av dem er i stand til å utføre denne teknikken. De mest populære programmene er SAS, Stata og SPSS. Universiteter, forskningsinstitusjoner, konsulentorganisasjoner og andre forskere bruker disse spesifikke programmene. Alle tre kan utføre større komponentanalyse av et datasett innført i et regneark, der radene representerer de enkelte observasjonene og kolonnene representerer de separate variablene.

karakter

De fleste hovedkomponentanalyseprogrammer, inkludert SAS, Stata og SPSS, vil presentere resultatene i form av tabeller som inneholder egenverdiene, eller variansforklaringene forklart. Mange programmer gir også den visuelle visningen av resultater i form av en scree plot.

betraktninger

Hovedkomponentanalyse er ofte forvekslet med faktorialanalyse, en annen metode for datareduksjon som forklarer korrelerte observasjoner når det gjelder underliggende faktorer. De to er egentlig separate prosedyrer, selv om stor komponentanalyse er et trinn med faktoranalyse. Imidlertid kombinerer mange pakker de to prosedyrene.


Et annet viktig hensyn er at spesialiserte programmer som SAS, SPSS og Stata er dyre. Derfor kan disse programmene ikke være nyttige for folk som ikke planlegger å gjennomføre statistiske analyser ofte.

Excel

Personer som trenger å utføre noen statistisk analyse, men foretrekker å ikke kjøpe et spesialisert program, kan spørre om vanlige regnearkprogrammer, for eksempel Excel, kan utføre en stor komponentanalyse. Svaret er ja og nei. Selv om Excel har noen dataanalyseværktøy som kan være tilgjengelige fra installasjonen av en statistisk analysepakke, er programmet ikke ment å være et statistisk analyseprogram. Hovedkomponentanalyse og faktoranalyse er ikke blant dataanalyseverktøyets funksjoner.

Forebygging / løsning

Det er et program som brukere kan laste ned og installere for å forbedre funksjonene i Excel som et dataanalyseværktøy. Addinsoft, et programvarefirma som spesialiserer seg på analyseprogrammer, har opprettet XLSTAT. Dette programmet lar Excel utføre større komponentanalyse og andre statistiske prosedyrer. Den har også brukervennlige prosedyrer, slik at brukeren kan velge dataene for analyse ved å klikke og dra en celle gjennom de nødvendige feltene. Brukere kan kjøpe og laste ned XLSTAT fra Addinsoft nettsiden. Det er også en gratis versjon som brukere kan prøve før de bestemmer seg for å kjøpe den.