|
Analys
- Hur får man UT information i sina data?
Inom traditionell univariat statistik är intresset inriktad på att uppskatta bruset i data och i mindre
grad att förklara systematiska skillnader och likheter i variabler och objekt:
Då ett fåtal variabler studeras räcker traditionell statistik för att uppskatta spridningsmått kring ett medelvärde. När fler variabler studeras samtidigt blir det lite knepigare - en univariat lösning förutsätter mer eller mindre
oberoende av varandra och additiva. Ett vanligt dilemma är hur resultaten ska tolkas och hur de ska vägas mot varandra, dvs praktisk relevans kontra statistisk signifikans .
Vanligt är att illustrera resultaten i diverse stapel-, 2D/3D, tårt-, eller radardiagram. Det går realtivt lätt om antalet variabler är få, men när vi
överskrider mer än 3 till 5 dimensioner har vi svårare att ta oss till budskapet. När mängden data blir övermäktig hänfaller vi gärna åt generaliseringar och beaktar endast kritiska variabler som är
kända sedan tidigare.
Inom multivariat dataanalys finns det andra metoder att separera systematiska trender, signaler, från brus i data med många variabler:
Med olika matematiska projektionsmetoder kan vi översätta, projicera, en flerdimensionell rymd med hundratals variabler, i en datatabell, till några få informationsbärande variabler. Den stora fördelen med tekniken är att den systematiska informationen extraheras ut först och det som blir kvar är icke modellbart brus.
|
|
|
|
|