Du er her

Psykometrisme

Publisert
2. oktober 2007

Marit Netland, denne månedens kronikkforfatter, er dr.psychol. og førsteamanuensis ved Høgskolen i Bergen. Sammen med Kjell Underlid, Ingunn Skre, Anne Skard, Peder Kjøs og Magne Raundalen er hun invitert av Tidsskriftet som fast kronikør. Neste måned: Kjell Underlid.

Mye psykologisk forskning dreier seg om hvordan mennesker påvirkes av ulike hendelser og handlinger, som ulykker, krigshendelser, mobbing og mishandling. Resultatene får betydning for hvordan psykologer møter mennesker med slike erfaringer. Men kan vi stole på denne forskningen? Langt fra alltid, tror jeg. Årsaken til min tvil er det jeg kaller psykometrisme.

Psykometrien fortjener bedre enn å bli trodd på. Den fortjener å bli tatt på alvor!

Med psykometrisme mener jeg en tendens blant forskere til å la psykometrisk teori styre forsøk på å tallfeste ikke-psykologiske fenomener. En del forskere synes å følge retningslinjer eller «oppskrifter» fra psykometrien nærmest av gammel vane, selv når annen «metri» hadde passet bedre. Her er en slik oppskrift, kort oppsummert og forenklet:

1. Finn fram til et stort utvalg av testledd eller spørsmål som du av faglige grunner mener dreier seg om fenomenet du ønsker å måle.
2. Lag et måleinstrument der alle disse leddene inngår, og prøv ut hvordan dette fungerer på et utvalg mennesker.
3. Studer korrelasjonene mellom testleddene.
4. Utelat ledd som er negativt eller lavt korrelert med resten av leddene.
5. Inkluder bare de resterende leddene i den endelige versjonen av måleinstrumentet.

Bak oppskriften ligger en idé om at man ikke kan måle for eksempel depresjon direkte. De psykiske plagene som utgjør testledd i en depresjonstest, som «søvnløshet» og «selvmordsønsker», blir betraktet som indikasjoner på den latente variabelen depresjon. Det forventes at disse testleddene korrelerer med hverandre dersom de har samme utspring, altså dersom de er symptomer på den underliggende depresjonen. Derfor må man ekskludere testledd som ikke korrelerer med resten.

Oppskriften kan være nyttig, til sitt bruk. Problemet er at noen forskere synes å tro at oppskriften gir veien til sannheten, ikke bare når studieobjektet er et psykologisk fenomen, men også når man skal tallfeste ytre, observerbare fenomener. Eksponering for politisk vold er et slikt ytre, observerbart fenomen. Det er nyttig med et godt mål på eksponering for politisk vold dersom man skal studere mennesker fra krigsområder. Et slikt mål gjør det mulig å skille mellom dem som har vært utsatt for mange og få krigshendelser. Da kan man undersøke sammenhengen mellom voldseksponering og psykiske problemer. Når man skal konstruere et voldsspørreskjema, må man lage spørsmål om alle politisk voldelige hendelser som menneskene man skal studere, kan ha vært utsatt for, og så prøve disse ut på et utvalg mennesker. Vi er nå på punkt 1 og 2 i oppskriften over.

Hva med oppskriftens 3. til 5. punkt? Kan det være nyttig for forskeren å vite om det å ha blitt torturert korrelerer med det å ha blitt fengslet, sett sin mor bli drept eller opplevd hjemmet bli bombet i stykker? Ja, dersom forskeren ønsker å gruppere mennesker – i en bestemt voldelig setting – i kategorier etter hvilke typer vold de har vært utsatt for. Nei, dersom forskeren skal lage et mål på eksponering for politisk vold. Korrelasjoner kan ikke gi en pekepinn på om de ulike hendelsene reflekterer et underliggende, latent begrep. – Og det er jo det de skal si noe om, ifølge ideen bak oppskriften over. Politisk vold kan ikke betraktes som en latent variabel som forårsaker at mennesker utsettes for krigshendelser. Slik jeg ser det, kan ikke slike hendelser betraktes som mer begrepsmessig knyttet til hverandre dersom de korrelerer, enn dersom de ikke gjør det. Å skulle ekskludere for eksempel leddet «min mor ble drept» fra et spørreskjema om politisk vold fordi dette leddet korrelerer negativt med resten av spørreskjemaleddene, gir ingen mening. De to siste punktene i oppskriften passer etter min mening ikke når måleobjektet er livshendelser.

Er dette noe å skrive om? Det kan vel ikke finnes mange forskere som ekskluderer denne type spørreskjemaledd på grunn av noen skarve korrelasjoner? Jo, det gjør det!

Utallige forskningspublikasjoner viser at mange forskere – noen av dem ganske kjente – benytter ulike varianter av oppskriften over når de skal tallfeste konkrete hendelser i menneskers liv. Forskerne behandler eksponering for vold, mobbehandlinger og lignende som latente variabler. De viser til Cronbachs alfa og test-retest og interbedømmerkorrelasjoner basert på summerte ledd som dokumentasjon på instrumentenes kvalitet, og utelater spørreskjemaledd som ikke korrelerer med resten. Disse leddene inneholder gjerne spesielt interessant informasjon. Som eksempel kan jeg nevne Bernstein og kollegaers kjente Childhood Trauma Questionnaire (CTQ) på 70 spørreskjemaledd. Disse forskerne ekskluderte flere spørsmål om ulike typer mishandling og omsorgssvikt fra analyser av data på grunn av lave korrelasjoner med andre spørreskjemaledd. Ved hjelp av faktoranalyse konstruerte Bernstein og kollegaer for noen år siden en 28-leddsversjon av CTQ. Denne kortversjonen benyttes ofte i dag. Er det urimelig å spørre om barn som har vært utsatt for andre typer mishandling og omsorgssvikt, vil bli oppdaget ved hjelp av dette spørreskjemaet?

Enda færre slike barndomserfaringer ble inkludert i en studie fra Norge som nylig ble publisert i Journal of Nervous and Mental Disease (Fosse & Holen, 2007). Forskerne, som benyttet en 21-leddsversjon av CTQ, ekskluderte faktoren «physical neglect» på grunn av lav intern konsistens. Blir konklusjoner vedrørende psykiske konsekvenser av barnemishandling og omsorgssvikt mer pålitelige ved at forskerne utelater fra dataanalysene en del av informantenes erfaringer med omsorgssvikt? Er det ikke heller tvert om?

En ting som også går igjen, er at statistikkprogrammene gis jobben med å gruppere spørreskjemaledd. Forskerne kaller det å avdekke underliggende dimensjoner eller faktorer. Hodeløs konstruksjon av underlige kategorier, passer det ofte bedre å si! Resultatet er nemlig ikke sjelden at spørreskjemaledd som logisk sett ikke synes å ha mye med hverandre å gjøre, summeres til samlevariabler. Et eksempel er en studie av bosniske flyktningbarn i Sverige publisert i American Journal of Orthopsychiatry (Angel, Hjern & Ingleby, 2001). Statistikkprogrammet fortalte forskerne at spørreskjemaleddene «far var soldat», «vanskelig flukt», «behov for tilfluktsrom» og «mistet lekemuligheter» hørte sammen. Forskerne kalte denne faktoren for motstandskamp!

Jeg tenker meg at psykometrisme henger sammen med det å virkelig tro på psykometrien. Men psykometrien fortjener bedre enn å bli trodd på. Den fortjener å bli tatt på alvor! Som student oppfattet jeg det slik at den standard målemodellen vi lærte, var udiskutabel. Jeg trodde på den til tross for at jeg ikke forsto alt om latente variabler, faktoranalyse og Cronbachs alfa – eller kanskje nettopp derfor? Antakelig i likhet med mange andre i psykologimiljøet stilte jeg ikke grunnleggende spørsmål angående måling som: Hva er alternative modeller? Kommer man i psykologien ikke utenom å måtte postulere latente variabler? Hva er latente variablers ontologiske status? Hvor meningsfylt er det egentlig å snakke om «mål» og «måling» når objektet er et psykisk fenomen? Hva kan være konsekvenser av å anvende en latent variabelmodell på områder hvor den ikke passer (som tallfesting av hendelser og handlinger)?

Å stimulere til diskusjon av denne type spørsmål i utdannelsen av psykologer og innenfor psykologmiljøene kan forebygge psykometrisme og gjøre forsøk på tallfesting av psykologiske fenomener til en morsommere og kvalitativt bedre aktivitet. Kanskje Tidsskriftets testspalte kunne spille en rolle her?

Teksten sto på trykk første gang i Tidsskrift for Norsk psykologforening, Vol 44, nummer 10, 2007, side 1278-1279

Kommenter denne artikkelen