Karakterstyrker: Treffsikkerheten av selvvurderinger og andres vurderinger
Johanne Bjørgum Skillingstad1, Åsa Frostad Kjærstad2, Henning Bang3
1King’s College London
2Universitetssykehuset Nord-Norge HF
3Psykologisk institutt, Universitetet i Oslo
Sammendrag
Studien undersøker treffsikkerheten i andres vurderinger av kadetters karakterstyrker, og hvorvidt det er selvvurdering eller gjennomsnittet av andres vurderinger som gir det mest treffsikre bildet. Vi benyttet de tre kriteriene til Funder og West (1993) for å vurdere treffsikkerheten av andres vurderinger: (1) positiv korrelasjon mellom selvvurdering og andres vurderinger av egenskapen, (2) konsensus mellom andres vurderinger av egenskapen og (3) at andres vurderinger av egenskapen korrelerer positivt med relevante utfallsmål. Hvis kriteriene ble oppfylt, tok vi dette som indikasjon på at andres vurderinger er treffsikre. Hvis andres vurderinger i tillegg korrelerte høyere med relevante utfallsmål enn selvvurderinger, tok vi dette som en indikasjon på at andres vurderinger er mer treffsikre enn selvvurderinger. De tolv karakterstyrkene som ble vurdert, var lederskap, integritet, dømmekraft, utholdenhet, mot, lagspiller, rettferdighet, sosial intelligens, læringslyst, selvregulering, perspektiv og kreativitet. Utfallsmålene var militære og akademiske prestasjoner. 181 kadetter fra Krigsskolen deltok i studien. Vi fant statistisk signifikante positive korrelasjoner mellom selvvurdering og andres vurderinger for elleve karakterstyrker, og moderat til høy konsensus mellom andres vurderinger for alle karakterstyrker. Videre fant vi statistisk signifikante positive korrelasjoner mellom andres vurderinger og akademiske prestasjoner for elleve av tolv karakterstyrker, men kun for én selvvurdert karakterstyrke. Når det gjaldt sammenhengen mellom andres vurderinger og militære prestasjoner, fant vi statistisk signifikante positive korrelasjoner for alle tolv karakterstyrker, og for syv av de selvvurderte karakterstyrkene. Funnene indikerer at andres vurderinger er mer treffsikre enn selvvurderinger for elleve av tolv karakterstyrker.
Nøkkelord: karakterstyrker, selvvurderinger, andres vurderinger, akademisk prestasjon, militær prestasjon
Abstract
This study investigates the accuracy of other-ratings of cadets’ character strengths and whether self-ratings or an average of other-ratings provide the most accurate assessment. We applied Funder and West’s (1993) three criteria for evaluating the accuracy of other-ratings: (1) positive correlation between self-rating and other-ratings of the same attribute, (2) consensus between other-ratings of the same attribute, and (3) positive correlation between other-ratings of the attribute and relevant outcome measures. If the criteria were met, we took this to indicate that other-ratings are accurate. If other-ratings also correlated higher with relevant outcome measures than did self-ratings, we took this to indicate that other-ratings are more accurate than self-ratings. The 12 character strengths rated were leadership, integrity, judgement, perseverance, bravery, teamwork, fairness, social intelligence, love of learning, self-regulation, perspective and creativity. The study participants comprised 181 army cadets from the Norwegian Military Academy. We found statistically significant positive correlations between self-ratings and other-ratings for 11 character strengths, and moderate to high consensus between other-ratings for all character strengths. We found statistically significant positive correlations between other-ratings and academic performance for 11 of the 12 character strengths but for only one self-rated character strength. For the relationship between other-ratings and military performance, we found statistically significant positive correlations for all 12 character strengths and for seven of the self-rated character strengths. The findings indicate that other-ratings are more accurate than self-ratings for 11 out of 12character strengths.
Keywords: character strengths, self-ratings, other-ratings, academic performance, military performance
Å kunne gjøre treffsikre vurderinger av et individs personlige egenskaper er vesentlig på en rekke arenaer. Det er relevant i klinisk psykologisk praksis, forskning på personlighet og ved rekruttering i arbeidslivet. Videre er det relevant ved opptak til ulike utdanninger hvor personlige egenskaper spiller en sentral rolle for egnethet. Et eksempel er bachelorstudiet i militær ledelse ved Forsvarets høgskole, som utdanner offiserer til det norske Forsvaret. I dagens opptak selekteres kandidatene ut fra karakterer fra videregående og hvordan de presterer på blant annet evnetester, personlighetstester, intervju og feltøvelse (Boe & Bang, 2017). Nyere forskning indikerer at det også kan være nyttig å vurdere kandidatenes karakterstyrker (Bang et al., 2021).
Karakterstyrker er personlige egenskaper som kan defineres som «positively valued trait-like individual differences with demonstrable generality across different situations and stability across time that manifest in the range of individuals’ thoughts, feelings, and behaviours» (Harzer & Ruch, 2014, s. 184). Peterson og Seligman (2004) lanserte i boka Character strengths and virtues: A handbook and classification 24 ulike karakterstyrker. Innenfor den militære doktrine har det vært mye oppmerksomhet rundt hvor viktig det er å utvikle «militær karakter» (Matthews et al., 2006). Militær karakter innebærer verdier, dyder og karakterstyrker som anses som særlig sentrale for å prestere godt «in extremis leadership»-situasjoner (Kolditz, 2010). Dette er situasjoner hvor man må være villig til å risikere eget liv, ta andres liv og beordre egne kamerater til å gjøre handlinger som kan sette dem i livsfare.
Når det gjelder prediksjon av arbeidsprestasjoner, kan karakterstyrker gi økningsvaliditet («incremental validity») utover kognitive evner og personlighetstrekk (Harzer et al., 2021). Videre kan visse karakterstyrker være vesentlige for å lykkes med utøvelsen av militært lederskap (Bang et al., 2021; Cosentino & Solano, 2012; Gayton & Kehoe, 2015; Matthews, 2008; Matthews et al., 2006). I vår studie tar vi utgangspunkt i tolv av karakterstyrkene til Peterson og Seligman (2004): lederskap, integritet, dømmekraft, utholdenhet, mot, lagspiller, rettferdighet, sosial intelligens, læringslyst, selvregulering, perspektiv og kreativitet (se appendiks A, Tabell S1). Grunnlaget for utvalget er at Boe og kolleger i fire tidligere studier identifiserte disse tolv karakterstyrkene som særlig vesentlige for utøvelsen av militært lederskap (Boe, 2016; Boe et al., 2015a, 2015b; Boe & Bang, 2017).
Et sentralt spørsmål når man skal måle en persons karakterstyrker, er om det er personen selv eller andre som gjør den mest treffsikre vurderingen. Connelly og Ones (2010) fant i en metaanalyse av 188 studier av vurderinger av personlighetstrekk at «other-ratings assess traits more validly than do self-ratings for predicting at least some important criteria (e.g., academic and job performance)» (s. 1110). Vi har imidlertid ikke funnet studier som ser på om dette også gjelder for karakterstyrker.
I vår studie undersøkte vi derfor om andres vurderinger av en persons karakterstyrker er treffsikre, og om det er selvvurderinger eller andres vurderinger gir det mest treffsikre bildet. Vi tok utgangspunkt i tre anerkjente kriterier for å vurdere treffsikkerheten i andres vurderinger av personlige egenskaper (Connelly & Ones, 2010; Funder & West, 1993):
Det foreligger positiv samvariasjon mellom andres vurderinger og selvvurderinger av egenskapen (self-other consistency).
Det foreligger konsensus mellom andres vurderinger av egenskapen (interrater reliability).
Andres vurderinger av egenskapen korrelerer positivt med relevante utfallsmål (criterion-related validity).
Dersom kriteriene er oppfylte, indikerer dette at andres vurderinger av karakterstyrkene er treffsikre. Videre, dersom gjennomsnittet av andres korrelerer høyere med relevante utfallsmål enn selvvurderingene, er dette en indikasjon på at andres vurderinger er mer treffsikre enn selvvurderingene. Når vi senere i artikkelen skriver «andres vurderinger», refererer vi til «gjennomsnittet av lagkameratenes vurderinger».
Metode
Deltakere
Studien baserer seg på data fra et utvalg av 181 kadetter fordelt på tre kull av Krigsskolens bachelorprogram med studiestart i henholdsvis 2015, 2016 og 2019. Deltakelse i studien var frivillig, og 91 % av kadettene signerte informert samtykke til å delta. Kadettenes alder ved oppstart på Krigsskolen varierte mellom 18 og 33 år, med et gjennomsnitt på 23.3 (SD = 2.9). 20 kadetter kvinner og 147 var menn, mens 14 fylte ikke ut opplysninger om kjønn.
Datainnsamling
Vurdering av kadettenes karakterstyrker ble målt gjennom spørreskjemaet OBSCIF (OBServation of Character In the Field). OBSCIF ble utviklet for kartlegging av de tolv karakterstyrkene vi målte, og er basert på observerbar atferd (Bang et al., 2016; Boe et al., 2016). OBSCIF inneholder tre til fire ledd for hver av de tolv karakterstyrkene. Reliabiliteten til de ulike karakterstyrkene målt med OBSCIF ble estimert med Cronbachs alfa. Vi estimerte reliabiliteten for to ulike kilder til vurderinger gjort rett i etterkant av stridskurset: selvvurderinger og vurderinger fra de andre av kadettenes karakterstyrker. Samtlige reliabilitetskoeffisienter var høyere enn 0.70 for andres vurderinger, og noe lavere for selvvurderte karakterstyrker (se appendiks B, Tabell S2).
Det vanligste verktøyet for vurdering av karakterstyrker er VIA-IS (Values in action – Inventory of Strengths), som består av 120 eller 240 ledd (Littman-Ovadia et al., 2021). Vi vurderte det likevel som mest hensiktsmessig å benytte OBSCIF, da dette er et betraktelig kortere skjema (38 ledd). For å undersøke samtidig validitet for OBSCIF ble imidlertid kadettene bedt om å gjøre en selvvurdering med både OBSCIF og VIA-IS en uke i forkant av stridskurset. Bivariate korrelasjoner mellom de tolv karakterstyrkene målt med OBSCIF og VIA-IS varierte mellom r =.31 for lederskap til r =.74 for kreativitet (se appendiks B, Tabell S2).
Spørreskjemaene ble administrert med penn og papir. For alle tre kohorter ble det satt av tid ute i felt til at kadettene kunne fylle ut OBSCIF ett døgn etter avsluttet stridskurs. De ble bedt om å ta stilling til i hvilken grad (skala 1–5) de selv, samt hver av deres lagkamerater, hadde vist den aktuelle væremåten eller atferden som sto beskrevet, i løpet av stridskurset.
Som mål på akademiske prestasjoner benyttet vi gjennomsnittet av de samlede eksamenskarakterene (inkludert karakteren på bacheloroppgaven) som kadettene fikk gjennom tre år på Krigsskolen. Karakterskalaen gikk fra A (best) til F (stryk), og den ble omgjort til en numerisk skala fra 6 (best) til 1 (dårligst).
Som mål på militære prestasjoner brukte vi gjennomsnittet av veiledernes vurderinger av kadettenes prestasjon på stridskurset. To veiledere fra Krigsskolen gikk i skift – tolv timer hver – og fulgte kadettene på et lag kontinuerlig gjennom hele stridskurset. De tok notater underveis og gjorde en endelig vurdering av prestasjonene til den enkelte kadett i etterkant av stridskurset. Vurderingsskalaen som ble benyttet, var en 5-punktsskala, hvor 1 = under norm, 2 = litt under norm, 3 = på norm, 4 = litt over norm, 5 = over norm. Vurderingen utgjorde en helhetsvurdering av kadettens egnethet som offiser , med særlig vekt på følgende atferdskriterier: 1) tar ansvar for oppdraget, egen enhet og seg selv; 2) viser vilje og evne til å mestre belastninger og ubehag; 3) presterer godt som leder, som del av avdeling og som enkeltperson og 4) viser vilje og evne til å knytte kurset til egen, langsiktig lederutvikling (Hærens krigsskole, 2016; Hærens krigsskole, 2019).
Kontekst og prosedyre
Vi samlet inn data om kadettenes vurderinger i sammenheng med stridskurset (populært kalt «helvetesuka»), som er den mest krevende øvelsen på Krigsskolen. Vi mener kurset ga et godt grunnlag for å utvise de tolv karakterstyrkene vi målte: mot, utholdenhet, lederskap, perspektiv, integritet, læringslyst, kreativitet, rettferdighet, perspektiv, dømmekraft, sosial intelligens og om de var gode lagspillere eller ikke. Ettersom disse karakterstyrkene er særskilt viktige for utøvelsen av militært lederskap, sto de sentralt i mange av øvelsene og utfordringene kadettene gjennomgikk sammen. De ville dermed trolig vise seg i synlig atferd.
Videre antar vi at kadettene i større grad viste sine sanne karakterstyrker da de ble utsatt for belastninger som var i grenseland av hva de kunne tåle. Stridskurset var døgnkontinuerlig og varte i godt over en uke. Kadettene på samme lag, mellom fem og ti personer, levde tett på hverandre. Vurderingene av egne og andres karakterstyrker ble gjort like etter stridskurset, men først hadde kadettene fått et døgn med søvn og hvile. Stridskurset bød på en rekke harde fysiske og psykiske utfordringer, kombinert med svært lite søvn og mat. Kadettene opplevde betydelig stress, tap av kontroll og stor grad av uforutsigbarhet. Samtidig passet overordnede og helsepersonell til enhver tid på at kurset foregikk på en forsvarlig måte.
Analyser
Vi undersøkte i hvilken grad variablene i studien (de tolv karakterstyrkene og utfallsmålene akademiske og militære prestasjoner) var tilnærmet normalfordelte. Da utvalget vårt besto av 181 personer, ble Shapiro-Wilks test for streng i vurderingen av tilnærmet normalitet. Vi utførte derfor inspeksjon av histogrammer og QQ-plott for variablene i studien. Undersøkelsene indikerte at begge prestasjonsmålene, samt målene på elleve av tolv karakterstyrker (alle unntatt utholdenhet), var tilnærmet normalfordelte.
Kriterium 1 – grad av korrelasjon mellom selvvurdering og andres vurderinger – undersøkte vi ved å korrelere selvvurderinger med gjennomsnittet av andres vurderinger for hver av de tolv karakterstyrkene.
Kriterium 2 – konsensus mellom bedømmere (i vårt tilfelle: lagkameratene) – ble undersøkt gjennom analyse av intraklassekorrelasjoner mellom bedømmerne for hver av karakterstyrkene. Vi brukte et «round-robin»-design, hvor alle kadettene på samme lag vurderte hverandre. Lagene besto av mellom fem og ti personer. For å unngå skjevheter knyttet til antall bedømmere ble det for lag med flere enn fem bedømmere trukket ut vurderinger fra fem tilfeldige bedømmere. Siden det ikke var de samme lagkameratene som vurderte alle kadettene, og at vi benyttet et gjennomsnitt av fem lagkameraters vurdering som mål på andres vurdering, valgte vi å bruke ICC(1, k) (k = 5) som modell for intraklassekorrelasjonen (se Koo & Li, 2016; Shrout & Fleiss, 1979). Vi vurderte resultatene etter Koo og Lis (2016) kategorier, der ICC-verdier under.5 kategoriseres som dårlige, verdier mellom.5 og.75 som moderate, verdier mellom.75 og.90 som gode, og verdier over.90 som utmerkede. Estimatene av ICC(1, k) ble utført med R versjon 4.1.2 (R Core Team, 2022) ved hjelp av R-pakken agreement (Girard, 2020).
I et round-robin-design, hvor alle medlemmene vurderer hverandre innenfor en gruppe, vil vurderingene ikke kunne betraktes som uavhengige av hverandre (Malloy & Kenny, 1986; Wong et al., 2024). Ifølge Kennys (2019) sosiale relasjonsmodell (SRM) vil det i hvert fall foreligge tre ulike kilder til variasjon i de vurderingene som blir gjort av gruppens medlemmer: a) målpersoneffekt – tendensen en målperson har til å bli evaluert likt av andre på en bestemt karakterstyrke; b) bedømmereffekt – tendensen en bedømmer har til å evaluere andre likt på en bestemt karakterstyrke; c) relasjonseffekt – tendensen en bedømmer har til å evaluere en bestemt målperson på en bestemt måte på en bestemt karakterstyrke. I vår studie estimerte vi hvor mye av variasjonen i enighet som kan tilskrives hver av disse tre kildene, ved hjelp av programmet SRM_R (Wong et al., 2024).
Kriterium 3 var hvor godt selvvurderinger og andres vurderinger av karakterstyrkene korrelerte med relevante utfallsmål. Vi la til grunn at høye korrelasjoner mellom vurderingene av karakterstyrkene og de relevante utfallsmålene indikerte høy grad av treffsikkerhet. Vi antok at skårer på karakterstyrker som er spesielt relevante for utøvelsen av militært lederskap, ville ha en positiv sammenheng med både akademiske og militære prestasjoner på Krigsskolen. Vi lagde separate korrelasjonsmodeller for hver karakterstyrke, der vi undersøkte korrelasjon mellom skåren på karakterstyrken vurdert av en selv og vurdert av andre, og skåren på akademisk og militær prestasjon. Korrelasjonsanalysene for utfallsmålene ble utført med R versjon 4.1.2. (R Core Team, 2022). I analysene ble samtlige p-verdier justert for falsk oppdagelsesrate (Benjamini & Hochberg, 1995) for å redusere sannsynligheten for type 1-feil ved flere signifikanstester
Resultater
Kriterium 1 – samvariasjon mellom selvvurderinger og andres vurderinger
Tabell 1 viser bivariate korrelasjoner mellom selvvurdering og gjennomsnittet av andres vurderinger av kadettenes karakterstyrker. Den svakeste samvariasjonen mellom selv- og andrevurderte karakterstyrker var for rettferdighet (r =.14, ikke statistisk signifikant). For de andre karakterstyrkene var korrelasjonene positive, statistisk signifikante og svake til moderate. Sterkest korrelasjon mellom selvvurderinger og andres vurderinger fant vi for karakterstyrkene lederskap, utholdenhet og perspektiv (r >.50). Svakest korrelasjon var for karakterstyrkene rettferdighet, kreativitet og dømmekraft (r <.20).
Kriterium 2 – konsensus mellom bedømmernes vurderinger
Resultatene fra ICC(1,5)-analysen (tabell 1), som estimerer grad av konsensus mellom andre bedømmeres vurderinger for hver av karakterstyrkene, viste moderate til høye verdier (Koo & Li, 2016). Vurderingen av Rettferdighet viste klart lavest konsensus mellom bedømmere, med en ICC(1,5)-verdi på.57.
Ved å estimere kilder til variasjon i bedømmernes vurderinger av karakterstyrkene til medkadetter (tabell 1) så vi at mye av variasjonen (mellom 11% og 49 %) besto av målpersoneffekter (at det er konsensus i bedømmernes vurdering av målpersonenes karakterstyrker). Noe av variasjonen (mellom 10 % og 27 %) besto av bedømmereffekter (at enkelte bedømmere har en tendens til å se mye eller lite av bestemte karakterstyrker uavhengig av målperson). Resten (mellom 41 % og 63 %) av variasjonen besto av relasjonseffekter (tendensen en bedømmer har til å evaluere en bestemt målperson på en bestemt måte). Relasjonseffektene ble imidlertid estimert ut fra kun én replikasjon per relasjon, og var dermed beheftet med en stor komponent av feilvarians. Estimatene for relasjonseffekter bør derfor tolkes med varsomhet (Wong et al., 2024).
Kriterium 3 – Selvvurderinger og andres vurderinger korrelert med utfallsmål
Kriterium 3 innebærer at andres vurderinger korrelerer med relevante utfallsmål (kriterie-relatert validitet), og omhandler treffsikkerheten av andres vurderinger. Ut over dette undersøkte vi om korrelasjonen med utfallsmålene var sterkere for andres vurderinger enn for selvvurderinger. Tabell 2 viser resultatene fra korrelasjonsanalysen mellom henholdsvis selvvurderinger og andres vurderinger av karakterstyrker og utfallsmålet akademisk prestasjon. For alle karakterstyrker bortsett fra rettferdighet var andres vurderinger statistisk signifikant positivt korrelert med akademisk prestasjon. For selvvurderte karakterstyrker var kun perspektiv statistisk signifikant positivt korrelert med akademisk prestasjon.
Tabell 3 viser resultatene fra korrelasjonsanalysen mellom selvvurderinger og andres vurderinger av karakterstyrker på den ene siden og utfallsmålet militær prestasjon på den andre. Andres vurdering av samtlige tolv karakterstyrker var statistisk signifikant positivt korrelert med militær prestasjon, mens syv av de selvvurderte karakterstyrkene var det.
Diskusjon
Målet med studien var å undersøke treffsikkerheten i andres vurderinger av kadetters karakterstyrker, og om disse er mer treffsikre enn personens egne vurderinger. Vi fant støtte for at andres vurderinger er treffsikkert for elleve av tolv karakterstyrker, ved at de tre kriteriene for treffsikkerhet av andres vurderinger ble oppfylt (Connelly & Ones, 2010; Funder & West, 1993). Vi fant positive korrelasjoner mellom selv- og andres vurderinger for elleve av tolv karakterstyrker. Styrken på korrelasjonene befant seg omtrent i samme område som tidligere studier av personlighetstrekk har vist (Connolly et al., 2007). For karakterstyrken rettferdighet var korrelasjonen lav og ikke statistisk signifikant.
Videre fant vi moderat til stor grad av konsensus mellom lagkameratenes vurderinger for tolv karakterstyrker, med reliabilitetskoeffisienter i tråd med funn fra tidligere studier av andres vurderinger av personlighetstrekk (Connolly et al., 2007). Det var minst konsensus blant lagkameratene om vurderingen av karakterstyrken rettferdighet. Resultatene fra SRM-analysen viste at variasjonen i lagkameratenes vurderinger for ti av tolv karakterstyrker (alle unntatt rettferdighet og kreativitet) i større grad kan tilskrives målpersoneffekter enn bedømmereffekter. Dette indikerer at når lagkameratene viste stor enighet i vurderingen av disse ti karakterstyrkene, skyldtes dette først og fremst at personen de vurderte (målpersonen), viste den aktuelle karakterstyrken. På tvers av de tolv karakterstyrkene sto målpersoneffekter i gjennomsnitt for 30 % av variasjonen, mens bedømmereffekter i gjennomsnitt sto for 19 % av variasjonen (se tabell 1). Til sammenligning estimerte Kenny (2019) at 40 % av variasjonen i vurderinger fra folk som kjenner en person godt og over lang tid, kan tilskrives målpersoneffekter, mens 20 % av variasjonen kan tilskrives bedømmereffekter.
Resultatene tyder også på at andres vurderinger gjennomgående er mer treffsikre enn selvvurderinger. Sammenlignet med selvvurderte karakterstyrker var lagkameratenes vurderinger av samtlige tolv karakterstyrker sterkere korrelert med både akademiske og militære prestasjoner. I tillegg fant vi at elleve av tolv andrevurderte karakterstyrker (alle unntatt rettferdighet) korrelerte positivt med begge typer prestasjoner. Andres vurderinger synes dermed å være gjennomgående sterkere assosiert med prestasjoner enn det selvvurdering av de samme karakterstyrkene er. Dette er i tråd med det Connelly og Ones (2010) fant i sin metaanalyse av sammenhengen mellom selvvurderinger og andres vurderinger av personlighetstrekk og prestasjoner.
Korrelasjoner mellom egne og andres vurderinger
Vi fant statistisk signifikante og positive korrelasjoner mellom selvvurdering og andres vurderinger for alle karakterstyrkene – med unntak av rettferdighet. Samtidig var det til dels store forskjeller i styrken på korrelasjonene avhengig av hvilke karakterstyrker som ble vurdert (se tabell 1). Det var klart sterkest korrelasjoner mellom selvvurderinger og andres vurderinger for karakterstyrkene lederskap, utholdenhet og perspektiv, og svakest korrelasjoner for rettferdighet, kreativitet og dømmekraft.
De svake korrelasjonene for rettferdighet, kreativitet og dømmekraft tilsier at en kan oppleve sine karakterstyrker forskjellig fra hvordan andre opplever dem. En mulig forklaring er, ifølge Vazire (2010), en asymmetri i hva en selv og andre har kunnskap om når det gjelder indre egenskaper hos en person (Self-Other Knowledge Asymmetry – SOKA-modellen). En person har unik kunnskap om hva en selv tenker og føler, hvilke dilemmaer en opplever å stå i, hvilke behov og motiver som driver en, hvilke verdier og holdninger en har, hva en tror på som sant og usant, og hva slags utfordringer en har stått overfor og livserfaringer en har gjort seg. Andre kan anta noe om en persons indre verden ut fra hvordan personen handler, og hva vedkommende sier (såkalte atferdssignaler). Like fullt er det fortolkninger av personens indre verden. På den andre siden har andre god kunnskap om lett synlige atferdsmønstre hos personer de er mye sammen med, og effekten av atferden deres, men også ansiktsuttrykk og tonefall hos disse (Stone & Heen, 2015; Vazire, 2010). Asymmetrien i kunnskap kan være med på å forklare svakere selv–andre-korrelasjoner i vurderinger av indre orienterte karakterstyrker som rettferdighet, kreativitet og dømmekraft.
Variasjon mellom lagkameratenes vurderinger
Et lignende mønster ser vi i hvilke karakterstyrker det var mest enighet om blant lagkameratene: lederskap, perspektiv, utholdenhet, selvregulering og lagspiller. De viste minst enighet i sine vurderinger av rettferdighet, kreativitet, læringslyst og dømmekraft (se tabell 1).
I tråd med SOKA-modellen til Vazire (2010) foreslår vi at det kan være lettere for lagkameratene å være enige om i hvilken grad en person kjennetegnes av relativt godt synlige karakterstyrker, sammenlignet med indre orienterte karakterstyrker. Funders (1995) RAM-teori (Realistic Accuracy Model) kan kaste lys over hvorfor det er lettere for lagkameratene å enes om vurderingen av noen av karakterstyrkene framfor andre. Teorien hevder at vi oppfatter andres personlighetstrekk ved at de kommer til uttrykk gjennom observerbare atferdssignaler. Individet må altså vise atferdssignaler som er relevante uttrykk for personlighetstrekket (relevans), og det må være mulig for observatøren å oppfatte disse atferdssignalene (tilgjengelighet). I tillegg må observatøren faktisk legge merke til atferdssignalene (oppdagelse) og nyttiggjøre seg av dem ved å fortolke dem korrekt som tegn på det personlighetstrekket de faktisk er et uttrykk for (nyttiggjøring).
Vi vil foreslå at de tre første av disse kildene – relevans, tilgjengelighet og oppdagelse – kan bidra til å forklare hvorfor det er så stor enighet blant lagkameratene på stridskurset om vurderingen av de fem karakterstyrkene lederskap, perspektiv, utholdenhet, selvregulering og lagspiller. Kadettene ble under stridskurset utsatt for en rekke ulike øvingsmomenter, hvor disse fem karaktertrekkene stadig ble satt på prøve. De skulle lede laget sitt gjennom uforutsigbare operasjoner (lederskap), utholde store og langvarige fysiske og psykiske belastninger (utholdenhet), få lite mat og bli utsatt for kontinuerlig søvndeprivasjon (selvregulering), gjøre en rekke små og store vurderinger som krever klokskap og evne til å se ting i perspektiv (perspektiv), og kontinuerlig være villig til å sette ego til side og stille opp for laget sitt (lagspiller). Kadettene har derfor sannsynligvis sett hverandre i mange situasjoner hvor atferd som uttrykker disse fem karakterstyrkene, har vært relevant å utvise. Fordi laget er sammen hele tiden, blir også kadettenes atferd tilgjengelig og lett å oppdage for lagkameratene. Vi vet ingenting om de ulike lagkameratenes evne til å nyttiggjøre seg av atferdssignaler fra sine lagkamerater og fortolke dem korrekt. Derfor er det vanskelig å benytte den sistnevnte kilden som forklaring på den høye enigheten.
Sterkere kriterievaliditet i andres vurderinger
I en studie av ulike personlighetstrekk fant Vazire (2010) at både en selv og andre kan gjøre treffsikre vurderinger av ens personlige egenskaper. For egenskaper som har høy evalueringsverdi i kulturen – altså egenskaper som blir betraktet som særlig verdifulle eller særlig lite verdifulle – synes imidlertid andres vurderinger å være mer treffsikre enn selvvurderinger. Vazires (2010) forklaring er at selvbeskyttende mekanismer trer i kraft når vi skal evaluere egenskaper ved oss selv som er særlig høyt eller lavt verdsatt, fordi vi er opptatt av å bevare et godt selvbilde. De selvbeskyttende mekanismene vil ikke påvirke vurderingene andre gjør av oss på samme måte.
Vi mener de tolv karakterstyrkene som er med i vår studie, har høy evalueringsverdi, fordi de er karakterstyrker som defineres som «positivt verdsatte personlighetstrekk» (Wagner et al., 2021). I tillegg har de en særlig høy evalueringsverdi i en militær kontekst fordi de nettopp er spesielt viktige for utøvelsen av militært lederskap (Boe & Bang, 2017). I tråd med Vazire (2010) vil andres vurderinger av karakterstyrker med høy grad av evalueringsverdi være mer treffsikre enn selvvurderinger av dem. Dette kan være en mulig forklaring på at alle de tolv karakterstyrkene hadde høyere kriterievaliditet når de ble vurdert av andre enn av kadettene selv.
Praktiske implikasjoner
Resultatene fra studien har praktiske implikasjoner for områder hvor man er avhengig av treffsikre vurderinger av personlige egenskaper. Eksempler er i seleksjonsprosesser til stillinger i arbeidslivet eller ved opptak til ulike studier hvor personlig egnethet er vesentlig, som Forsvarets høgskole eller Politihøgskolen. Feilseleksjon kan være dyrt for organisasjoner som rekrutterer, gjennom kostnader knyttet til dårlige prestasjoner, avslutning av arbeidsforhold og nye rekrutteringsprosesser. For høyrisikoyrker kan feilseleksjon ha særlig store konsekvenser. Det er derfor viktig å benytte seg av vurderingsmetoder som i størst mulig grad predikerer gode jobbprestasjoner.
Funnene våre indikerer at vurderingene for mange personlige egenskaper blir mer treffsikre når de gjøres av flere andre som kjenner godt den som vurderes. Dette er i overensstemmelse med lignende studier som er gjort på vurderinger av personlighet (Connelly & Ones, 2010). Vi foreslår derfor at man i seleksjonsprosesser i større grad bruker et gjennomsnitt av andres vurderinger av personlige egenskaper istedenfor, eller i tillegg til, selvvurderinger.
Metodiske begrensninger og videre forskning
Det er flere metodiske begrensninger ved studien. Utvalget vårt er relativt lite, snevert og preselektert på faktorer som er assosierte med både karakterstyrker og prestasjoner. Kadettene var sannsynligvis i større grad kjennetegnet av de tolv karakterstyrkene vi undersøkte enn resten av befolkningen. Det er derfor grunn til å tro at det foreligger en «restriction of range»-utfordring. I tillegg kan et lite utvalg ha bidratt til at mange av sammenligningene av selvvurderinger og andres vurderinger hadde overlappende konfidensintervall for korrelasjonene (se tabell 2 og tabell 3). For akademisk prestasjon var det overlappende konfidensintervaller for selvvurderinger og andres vurderinger for ti av tolv karakterstyrker, mens det for militær prestasjon var overlappende konfidensintervall for syv av tolv karakterstyrker. For å undersøke robustheten i våre resultater vil det derfor være nyttig å replikere studien med et betydelig større og mer heterogent sammensatt utvalg.
En annen begrensning vedrører forskjeller i når og over hvilket tidsspenn studiens ulike variabler ble målt. Vurderinger av egne og andres karakterstyrker og av utfallsmålet militære prestasjoner ble foretatt rett etter stridskurset. Utfallsmålet akademiske prestasjoner er på sin side et gjennomsnittsmål fra eksamener samlet inn over en treårsperiode. Vi fant at vurderinger av karakterstyrker korrelerte klart høyere med militære enn med akademiske prestasjoner. Funnet kan altså skyldes at akademiske prestasjoner ble samlet inn over et større tidsspenn. Fremtidige studier bør samle inn data om vurderinger av kadettenes karakterstyrker tidligere, og helst allerede under opptaket til Forsvarets høgskole. Under opptaksprosedyrene gjennomgår søkerne øvelser som har likhetstrekk med stridskurset. De kan dermed allerede da gjøre vurderinger av både egne og lagkameraters karakterstyrker.
Konklusjon
Våre funn indikerer at treffsikkerheten til andres vurderinger for elleve av tolv karakterstyrker var god. Det var positiv korrelasjon mellom andres vurderinger og selvvurderinger av disse karakterstyrkene, og konsensus mellom andres vurderinger av karakterstyrkene. I tillegg korrelerte andres vurderinger av karakterstyrkene klart høyere med både akademiske og militære prestasjoner enn hva selvvurderte karakterstyrker gjorde. Det indikerer at andres vurderinger kan være mer treffsikre enn selvvurderinger.
Resultatene våre gir grunn til å stille seg kritisk til nytten av kun å benytte selvvurderinger av karakterstyrker, og at en bør vurdere å supplere eller bytte ut selvvurderinger med vurderinger fra andre som kjenner godt personen som skal vurderes.
Appendiks
Referanser
Bang, H., Eilertsen, D. E., Boe, O. & Nilsen, F. A. (2016). Development of an observational instrument (OBSCIF) for evaluating character strengths in army cadets. EDULEARN16 Proceedings, 7803–7808. https://doi.org/10.21125/edulearn.2016.0711
Bang, H., Nilsen, F., Boe, O., Eilertsen, D. E. & Lang-Ree, O. C. (2021). Predicting army cadets’ performance: The role of character strengths, GPA and GMA. Journal of Military Studies, 10(1), 139–153. https://doi.org/10.2478/jms-2021-0016
Benjamini, Y. & Hochberg, Y. (1995). Controlling the false discovery rate: A practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, 57(1), 289–300. https://doi.org/10.1111/j.2517–6161.1995.tb02031.x
Boe, O. (2016). Building resilience: The role of character strengths in the selection and education of military leaders. International Journal of Emergency Mental Health and Human Resilience, 17(4), 714–716. https://doi.org/10.4172/1522–4821.1000301
Boe, O. & Bang, H. (2017). The big 12: The most important character strengths for military officers. Athens Journal of Social Sciences, 4(2), 161–174. https://doi.org/10.30958/ajss.4-2-4
Boe, O., Bang, H. & Nilsen, F. A. (2015a). Experienced military officer’s perception of important character strengths. Procedia – Social and Behavioral Sciences, 190, 339–345. https://doi.org/10.1016/j.sbspro.2015.05.008
Boe, O., Bang, H. & Nilsen, F. A. (2015b). Selecting the most relevant character strengths for Norwegian army officers: An educational tool. Procedia – Social and Behavioral Sciences, 197, 801–809. https://doi.org/10.1016/j.sbspro.2015.07.188
Boe, O., Bang, H. & Nilsen, F. A. (2016). OBSCIF – vurdering av dine karakterstyrker: Observasjonsskjema for vurdering av karakterstyrker hos kadetter (OBSCIF – Evaluation of your character strengths: An observational instrument for rating of character strengths in army cadets). Krigsskolen, Oslo.
Connelly, B. S. & Ones, D. S. (2010). An other perspective on personality: Meta-analytic integration of observers’ accuracy and predictive validity. Psychological Bulletin, 136(6), 1092–1122. https://doi.org/10.1037/a0021212
Connolly, J. J., Kavanagh, E. J. & Viswesvaran, C. (2007). The convergent validity between self and observer ratings of personality: A meta-analytic review. International Journal of Selection and Assessment, 15(1), 110–117. https://doi.org/10.1111/j.1468–2389.2007.00371.x
Cosentino, A. C. & Solano, A. C. (2012). Character strengths: A study of Argentinean soldiers. Spanish Journal of Psychology, 15(1), 199–215. https://doi.org/10.5209/rev_SJOP.2012.v15.n1.37310
Funder, D. C. (1995). On the accuracy of personality judgment: A realistic approach. Psychological Review, 102(4), 652–670. https://doi.org/10.1037/0033–295X.102.4.652
Funder, D. C. & West, S. G. (1993). Consensus, self-other agreement, and accuracy in personality judgment: An introduction. Journal of Personality, 61(4), 457–476. https://doi.org/10.1111/j.1467–6494.1993.tb00778.x
Gayton, S. D. & Kehoe, E. J. (2015). A prospective study of character strengths as predictors of selection into the Australian army special force. Military Medicine, 180(2), 151–157. https://doi.org/10.7205/MILMED-D-14–00181
Girard, J. M. (2020). Agreement: An R package for the tidy analysis of agreement and reliability.
Harzer, C., Bezuglova, N. & Weber, M. (2021). Incremental validity of character strengths as predictors of job performance beyond general mental ability and the Big Five. Frontiers in Psychology, 12, 518369. https://doi.org/10.3389/fpsyg.2021.518369
Harzer, C. & Ruch, W. (2014). The role of character strengths for task performance, job dedication, interpersonal facilitation, and organizational support. Human Performance, 27(3), 183–205. https://doi.org/10.1080/08959285.2014.913592
Hærens krigsskole. (2016). Offisersvurdering. Upublisert mal for vurdering av kadettenes prestasjoner på stridskursene avholdt mellom 2016 og 2018. Forsvarets høgskole.
Hærens krigsskole. (2019). Offisersvurdering Krigsskolen (stridskurs). Upublisert mal for vurdering av kadettenes prestasjoner på stridskursene avholdt fra 2019. Forsvarets høgskole.
Kenny, D. A. (2019). Interpersonal perception: The foundation of social relationships. Guilford Publications.
Kolditz, T. A. (2010). In extremis leadership: Leading as if your life depended on it. John Wiley & Sons.
Koo, T. K. & Li, M. Y. (2016). A guideline of selecting and reporting intraclass correlation coefficients for reliability research. Journal of Chiropractic Medicine, 15(2), 155–163. https://doi.org/10.1016/j.jcm.2016.02.012
Littman-Ovadia, H., Dubreuil, P., Meyers, M. C. & Freidlin, P. (2021). Editorial: VIA character strengths: Theory, research and practice. Frontiers in Psychology, 12, 653 941. https://doi.org/10.3389/fpsyg.2021.653941
Malloy, T. E. & Kenny, D. A. (1986). The Social Relations Model: An integrative method for personality research. Journal of Personality, 54(1), 199–225. https://doi.org/10.1111/j.1467–6494.1986.tb00393.x
Matthews, M. D. (2008). Positive psychology: Adaptation, leadership, and performance in exceptional circumstances. I P. A. Hancock & J. L. Szalma (Red.), Performance under stress (s. 163–180). Ashgate Publishing.
Matthews, M. D., Eid, J., Kelly, D., Bailey, J. K. & Peterson, C. (2006). Character strengths and virtues of developing military leaders: An international comparison. Military Psychology, 18(1), 57–68. https://doi.org/10.1207/s15327876mp1803s_5
Park, N., Peterson, C., & Seligman, M. E. (2006). Character strengths in fifty-four nations and the fifty US states. The Journal of Positive Psychology, 1(3), 118–129. https://doi.org/10.1080/17439760600619567
Peterson, C. & Seligman, M. E. P. (2004). Character strengths and virtues: A handbook and classification. Oxford University Press.
R Core Team. (2022). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna. https://www.R-project.org
Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlations: Uses in assessing rater reliability. Psychological Bulletin, 86(2), 420–428.
Stone, D. & Heen, S. (2015). Thanks for the feedback: The science and art of receiving feedback well. Penguin.
Vazire, S. (2010). Who knows what about a person? The self–other knowledge asymmetry (SOKA) model. Journal of Personality and Social Psychology, 98(2), 281–300. https://doi.org/10.1037/a0017908
Wagner, L., Pindeus, L. & Ruch, W. (2021). Character strengths in the life domains of work, education, leisure, and relationships and their associations with flourishing. Frontiers in Psychology, 12, 597 534. https://doi.org/10.3389/fpsyg.2021.597534
Wong, M. N., Kenny, D. A. & Knight, A. P. (2024). SRM_R: A web-based shiny app for social relations analyses. Organizational Research Methods, 27(1), 114–139. https://doi.org/10.1177/10944281221134104