Statistisk teori og kausalitet i metodeundervisning

Statistikkundervisning med vektlegging av grundig forståelse av statistisk teori og håndregning er viktig for videre fordypning og nødvendig for at sosiologer skal være konkuransedyktige.

De siste månedene har det pågått en interessant debatt om metodeundervisning på Sosiologen. Som Skauge påpeker har studentenes stemme manglet i debatten og jeg vil her bidra med noen synspunkter om metodeundervisning. Av bakgrunn kan det nevnes at jeg ferdigstilte mastergrad i sosiologi ved UiB våren 2015. Jeg har siden jobbet med statistiske analyser og datahåndtering ved Folkehelseinstituttet og Helse Bergen parallelt med samfunnsøkonomistudier og startet nylig doktorgradsløp i epidemiologi ved Klinisk institutt (K1), UiB.

Konkret vil jeg ta for meg tre punkter: fordeling av vektlegging mellom statistisk teori og software, egen erfaring med statistikkundervisning i sosiologi og samfunnsøkonomi og kausal inferens med ikke-eksperimentelle data.

1. Statistisk teori og håndregning er viktige forutsetninger for bruk av software

Først og fremst støtter jeg Skardhamars argument som går på at man bør vektlegge statistisk teori og håndregning tilsvarende som software. Ved introduksjon til statistikk mener jeg teori og håndregning bør komme i første rekke. I likhet med Skardhamar mener jeg grunnleggende statistisk tenkning forstås lettere for hånd enn med maskin, og det er derfor viktig med god forståelse av statistisk teori og beregninger før man introduseres til software.

Enten man bruker Stata, R, SPSS eller andre programmer er det viktig å ha in mente at dette kun er verktøy som utfører beregninger og databehandlingsoppgaver. Korrekt modellering og tolkning krever substansiell kunnskap. Jeg mener faren med for tidlig innføring av software i metodeundervisning ligger i at statistiske modeller kan få et «black box» preg. Man kan selvfølgelig lære hvordan man setter opp en lineær eller logistisk regresjon gjennom å følge ulike statistiske «kokebøker», men man trenger statistisk teori for korrekt tolkning av modeller. Jeg deler Skauges synspunkt om at software kan fungere som et pedagogisk verktøy ved introdusering av nye statistiske teknikker.

Men jeg mener denne bruken av software først er aktuell ved introduksjon av mer avanserte teknikker som forutsetter grunnleggende statistikkforståelse (f.eks. multippel regresjon med flere uavhengige variabler, paneldatamodeller og flernivåanalyser). Forståelse av statistisk teori kan fremme faglig interesse fordi med bedre forståelse kommer bedre forutsetninger for å forstå mer avanserte analyser både innenfor eget fagfelt og tilgrensende fagfelt som økonomi, statsvitenskap og epidemiologi.

Ved introduksjon til statistikk mener jeg teori og håndregning bør komme i første rekke

2. Egen erfaring med metodeundervisning i sosiologi og samfunnsøkonomi

For å ta en nærliggende samfunnsvitenskapelig disiplin til sosiologi blir man allerede på bachelornivå i samfunnsøkonomi ved UiB godt skolert i grunnbegreper i statistikk gjennom emnet Statistikk og økonometri (ECON240). Man håndregner seg opp til og med enkel lineær og multippel regresjon. På bachelornivå ved UiB ble R. L. Thomas’ Using Statistics in Economics brukt, og Wooldridges Introductory Econometrics er også en populær og grundig introduksjonsbok.

Selv om dette er bøker som brukes i økonometri er innholdet allment anvendbart for alle samfunnsvitenskapelige studenter. Min erfaring er at denne tilnærmingen på mange måter gir bedre forutsetninger for å forstå statistiske modeller sammenlignet med «intuitive» og ikke-matematiske tilnærminger. Samtidig blir overgangen til bruk av software mer håndgripelig fordi man i større grad forstår de bakenforliggende beregningene statistikkprogrammene utfører. Denne tilnærmingen gir samtidig et langt bedre grunnlag for videre fordypning i mer avanserte metoder.

3. Kausal inferens med ikke-eksperimentelle data

Jeg er helt enig i Skardhamar og Kaldager Hart i at sosiologer bør mestre metoder for kausal inferens fra ikke-eksperimentelle data. Det har vært en fremragende utvikling i kausalanalyse innenfor statistikk de siste tiårene. En av foregangspersonene i utviklingen, Judea Pearl, anser utviklingen som en revolusjon i måten kausalitet håndteres i samfunnsvitenskapelige og biomedisinske vitenskaper (Pearl et al. 2016).

Professor i statsvitenskap ved Harvard, Gary King, har uttalt følgende: «More has been learned about causal inference in the last few decades than the sum total of everything that had been learned about it in all prior recorded history» (Pearl et al. 2016). Denne utviklingen er ikke bare vitenskapelig eufemisme men innebærer grundig tenkning rundt studiedesign som styrker grunnlaget for å trekke kausale slutninger.

Denne utviklingen får stadig større oppmerksomhet i samfunnsvitenskapene og over de siste årene har også epidemiologi tatt utviklingen innover seg. Jeg mener det er svært viktig at norske sosiologer deltar i denne utviklingen. Jeg anser ikke Angrist & Pischkes Mostly Harmless Econometrics som en kokebok, tvert imot mener jeg dette er en bok som oppfordrer til klarere metodisk tenkning. Metodene som beskrives (deriblant IV, DD, RD) kan i beste fall gi kausale estimater. Min erfaring med boken er at man sitter igjen med klarere forståelse for god statistisk praksis, større respekt for modellantagelser og bedre forståelse av begrensninger ved tradisjonelle regresjonsmodeller. Av statistisk notasjon er jeg enig i Skardhamar i at Mostly Harmless Econometrics ligger på et nivå som kvantitativt orienterte sosiologer bør kunne mestre for å delta i utviklingen av statistiske modeller i samfunnsvitenskapene.

Konklusjon

Oppsummert mener jeg Skardhamars tilnærming til statistikkundervisning med vektlegging av grundig forståelse av statistisk teori og håndregning gir viktige forutsetninger for videre fordypning i statistikk.  Samtidig deler jeg Skardhamar og Kaldager Harts synspunkter om økt vektlegging av metoder for kausal inferens i ikke-eksperimentelle data (identifikasjonsstrategier).

Dette er metoder det er viktig at sosiologer kjenner til for å være konkurransedyktig sammenlignet med andre samfunnsvitere. Kjennskap til kausale analyseteknikker gir samtidig bedret forståelse av nye og tradisjonelle regresjonsmodeller og styrker kritisk vurderingsevne av kvantitativ forskning.

Referanser

Angrist, J. D. Pischke, J. S. (2009). Mostly Harmless Econometrics. Princeton NJ, Princeton University Press.

Pearl, J., Glymour, M., Jewell, N. P. (2016). Causal inference in statistics: A primer. Wiley.

Thomas, R. L. (2009) Using Statistics in Economics. McGraw-Hill, UK.

Wooldridge, J. (2016) Introductory Econometrics: A Modern Approach. 6 ed. Boston, MA, USA. Cengage Learning.