Statistisk veiledning

Statistisk analyse er et viktig redskap i medisinsk forskning. Det brukes til å systematisere informasjon og gi beslutningsstøtte basert på datasett. Eller sagt med andre ord, fortelle historien som ligger skjult i dataene. Kunnskap om og forståelse for dataanalyse bør være til stede i både planleggingen, gjennomføringen og sluttarbeidet av studien.

​Seksjon for biostatistikk, SUS

Biostatistikere:
Ingvild Dalen (fagsjef)
E-post: ingvild.dalen@sus.no

Jörn Schulz
E-post: jorn.schulz@sus.no  

Anastasia Ushakova
Epost: anastasia.ushakova@sus.no

Jan Terje Kvaløy
E-post: jan.t.kvaloy@uis.no

Bjørn Henrik Auestad
E-post: bjorn.auestad@uis.no  

Bioinformatiker:
Marie Austdal
E-post: marie.austdal@sus.no  

 

Seksjon for biostatistikk ligger under Forskningsavdelingen og er en del av forskningsstøtten som tilbys ved SUS. Vår veiledningstjeneste i statistikk og metode er tilgjengelig for alle som driver forskningsarbeid ved SUS. Hovedregel for henvendelser om statistisk rådgivning er å sende prosjektbeskrivelse samt beskrivelse av hva det søkes veiledning om. Hjelp til selvhjelp er generelt et viktig mål, slik at forskerne selv lærer de metodene som brukes.

I samarbeid med Universitetet i Stavanger tilbyr vi to kurs i medisinsk statistikk: innføringskurset BIO907 (blant annet beskrivende statistikk, tester, variansanalyse, lineærregresjon) og videregåendekurset BIO908 (logistisk regresjon, overlevelsesanalyse, mixed models). Det finnes også gode kurs i Bergen og i Oslo. 

Helse Vest har også et regionalt kompetansesenter lokalisert ved Haukeland universitetssjukehus som tilbyr rådgivning i forsøksplanlegging, datainnsamling, databearbeiding og statistisk analyse. Tilbudet gjelder alle forskere i helseforetak i Helse Vest, men forskere i Helse Stavanger kan fortrinnsvis kontakte oss.

Seksjon for biostatistikk har kontorer i Forskertua, 2. etasje i Jan Johnsens gate 4 (gamle Maurtua barnehage). 

Generelle henvendelser vedrørende kurs og veiledning kan sendes til seksjonsleder Ingvild Dalen.

Det finnes en mengde litteratur, programvarer og nettsider som er gode hjelpemidler til å utføre statistisk analyse av medisinske data. Under følger en oversikt over statistikkressurser anbefalt av Seksjon for biostatistikk.

Statistikkressurser

Statistisk litteratur

Et stort utvalg lesestoff relatert til statistikk er tilgjengelig på markedet. Flere fagbøker egner seg som introduksjon til faget og som fordypning i enkelte emner. I tillegg byr markedet på guider og lærebøker for programvare for statistisk analyse. 

Generell medisinsk statistikk  og epidemiologi
  • Odd O. Aalen (red). Statistiske metoder i medisin og helsefag, 2. utgave. Gyldendal akademisk, 2018.
  • Marit B. Veierød, Stian Lydersen, Petter Laake (eds). Medical Statistics in Clinical and Epidemiological Research. Gyldendal akademisk, 2012.
  • Douglas G. Altman. Practical statistics for medical research. Chapman & Hall, 1991.
  • Per Magnus, Leiv S. Bakketeig. Epidemiologi, 4. utgave. Gyldendal akademisk, 2013. 
Spesialiserte emner
  • Stuart J. Pocock. Clinical Trials. A Practical Approach. Wiley, 1983.
  • David W. Hosmer Jr., Stanley Lemeshow, Rodney X. Sturdivant. Applied Logistic Regression, 3rd Edition. Wiley, 2013.
  • David W. Hosmer Jr., Stanley Lemeshow, Susanne May. Applied Survival Analysis: Regression Modeling of Time to Event Data, 2nd Edition. Wiley, 2008.
Fordypning i statistikkprogrammer
  • Julie Pallant. SPSS Survival Manual: A Step by Step Guide to Data Analysis using IBM SPSS. 7th edition,  Open University Press, 2020.
  • Andy Field. Discovering Statistics using IBM SPSS Statistics, 5th Edition. SAGE Publications Ltd, 2017.
  • Ewen Harrison, Riinu Pius. R for Health Data Science. CRC Press, 2021.
  • Babak Shahbaba, Biostatistics with R: An Introduction to Statistics Through Biological Data. Springer, 2012.
  • Edward Curry, Introduction to Bioinformatics with R: A Practical Guide for Biologists. 1st edition, Chapman and Hall/CRC, 2020. 

Programvare

Helse Vest har lisens på flere typer programvare for lagring og bearbeiding av innsamlede data. Hvilke programmer som bør benyttes vil til dels være avhengig av personlig preferanse og av studiens karakter. Biostatistikerne ved SUS har utstrakt erfaring med programmene SPSS, STATA og R, samt kjennskap til SAS, MatLab og Python.

SPSS
IBM SPSS Statistics programpakken er brukervennlig og har god kvalitet med egnede manualer. Ved å kontakte Helse Vest IKT brukerstøtte gis det tilgang til alle programmene i statistikkpakken SPSS uten ekstra kostnad. Kurskatalogen til Helse Vest tilbyr et introduksjonskurs i SPSS. SPSS har et intuitivt grensesnitt med pek-og-klikk funksjoner og hurtigmenyer med kommandoene man ønsker å utføre. I tillegg er det mulig å få kommandoene i programmet som såkalt syntax, slik at de kan lagres og gjentas senere.

Ekstrapakker med utvidede funksjoner kan lastes inn til SPSS. For eksempel kan pakken Stats Power brukes til å finne nødvendig utvalgsstørrelse og teststyrke. AMOS er en annen tilleggspakke, som er velegnet til arbeid med strukturelle likningsmodeller, herunder konfirmerende faktoranalyse.
SPSS Statistics - Overview - Norway | IBM 

STATA
STATA – Data Analysis and Statistical Software er et veldokumentert program som har egen syntax for kommandoer og som i tillegg har noen pek-og-klikk funksjoner. Syntaxen til STATA er mer brukervennlig og effektiv sammenlignet med andre statistikkprogrammer. Programmet byr på flere muligheter enn SPSS og åpner opp for mer avansert statistikk; bl.a. har STATA muligheter for robuste metoder, inkl. robuste regresjonsmodeller og robuste standardfeil. Man kan også installere brukerutviklede programtillegg. Helse Vest tilbyr STATA i sin programvareportefølje med et begrenset antall lisenser. Lisensene kan utvides ved behov. Send mail til kkf@helse-vest.no for å søke om tilgang til STATA.

R og RStudio
R er et gratis, åpen kildekode-, kommandolinjeprogram som har et omfattende utvalg pakker med metoder for å visualisere og analysere ulike typer datasett. I likhet med STATA byr den på flere muligheter enn SPSS og egner seg derfor til mer avansert statistikk. Særlig nye statistiske metoder er tidlig tilgjengelig til R. Ulike brukerutviklede programpakker må lastes ned og installeres lokalt. Generelt er R basert på å skrive kommandoer og har dermed en brattere læringskurve enn SPSS.
RStudio kjører R i et mer brukervennlig oppsett.

For bioinformatikk, og for dataanalyse av genomiske data, transkriptomikk, proteomikk og andre større datasett, finnes det mange etablerte programpakker med gode tutorials innenfor Bioconductor og CRAN.

MatLab
MatLab brukes som regel til (ikke-statistisk) matematikk, og har gode funksjoner for matriseregning. I tillegg er MATLAB et bra alternativ for bildebehandling. Programmet er tilgjengelig i programvareporteføljen for ansatte ved Stavanger Universitetssjukehus, men det krever en lisens som må kjøpes for hver enkelt bruker. I tillegg må flere av tilgjengelige pakker kjøpes utenom.
http://se.mathworks.com/products/matlab/

Python
Python er et gratis programmeringsspråk. På SUS er det tilgjengelig sammen med Anaconda som forenkler programmeringen (tilsvarende Rstudio for R). Python er ikke et statistikkprogram, men brukes til tyngre analyser i for eksempel genetiske analyser, kunstig intelligens, bildeanalyse, eller til å lage egne programmer eller apper. Flere moduler/biblioteker med programvare er tilgjengelig for spesifikke bruksområder. Programmet er gratis men krever programmeringskunnskap. Mange gode dataanalysepakker f.eks Bioconda tilgjengelig.
https://www.python.org/

Andre Programmer
Det finnes flere andre programmer egnet til statistiske analyser enn de nevnt ovenfor. Statistica er lett å bruke og har visuelt flotte grafer. EpiData er en gratis tilgjengelig database fra WHO over folkehelse, epidemiologi og medisin fra hele verden som kan brukes til kliniske og epidemiologiske studier. EPI Info er laget for å utforme spørreskjema, lage databaser og utføre enkel statistisk analyse tilpasset epidemiologiske studier. S-Plus har et liknende programmeringsspråk som R, men har ikke en åpen kildekode og er ikke tilgjengelig i programvareporteføljen til Helse Vest.

Enkelte programmer er kun tilgjengelige ved Helse Bergen, deriblant SAS, Maple, MedCalc, SigmaPlot, Graphpad Prism og StatXact. Ved Helse Stavanger er det mulig å søke om tilgang til disse programmene via Helse Stavanger IKT. SAS, Maple, MedCalc og StatXact er veldokumenterte programmer for å utføre statistikk. SAS er et kommandolinjeprogram med en bratt læringskurve, men er velegnet for avansert statistikk og er det beste alternative for ekstremt store datasett. Maple kan også utføre mer avansert statistikk og er best på symbolsk algebra. MedCalc er designet for biomedisinsk forskning og er svært brukervennlig. Det er regnet for å være det enkleste programmet til å utføre ROC (Receiver Operating Characteristics) analyser. StatXact har etablert en nisje ved å tilby mange eksakte tester og metoder med svært effektive beregningsmåter. For å produsere figurer og grafer kan man ta i bruk Sigmaplot (for Windows) eller Graphpad Prism.

SAS: http://www.sas.com/en_us/software/analytics/stat.html
S-Plus (S+): http://www.solutionmetrics.com.au/products/splus/default.html
Statistica: https://docs.tibco.com/products/tibco-statistica-14-0-0
Maple: http://www.maplesoft.com/index.aspx
MedCalc: https://www.medcalc.org/
EpiData: https://www.epidata.dk/
EPI Info: https://www.cdc.gov/epiinfo/index.html 
Sigmaplot: https://alfasoft.com/no/produkter/statistikk-og-analyse/sigmaplot.html
GraphPad Prism: http://www.graphpad.com/scientific-software/prism/
StatXact: http://www.cytel.com/software-solutions/statxact

Hvilket program bør jeg velge?
For å bestemme hvilket statistikkprogram som er aktuelt for en studie, bør man ta i betraktning alle egenskapene til programmet. Nedenfor er det en tabell over fordelene og ulempene til hvert enkelt statistikkprogram (slik vi ser det). 
​Program ​​Fordeler​Ulemper​Tilgjengelighet
​SPSS​Lett å lære og lett å bearbeide datasett​Få robuste metoder. Begrenset fleksibilitet og kvalitet i grafiske fremstillinger. Begrenset utvalg av mer avanserte metoder. 
​Helse Vest​
​STATA​Robuste metoder, brukervennlig ​ ​​Helse Vest
​R​Åpen kildekode. Nesten ubegrenset antall tilgjengelige statistiske analyser. Gratis. Gode programmer for analyse av gen- og genekspresjonsdata og andre store datasett. 
​Bratt læringskurve. Varierende kvalitet på dokumentasjon. Problematisk med veldig store datasett.​​Helse Vest
​MatLab​Matriseregning, matematikk, bildebehandling, maskinlæring.
​Dårlig på generell statistikk. Dyrt​. 
​Helse Bergen og Helse Stavanger. Lisenser må tilegnes for hver enkelt bruker​.
​Python
​Kunstig intelligens, lage egne små programmer eller apper, god til veldig store datasett, "Data Science".
​Bratt læringskurve. Litt færre statistikkprogrampakker enn R.
​Helse Vest
​Statistica​Flotte grafer, lett å bruke ​Relativt dyrt​ ​Helse Vest​


​​Oversikt over hvilke analyser som er tilgjengelige i SPSS, STATA, R, MatLab og SAS: http://www.stanfordphd.com/Statistical_Software.html


Ressurser på web
Flere nettsider ​inneholder relevant litteratur og guider til enkelte statistikkprogrammer, eller har verktøy som er nyttig når en utfører statistikk.

Publikasjoner

  • Medical statistics series in Critical Care
    ​Critical Care har publisert en serie om medisinsk statistikk.
    http://www.ccforum.com/series/CC_Medical
  • Statistical notes in BMJ
    BMJ har opprettet en nettside med artikler som omhandler statistiske metoder.
    http://www.bmj.com/specialties/statistics-notes
  • ​"Statistics at Square One." BMJ har også publisert en statistisk fagbok, «Statistics at Square One», som er gratis tilgjengelig fra nettsiden deres. Boka omfatter alt fra de enkleste tester til mer avansert statistikk. Swinscow, T D V. (1997). Statistics at Square One. 9th Edn. BMJ Publishing Group. https://thebmj-frontend.bmj.com/about-bmj/resources-readers/publications/statistics-square-one/1-data-display-and-summary  
  • ​The Little Handbook of Statistical Practice
    «The Little Handbook of Statistical Practice» av Gerard E. Dallal, omfatter alt fra de enkleste tester til mer avansert statistikk.
    Dallal, Gerard E. (2012). The Little Handbook of Statistical Practice. Boston: Tufts University.
    http://www.jerrydallal.com/LHSP/LHSP.HTM

Hjelpemidler for statistiske programmer

  • ​UCLA. Institute for Digital Research and Education (IDRE) har satt opp en webside med opplæring og eksempler til flere statistikkprogrammer, inkl. SPSS, STATA, R og SAS.
    http://www.ats.ucla.edu/stat/
  • CrossValidated
    ​StackExchange har en egen avdeling, CrossValidated, hvor brukere kan legge ut spørsmål om statistikk og bruk av statistikkprogrammer. Det er også mulig å delta i felleskapet på siden ved å besvare andres spørsmål.
    http://stats.stackexchange.com/
  • SPSS Tutorials
    SPSS Tutorials er en oversiktlig nettside for å komme i gang med SPSS, eller for å lære mer om enkelte metoder innenfor programmet.
    http://www.spss-tutorials.com/basics/
  • Quick-R
    ​Et godt hjelpemiddel når en arbeider med R er Quick-R. Nettsiden går gjennom enkelte analyser steg-for-steg, og har en søke-funksjon for å finne metoden man er interessert i.
    http://www.statmethods.net/

Verktøy for statistikk

  • VassarStats
    VassarStats er en nettside med funksjoner for statistiske utregninger. Nettsiden inneholder ulike kalkulatorer og verktøy for randomisering, transformering og annet.
    http://vassarstats.net/
  • StatPages
    StatPages er en samleside for en rekke nyttige programmer til statistisk analyse som kan lastes ned gratis eller kjøres via web. En finner f.eks. programmer for beregning av styrke og utvalgsstørrelse for en rekke standard hypoteser.
    http://statpages.org/


 


 

Fant du det du lette etter?