Statistisk veiledning

Statistisk analyse er et viktig redskap i medisinsk forskning. Det brukes til å gi beslutningsstøtte basert på datasett. Kunnskap om og forståelse av databearbeiding bør være tilstede i både planleggingen, gjennomføringen og sluttarbeidet av studien.

​Biostatistikere ved SUS

Ingvild Dalen
E-post: ingvild.dalen@sus.no

Jörn Schulz
E-post: jorn.schulz@sus.no

Bjørn Henrik Auestad
E-post: bjorn.auestad@uis.no

Jan Terje Kvaløy
E-post​​: jan.t.kvaloy@uis.no


Veiledningstjenesten i statistikk og metode retter seg mot dem som driver forskningsarbeid ved SUS. Hovedregel for avtale om statistisk rådgivning er å sende prosjektbeskrivelse samt beskrivelse av hva det søkes veiledning om. Hjelp til selvhjelp er generelt et viktig mål, slik at forskerne selv lærer de metodene som brukes.

Merk at det tilbys innføringskurs i statistikk ved SUS.  Det også finnes gode kurs i Bergen og i Oslo. Når det gjelder tips til installasjon og bruk av SPSS så henviser vi til undersider av denne hjemmesiden og litteratur om SPSS.

Helse-Vest har også et regionalt kompetansesenter​ lokalisert ved Haukeland Universitetssjukehus som tilbyr rådgivning i forsøksplanlegging, datainnsamling, databearbeiding og statistisk analyse. Tilbudet gjelder alle forskere i helseforetak i Helse Vest, men forskere i Helse Stavanger kan fortrinnsvis kontakte Ingvild ​Dalen​ ved SUS.​

Biostatistikerne ved SUS befinner seg i​ Forskertua ​ (gamle Maurtua barnehage).

Statistikkressurser

Statistikkressurser anbefalt av biostatistikerne ved SUS

Det finnes en mengde litteratur, programvarer og nettsider som er gode hjelpemidler til å utføre statistisk analyse av medisinske data.

​​​​​Statistisk litteratur
​Et stort utvalg lesestoff relatert til statistikk er tilgjengelig på markedet. Flere fagbøker egner seg som introduksjon til faget og som fordypning i enkelte emner. I tillegg byr markedet på guider og lærebøker for programvare for statistisk analyse. 

Generell medisinsk statistikk (og epidemiologi):

  • Veierød, Marit B., Lydersen, Stian og Laake, Petter. (2012) Medical Statistics in Clinical and Epidemiological Research. Oslo: Gyldendal akademisk.
  • Aalen, Odd O., Frigessi, Arnoldo, Moger, Tron A, Scheel, Ida, Skovlund, Eva og Veierød, Marit B. (2006) Statistiske metoder i medisin og helsefag. Oslo: Gyldendal akademisk.
  • Altman, Douglas G. (1991) Practical statistics for medical research. London: Chapmann & Hall.
  • Whitlock, Michael and Schluter, Dolph (2009) The Analysis of Biological Data. Colorado: Roberts and Company Pu​blishers.
  • Magnus, Per og Bakketeig, Leiv S. (2013) Epidemiologi. 4. Utg. Oslo: Gyldendal akademisk.

Spesialiserte emner:

  • Pocock, Stuart J. (1983) Clinical Trials. A Practical Approach. New York: Wiley. 
  • Hosmer, David W., Jr., Lemeshow, Stanley and Sturdivant, Rodney X. (2013) Applied Logistic Regression. 3rd Edn. New York: Wiley.
  • Hosmer, David W., Jr., Lemeshow, Stanley and May, Susanne (2008) Applied Survival Analysis: Regression Modeling of Time to Event Data. 2nd Edn. New York: Wiley.

Fordypning i statistikkprogramme​​r:

  • Pallant, Julie (2013) SPSS Survival Manual. 5th Edn. New York: Open University Press.
  • Field, Andy (2013) Discovering Statistics using IBM SPSS Statistics. 4th Edn. SAGE Publications Ltd.
  • Matloff, Norman (2011) The Art of R Programming. California: No Starch Press, Inc.  ​

Programvare ​
Helse Vest har lisens på flere typer programvare for lagring og bearbeiding av innsamlede data. Hvilke programmer som bør benyttes vil til dels være avhengig av personlig preferanse og av studiens karakter. Biostatistikerne ved SUS har utstrakt erfaring med programmene SPSS, STATA og R, samt kjennskap til SAS og MatLab.

SP​SS
IBM SPSS Statistics programpakken er brukervennlig og har god kvalitet med egnede manualer. Ved å kontakte Helse Vest IKT brukerstøtte gis det tilgang til alle programmene i statistikkpakken SPSS uten ekstra kostnad. Kurskatalogen til Helse Vest tilbyr et introduksjonskurs i SPSS. SPSS har et intuitivt grensesnitt med pek-og-klikk funksjoner og hurtigmenyer med kommandoene man ønsker å utføre. I tillegg er det mulig å få kommandoene i programmet som såkalt syntax, slik at de kan lagres og gjentas senere.

Ekstrapakken SamplePower kan brukes til å finne nødvendig utvalgsstørrelse og teststyrke. AMOS er en annen tilleggspakke, som er velegnet til arbeid med strukturelle likningsmodeller, herunder konfirmerende faktoranalyse.


STATA
STATA – Data Analysis and Statistical Software er et veldokumentert program som har egen syntax for kommandoer og som i tillegg har noen pek-og-klikk funksjoner. Syntaxen til STATA er mer brukervennlig og effektiv sammenlignet med andre statistikkprogrammer. Programmet byr på flere muligheter enn SPSS og åpner opp for mer avansert statistikk; bl.a. har STATA muligheter for robuste metoder, inkl. robuste regresjonsmodeller og robuste standardfeil. Man kan også installere brukerutviklede programtillegg. Helse Vest tilbyr STATA i sin programvareportefølje med et begrenset antall lisenser. Lisensene kan utvides ved behov. Send mail til kkf@helse-vest.no for å søke om tilgang til STATA.

http://www.stata.com/

R og RStudio
​R er et gratis, åpen kildekode-, kommandolinjeprogram som har et omfattende utvalg pakker rettet mot å optimalisere statistikken til ulike typer datasett. I likhet med STATA byr den på flere muligheter enn SPSS og egner seg derfor til mer avansert statistikk. Særlig nye statistiske metoder er tidlig tilgjengelig til R. Ulike brukerutviklede programpakker må lastes ned og installeres lokalt. Generelt bruker R et lite intuitivt språk med en bratt læringskurve og er dermed dårlig egnet for nybegynnere. I tillegg kan det være utfordrende å forholde seg til de ulike pakkene med sine mer eller mindre velskrevne manualer. RStudio kjører R i et mer brukervennlig oppsett.

​R: https://www.r-project.org  
RStudio: https://www.rstudio.com/products/rstudio

MatLab
MatLab brukes som regel til (ikke-statistisk) matematikk, og har gode funksjoner for matriseregning. I tillegg er MATLAB et bra alternativ for bildebehandling.Programmet er tilgjengelig i programvareporteføljen for ansatte ved Stavanger Universitetssjukehus, men det krever en lisens som må kjøpes for hver enkelt bruker. I tillegg må flere av tilgjengelige pakker kjøpes utenom.
http://se.mathworks.com/products/matlab/

Andre Programmer
Det finnes flere andre programmer egnet til statistiske analyser enn de nevnt ovenfor. Statistica er lett å bruke og har visuelt flotte grafer. EpiData er en gratis tilgjengelig database fra WHO over folkehelse, epidemiologi og medisin fra hele verden som kan brukes til kliniske og epidemiologiske studier. EPI Info er laget for å utforme spørreskjema, lage databaser og utføre enkel statistisk analyse tilpasset epidemiologiske studier. S-Plus har et liknende programmeringsspråk som R, men har ikke en åpen kildekode og er ikke tilgjengelig i programvareporteføljen til Helse Vest.

Enkelte programmer er kun tilgjengelige ved Helse Bergen, deriblant SAS, Maple, MedCalc, SigmaPlot, Graphpad Prism og StatXact. Ved Helse Stavanger er det mulig å søke om tilgang til disse programmene via Helse Stavanger IKT. SAS, Maple, MedCalc og StatXact er veldokumenterte programmer for å utføre statistikk. SAS er et kommandolinjeprogram med en bratt læringskurve, men er velegnet for avansert statistikk og er det beste alternative for ekstremt store datasett. Maple kan også utføre mer avansert statistikk og er best på symbolsk algebra. MedCalc er designet for biomedisinsk forskning og er svært brukervennlig. Det er regnet for å være det enkleste programmet til å utføre receiver operating characteristics (ROC) analyser. StatXact har etablert en nisje ved å tilby mange eksakte tester og metoder med svært effektive beregningsmåter.  For å produsere figurer og grafer kan man ta i bruk Sigmaplot (for Windows) eller Graphpad Prism.


​SAS: http://www.sas.com/en_us/software/analytics/stat.html
S-Plus (S+): http://www.solutionmetrics.com.au/products/splus/default.html  
Statistica: http://www.statsoft.com/Products/STATISTICA/Product-Index
Maple: http://www.maplesoft.com/index.aspx
MedCalc: https://www.medcalc.org/
EpiData: http://www.who.int/chp/steps/resources/EpiData/en/
EPI Info: http://www.who.int/chp/steps/resources/EpiInfo/en
Sigmaplot: http://www.sigmaplot.com/products/sigmaplot/sigmaplot-details.php
GraphPad Prism: http://www.graphpad.com/scientific-software/prism/
StatXact: http://www.cytel.com/software-solutions/statxact
​ ​

Hvilket program bør jeg velge

​​ For å bestemme hvilket statistikkprogram som er aktuelt for en studie, bør man ta i betraktning alle egenskapene til programmet. Nedenfor er det en tabell over fordelene og ulempene til hvert enkelt statistikkprogram (slik vi ser det). ​​

​Program ​​Fordeler​Ulemper​Tilgjengelighet
​SPSS​Lett å lære og lett å bearbeide datasett​Få robuste metoder ​Helse Vest​
​STATA​Robuste metoder, brukervennlig ​ ​​Helse Vest, men begrenset antall lisenser. Send epost til kkf@helse-vest.no
​R​Åpen kildekode. Nesten ubegrenset antall tilgjengelige statistiske analyser. Gratis ​Bratt læringskurve. Varierende kvalitet på dokumentasjon. Problematisk med veldig store datasett.​​Helse Vest
​MatLab​Matriseregning, matematikk, bildebehandling ​Dårlig på generell statistikk. Dyrt​ ​Helse Bergen og Helse Stavanger. Lisenser må tilegnes for hver enkelt bruker​
​Statistica​Flotte grafer, lett å bruke ​Relativt dyrt​ ​Helse Vest​


​​Oversikt over hvilke analyser som er tilgjengelige i SPSS, STATA, R, MatLab og SAS: http://www.stanfordphd.com/Statistical_Software.html


Ressurser på web
Flere nettsider ​inneholder relevant litteratur og guider til enkelte statistikkprogrammer, eller har verktøy som er nyttig når en utfører statistikk.

Publikasjoner

Hjelpemidler for statistiske programmer

  • ​UCLA
    Institute for Digital Research and Education (IDRE) har satt opp en webside med opplæring og eksempler til flere statistikkprogrammer, inkl. SPSS, STATA, R og SAS.
    http://www.ats.ucla.edu/stat/
  • CrossValidated
    ​StackExchange har en egen avdeling, CrossValidated, hvor brukere kan legge ut spørsmål om statistikk og bruk av statistikkprogrammer. Det er også mulig å delta i felleskapet på siden ved å besvare andres spørsmål.
    http://stats.stackexchange.com/
  • SPSS Tutorials
    SPSS Tutorials er en oversiktlig nettside for å komme i gang med SPSS, eller for å lære mer om enkelte metoder innenfor programmet.
    http://www.spss-tutorials.com/basics/
  • Quick-R
    ​Et godt hjelpemiddel når en arbeider med R er Quick-R. Nettsiden går gjennom enkelte analyser steg-for-steg, og har en søke-funksjon for å finne metoden man er interessert i.
    http://www.statmethods.net/

Verktøy for statistikk

  • VassarStats
    VassarStats er en nettside med funksjoner for statistiske utregninger. Nettsiden inneholder ulike kalkulatorer og verktøy for randomisering, transformering og annet.
    http://vassarstats.net/
  • StatPages
    StatPages er en samleside for en rekke nyttige programmer til statistisk analyse som kan lastes ned gratis eller kjøres via web. En finner f.eks. programmer for beregning av styrke og utvalgsstørrelse for en rekke standard hypoteser.
    http://statpages.org/