26 februari 2021

Data in de zorg deel 1: dit zijn de verschillen tussen traditioneel statistiek en Data Science!

Er wordt ontzettend veel data verzameld in de zorg. Met statistiek en machine learning kun je als data scientist deze data analyseren en zo bestuurders en zorgverleners ondersteunen in het leveren van kwalitatieve zorg.

Vroeger werd deze data vaak geanalyseerd door traditioneel statistische onderzoekers, maar de data scientist wordt steeds belangrijker in de zorg. In eerste instantie lijken ze misschien niet erg op elkaar, maar traditionele onderzoekers en data scientists hebben meer overeenkomsten dan je in eerste instantie zou denken.

In deze tweeluik gaan wij in op de verschillen tussen traditioneel onderzoek en Data Science, hoe zij zich tot elkaar verhouden en wat ze van elkaar kunnen leren. Vandaag lees jij alles over de verschillen tussen traditioneel statistiek en Data Science in de zorg.

De wortels van Data Science liggen in de statistiek

Zoals gezegd zijn er verschillende essentiële overeenkomsten tussen data scientists en onderzoekers binnen de zorg. De wortels van data science liggen in de statistiek, wat ook heel belangrijk is voor onderzoekers in de zorg.

Daarnaast maken ze beiden voornamelijk gebruik van kwantitatieve data voor hun onderzoek en modellen. Dit laat dan ook zien dat de bouwstenen van data science en traditioneel onderzoek hetzelfde zijn.

Huh, wat doen die gorilla’s hier? Lees hier waarom wij bestaan.

De verschillen in statistisch onderzoek en data science in de zorg

Laten we eens kijken naar de verschillen in doel, succes, modellen en data.

Bij traditioneel statistisch onderzoek in de zorg wordt met name nadruk gelegd op het identificeren van effecten en causale verbanden. De onderzoekers willen begrijpen hoe bepaalde kenmerken zich tot elkaar verhouden en hoe precies ze werken. Dit kan leiden tot de volgende onderzoeksvraag:

“Waarom verblijven bepaalde patiënten langer in een kliniek dan andere?”.

Vervolgens wordt er een hypothese opgesteld en worden gecontroleerde experimenten uitgevoerd waaruit data wordt verzameld.

Door gebruik te maken van data en statistische modellen hoopt de onderzoeker deze vraag zo goed mogelijk te kunnen beantwoorden. Er wordt vooral gebruik gemaakt van regressiemodellen, die een kleiner aantal parameters hebben waardoor deze beter te interpreteren zijn.

Om de samenhang tussen kenmerken te begrijpen is een model met relatief weinig parameters erg belangrijk. De data die hiervoor wordt gebruikt wordt vaak specifiek verzameld voor het oplossen van het probleem. Vaak wordt er dan ook van uit gegaan dat de data representatief is voor de populatie waardoor de uitkomsten van deze modellen ook gelden buiten het onderzoek.

	Traditioneel statistisch onderzoek	Data Science
Doel	Begrijpen	Voorspellen & classificeren
Succes	Interpreteerbaarheid	Accuraatheid
Model complexiteit	Lager (minder parameters)	Hoog (veel parameters)
Data	Sample specifiek voor onderzoek	Observationeel

Maar waarin verschilt deze traditioneel statistische aanpak nu eigenlijk met data science?

Hoewel het onderzoek naar effecten en verbanden ook onderdeel kan zijn van het werk van een data scientist, focust deze zich voornamelijk op het ontwikkelen van modellen om bepaalde gebeurtenissen te voorspellen of te classificeren.

De verschillen in onderzoeksvragen met een zelfde data onderwerp

Wanneer we naar hetzelfde onderwerp kijken zal een data scientist uitkomen bij een andere onderzoeksvraag:

“Hoe kunnen we op een zo accuraat mogelijke manier voorspellen hoelang een patiënt in een kliniek zal liggen?”.

Vaak is het enige wat een data scientist nastreeft dat zijn of haar voorspelling of classificatie correct en betrouwbaar is. Het begrijpen waarom een model tot een bepaalde voorspelling of classificatie leidt is vaak minder belangrijk. Hierdoor is in data science de complexiteit van het model minder een probleem.

Dit zorgt ervoor dat een data scientist vaker gebruik van complexere modellen en algoritmes, zolang de accuraatheid maar toeneemt. Dit gaat echter vaak ten koste van de interpreteerbaarheid van een model.

In tegenstelling tot een traditioneel onderzoeker maakt een data scientist veelvuldig gebruik van observationele data en wordt data van allerlei verschillende bronnen samengevoegd. Vaak weten we dus niet of deze data representatief is.

Om erachter te komen of deze modellen ook werken in de “echte wereld” wordt data achtergehouden tijdens het bouwen van het model. Vervolgens doet het model een voorspelling op deze achtergehouden data waardoor deze kunnen worden vergeleken met de daadwerkelijke waardes.

Download de explainer ‘Alle data van jouw zorgorganisatie in één platform‘

Bij 6Gorillas willen wij de samenwerking bevorderen door het aanbieden van een data science werkplek as a service. Hierbij kunnen traditioneel onderzoekers en data scientists makkelijk en op een veilige manier toegang krijgen tot data op het dataplatform.

Zo kunnen ze samen analyses en modellen maken en nieuwe inzichten creëren om zo de kwaliteit van de zorg te verbeteren. We vertellen je graag meer over het dataplatform in onze explainer.

In de Explainer: ‘Dataplatform as a service’ lees je alles over:

✔ Hoe het dataplatform jouw zorgorganisatie sturing geeft in de bedrijfsvoering
✔ Benut de potentie van BI en Data Science
✔ Klantcases Trubendorffer en MoleMann
✔ Hoe schaalbaarheid, real time en security leidend zijn

De wortels van Data Science liggen in de statistiek

De verschillen in statistisch onderzoek en data science in de zorg

Traditioneel statistisch onderzoek

Data Science

De verschillen in onderzoeksvragen met een zelfde data onderwerp

Download de explainer ‘Alle data van jouw zorgorganisatie in één platform‘