Deel 2: Hoe begrijp ik mijn zorgdata?
De tweede sessie van de 6G masterclass ‘Data Science in de zorg’ stond in het teken van ‘data understanding’, ‘data preparation’ en de voortgangspresentaties van de deelnemers. In deze presentaties gaven de projectgroepen aan hoe ze tot een scherpe afbakeningen van de projectdoelstellingen willen komen. En hoe zij binnen het proces de balans vinden tussen ‘data understanding’ en ‘business understanding’.
De Introductie van Datascience in de zorg
Gedurende de vorige sessie kregen de deelnemers uitleg over de introductie van Data Science. Door de snelle technologische ontwikkelingen is Data Science een reële toepassing met potentie: extra inzichten uit data versterken de expertise en bieden oplossingen die de zorg efficiëntie verhogen en de werkdruk verlagen. De deelnemers van de masterclasses zijn pioniers in hun werkveld die met specifieke projecten de efficiëntie en kwaliteit willen verbeteren in de zorg.
De deelnemers kregen te horen dat Machine Learning (computer algoritmes benutten om autonoom te leren van data) een specifieke toepassing is, gericht op het gebruik van statistiek om te voorspellen/classificeren. Zij kwamen erachter welke onderzoeksvragen wél en niet beantwoord kunnen worden met Machine Learning. Terugval in depressie of valpreventie; wat zijn dan de acties die we daaraan kunnen koppelen? Wat is de voorspelde kans aan de hand van de data per zorginstelling? Dat zijn de vragen waar in de masterclasses continu bij stil wordt gestaan.
Joran Lokkerbol (Data Scientist) en David Tom (6G oprichter) praten je bij over de zorgprojecten
Het spanningsveld tussen business en data understanding
Er is aan het begin van de projecten een wisselwerking gaande tussen de processen ‘business understanding’ en de ‘data understanding’. Potentiële zorgprojecten op waarde schatten wordt gezien als de business understanding. Welke mogelijkheden zijn er met Machine Learning om binnen het project tot juiste classificatie of voorspellingen te komen? Soms is de uitkomst dat een projectvraag bijgeschaafd moet worden om tot een waardevol projectplan te komen. Om daar vervolgens heldere en passende zorgacties aan te kunnen koppelen.
Het doel van data understanding is om inzicht te krijgen in de data die bruikbaar is om te gebruiken in de volgende stappen van het data-analyse proces. De belangrijkste vragen waar de deelnemers mee aan de slag gaan is: hoe vaak komen de casussen voor in de datasets en wat is de kwaliteit van de data. In deze fase wordt de data verkend en input verzameld om de data voor te bereiden om te modeleren. Zo kan het zijn dat bepaalde data niet aanwezig is, het ‘probleem’ niet groot genoeg lijkt of er meer gericht moet worden op subgroepen patiënten of cliënten.
Projectafbakeningen; waar zitten de zorginstellingen in het proces?
De deelnemende zorgorganisaties gaven aan verschillend in het proces te staan. Eén van de projectplannen beslaat het aantal valincidenten in de gehandicaptenzorg voorspellen voor het komend jaar. Op het gebied van data understanding kijken ze hoe ze de waarden uit de clientdossiers, MIC (Melding incident cliënt) meldingen kunnen halen en hoe deze te labelen. De uitdaging zit vooral nog in het ontsluiten van de data.
Lees ook: hulp in ondersteuning van data aanvoer.
Een andere zorginstelling gaf aan vooral nog uitdaging te zien in de ‘ruis’ van de data. Zij willen bij patiënten met een depressie die uit de zorg gaan, voorspellen of er een nieuw traject wordt geopend binnen één jaar. De ‘passende’ actie is om een terugvalpreventie aan te bieden voor patiënten die een hoge kans hebben om terug te vallen. De predictoren die daarvoor worden gebruikt zijn zorgdata zoals DBC, het aantal behandelingen en diagnoses. Ook speelt persoonsgebonden data een belangrijke rol zoals leeftijd, geslacht, maar ook postcodes kunnen nuttige datagegevens opleveren.
Een andere zorgorganisatie gebruikt textmining (analyses waarbij waardevolle informatie uit teksten kan worden gehaald) bij de verslaglegging. Zij kijken of textmining bruikbaar is om te voorspellen welke woorden uit de verslaglegging kunnen bijdragen aan een langere doorlooptijd per client. Het proces zit momenteel in de uitdaging om de teksten juist te interpreteren en te ontsluiten. Zodat aan de hand van de juiste data het hulpverleningstraject aangepast kan worden.
De volgende stappen in het dataproces
Voor de volgende sessies krijgen de deelnemers de taak om te kijken naar de datasets. Dan worden de eerste stappen gezet om de juiste data te herkennen en te gebruiken in de Machine Learning softwaretool. De deelnemende organisaties worden ondersteund om een script op te stellen die hen verder helpt om de data bruikbaar te maken voor het project.
6G masterclasses ‘Datascience in de zorg’
6G verzorgt een tiendelige masterclass ‘Datascience in de zorg’ voor verschillende opdrachtgevers uit de zorg. Datascientist Joran Lokkerbol verkent samen met de zorgorganisaties hoe zij data kunnen inzetten om de effectiviteit van de zorg te vergroten. Mocht je vragen hebben over de inhoud van de masterclasses of over 6G; neem dan contact op.
Handout ‘How to learn machine learning?’
In 6 stappen leer jij Data Science toepassen in jouw zorgorganisatie!
Wil jij aan de slag met data science in jouw organisatie? Aan de hand van het CRISP-DM model laten wij zien hoe je in 6 stappen met data science kunt starten! Als voorbeeld hanteren we hoe Ravian Wettstein en Jeroen Kroesen van ADHDcentraal aan de slag zijn gegaan met hun eigen machine learning project.
De Handout ‘How to learn machine learning?’ bevat de volgende inhoud:
✔ Business & Data understanding
✔ Data Preparation & Modeling
✔ Evaluation & deployment