Het voorspellen van graafschade

6 maart 2020

Wat is graafschade?
Graafschade ontstaat wanneer er werkzaamheden worden gedaan rondom waterleidingen. Deze werkzaamheden worden gedaan door aannemers. De aannemers stellen voor elke opdracht een document op waarin hun naam, bedrijfsnaam en omschrijving van de opdracht in staat.

De Business en Data Science
De Business heeft het Data Science team gevraagd of wij iets kunnen doen met de graafschade data. Martine Wester, Data Scientist heeft de data bekeken en kwam tot de conclusie dat we mogelijk vooraf kunnen voorspellen of er graafschade gaat optreden. Om haar hypothese te testen heeft ze data gebruikt dat bestond uit tekst. De tekst heeft ze omgezet naar data die een computer kan begrijpen. De nieuwe data heeft ze gebruikt met Machine Learning algoritmen zoals Kmeans en Random Forest[1].

Haar hypothese bleek te kloppen: met enige zekerheid kan vooraf worden voorspeld of graafschade gaat optreden. Een neveneffect is dat de data nu ook inzicht geeft in hoe vaak een aannemer graafschade veroorzaakt, hetgeen voorheen nog niet bekend was.

Het resultaat
De Business kan nu vooraf, met enige zekerheid, inzicht verkrijgen of een opdracht van een aannemer graafschade gaat veroorzaken. De Business kan dit doen via het Vitens Data Science Dashboard zoals hieronder te zien is in figuur 1.

[1] Een Random Forest kan gebruikt worden voor classificatie. Het bestaat uit een aantal Decision Trees. Een Decision Tree kan bij elk stuk data een beslissing maken die uiteindelijk leidt tot de juist classificatie. Een ensemble van decision trees heet een Random Forest.

Een enkele opdracht of een bestand met meerdere opdrachten kan ingezonden worden. Het resultaat voor een enkele opdracht is te zien in figuur 2.

Figuur 1: Het Vitens Data Science Dashboard waar het graafschade project in te vinden is. Het Dashboard bevindt zich nog in de ontwikkelingsfase.

Figuur 2: Het resultaat voor een medewerker van een aannemers bedrijf voor een specifieke bestaande opdracht.
De naam van het persoon en bedrijf zijn verwijderd vanwege privacy.

Contact opnemen?

Thema-ambassadeur Eelco Trietsch is bereikbaar via Eelco.Trietsch@vitens.nl

Gerelateerde artikelen

Kwartaal Kennisdeling Datascience

Kwartaal Kennisdeling Datascience

Data. Mogelijk denk je hierbij alleen aan wat cijfertjes, maar een groot deel van Vitens’ processen en werkzaamheden zijn op data gebaseerd én hierdoor verbeterd. Vanuit het Vitens Datascience team informeren we je graag over de belangrijke dataprojecten die er binnen...

Lees meer