Kagglethon

28 februari 2020

De Datascientists van Vitens en die van andere drinkwaterbedrijven spreken zo nu en dan af om van elkaar te leren en elkaar te inspireren. Een nieuw hoogtepunt hierin is dat ze bij elkaar zijn gekomen voor een Hackathon getiteld Kagglethon, waarbij de naam is geïnspireerd door de Machine Learning-competitiewebsite https://www.kaggle.com. Hierbij was het de opdracht om het watergebruik per vijf minuten zo goed mogelijk te voorspellen.

Wat maakt deze activiteit zo interessant en innovatief?
Het onderwerp van de Hackathon was niet het belangrijkste, de techniek wel. Voorspellen zelf is leuk, maar een rechte lijn door gegeven datapunten trekken kan bijna iedereen: het wordt pas interessant als we op een gestructureerde manier testen en controleren hoe goed onze voorspellingen zijn, op een testset die we niet hebben gebruikt bij het trainen van het model. Zo kunnen we niet alleen vaststellen of ons algoritme goed is, maar ook algoritmes met elkaar vergelijken. Of zelfs automatisch honderden net verschillende algoritmes maken en op basis van de testscores de beste uitkiezen. Dat is ook de kant die we opgaan. Als we Vitens (meer) data-gestuurd willen maken, moeten we zorgen dat algoritmes betrouwbaar en bewezen zijn en bij voorkeur ook een waarde hebben die het betrouwbaarheidsinterval aangeeft. Zo raken we samen in de stroomversnelling.
Meer weten? Stuur gerust een email naar Sjoerd Boersma (Sjoerd.Boersma@vitens.nl)

Gerelateerde artikelen

Kwartaal Kennisdeling Datascience

Kwartaal Kennisdeling Datascience

Data. Mogelijk denk je hierbij alleen aan wat cijfertjes, maar een groot deel van Vitens’ processen en werkzaamheden zijn op data gebaseerd én hierdoor verbeterd. Vanuit het Vitens Datascience team informeren we je graag over de belangrijke dataprojecten die er binnen...

Lees meer